In [1]:
import pandas as pd
from sklearn.model_selection import train_test_split, StratifiedKFold
import numpy as np
import matplotlib.pyplot as plt
import torch
import torch.nn as nn
import torch.nn.functional as F

# Stratified Train Test Split

In [2]:
# Importing pre-processed dataset
body_performance_df = pd.read_csv('processed_body_performance.csv')

In [3]:
output_dim = body_performance_df['class'].nunique()

In [4]:
# Acquiring target values and attributes
y = body_performance_df['class'].values
y = np.int64(y)
X = body_performance_df.drop(columns=['class']).values
X = np.float32(X)
input_dim = X.shape[1] # NN input dimension = number of attributes

In [5]:
y

array([0, 1, 0, ..., 1, 3, 0], dtype=int64)

In [6]:
# Performing stratified train test split where test set is 30% of dataset
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42, shuffle=True, stratify=y)

# Stratified K-fold Validation Split

In [7]:
# Defining a stratified 5-fold object to be used for cross-validation
strat_k_fold = StratifiedKFold(n_splits=5, random_state=42, shuffle=True)

# Multi-Layered Perceptron (MLP)

In [8]:
class MLP_network(nn.Module):
    def __init__(self, input_dim=input_dim, hidden_dim=10, output_dim=output_dim):
        super(MLP_network, self).__init__()
        self.hidden1 = nn.Linear(input_dim, hidden_dim, bias=True)
        self.hidden2 = nn.Linear(hidden_dim, hidden_dim, bias=True)
        self.output = nn.Linear(hidden_dim, output_dim, bias=True)

    def forward(self, X):
        X = F.relu(self.hidden1(X))
        X = F.relu(self.hidden2(X))
        X = F.softmax(self.output(X), dim=-1) # sigmoid activation function is applied in loss function
        return X

# Hyperparameter Grid Search

In [9]:
from skorch.classifier import NeuralNetClassifier
from sklearn.model_selection import GridSearchCV

In [10]:
torch.manual_seed(0)

net = NeuralNetClassifier(
    MLP_network,
    train_split=None,
    optimizer=torch.optim.SGD,
    optimizer__momentum=0.9 # momentum set to commonly used value to save CPU time
)

In [11]:
parameters = {
    'max_epochs': [10, 20, 30, 40, 50],
    'batch_size': [64, 128, 256], # batch-sizes are powers of 2
    'optimizer__lr': [0.001, 0.01, 0.1], # common values for learning rate
    'optimizer__weight_decay': [0.001, 0.01, 0.1], # common values for weight-decay factor
    'module__hidden_dim': [5, 10, 15, 20] # range of values less than twice the input dimension
}
gs = GridSearchCV(net, parameters, refit=False, cv=5, scoring='accuracy')
gs.fit(X_train, y_train)
print('Best-performing parameters:', gs.best_params_)
print('5-fold CV score:', gs.best_score_)

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.9336[0m  0.1220
      2        [36m1.4029[0m  0.1170
      3        [36m1.3951[0m  0.1190
      4        [36m1.3909[0m  0.1210
      5        [36m1.3888[0m  0.1200
      6        [36m1.3876[0m  0.1190
      7        [36m1.3870[0m  0.1250
      8        [36m1.3867[0m  0.1170
      9        [36m1.3866[0m  0.1300
     10        [36m1.3865[0m  0.1170
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6422[0m  0.1290
      2        [36m1.3916[0m  0.1250
      3        [36m1.3882[0m  0.1160
      4        [36m1.3870[0m  0.1140
      5        [36m1.3866[0m  0.1180
      6        [36m1.3865[0m  0.1230
      7        [36m1.3864[0m  0.1230
      8        [36m1.3864[0m  0.1200
      9        [36m1.3864[0m  0.1210
     10        [36m1.3864[0m  0.1210
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.9784[0m  0.1140
 

      6       11.9568  0.1400
      7       11.9568  0.1410
      8       11.9568  0.1270
      9       11.9568  0.1310
     10       11.9568  0.1310
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4684[0m  0.1220
      2        [36m1.3870[0m  0.1280
      3        [36m1.3870[0m  0.1230
      4        [36m1.3870[0m  0.1140
      5        [36m1.3870[0m  0.1160
      6        [36m1.3870[0m  0.1200
      7        [36m1.3870[0m  0.1170
      8        [36m1.3870[0m  0.1150
      9        [36m1.3870[0m  0.1280
     10        [36m1.3870[0m  0.1300
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4059[0m  0.1190
      2        [36m1.3869[0m  0.1310
      3        1.3869  0.1160
      4        1.3869  0.1260
      5        1.3869  0.1300
      6        1.3869  0.1170
      7        1.3869  0.1230
      8        1.3869  0.1380
      9        1.3869  0.1350
     10        1.3869  0.1270
  epoch    train_loss 

      6        1.3920  0.1220
      7        1.3920  0.1210
      8        1.3920  0.1170
      9        1.3920  0.1230
     10        1.3920  0.1160
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.3978[0m  0.1160
      2        [36m1.3895[0m  0.1240
      3        [36m1.3894[0m  0.1170
      4        [36m1.3894[0m  0.1170
      5        1.3894  0.1170
      6        1.3894  0.1160
      7        1.3894  0.1220
      8        1.3894  0.1140
      9        [36m1.3894[0m  0.1160
     10        1.3894  0.1210
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m4.6504[0m  0.1190
      2        [36m1.4148[0m  0.1217
      3        [36m1.3910[0m  0.1280
      4        1.3913  0.1260
      5        1.3913  0.1240
      6        1.3913  0.1190
      7        1.3913  0.1180
      8        1.3913  0.1320
      9        1.3913  0.1480
     10        1.3913  0.1190
  epoch    train_loss     dur
-------  ------------  -----

      8        [36m1.1433[0m  0.1250
      9        [36m1.1384[0m  0.1300
     10        [36m1.1325[0m  0.1200
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4584[0m  0.1200
      2        [36m1.3787[0m  0.1250
      3        [36m1.3706[0m  0.1230
      4        [36m1.3571[0m  0.1260
      5        [36m1.1746[0m  0.1260
      6        [36m1.0437[0m  0.1180
      7        [36m1.0246[0m  0.1150
      8        [36m1.0004[0m  0.1240
      9        [36m0.9817[0m  0.1180
     10        [36m0.9706[0m  0.1230
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.3976[0m  0.1270
      2        [36m1.3868[0m  0.1330
      3        1.3869  0.1270
      4        1.3869  0.1280
      5        1.3869  0.1270
      6        1.3869  0.1330
      7        1.3869  0.1280
      8        1.3869  0.1190
      9        1.3869  0.1190
     10        1.3869  0.1240
  epoch    train_loss     dur
-------  ------------  --

      5       11.9568  0.1180
      6       11.9568  0.1200
      7       11.9568  0.1230
      8       11.9568  0.1310
      9       11.9568  0.1200
     10       11.9568  0.1230
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9072[0m  0.1210
      2        [36m5.7438[0m  0.1220
      3        [36m1.3899[0m  0.1260
      4        1.3900  0.1240
      5        1.3900  0.1320
      6        1.3900  0.1190
      7        1.3900  0.1260
      8        1.3900  0.1190
      9        1.3900  0.1190
     10        1.3900  0.1290
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9382[0m  0.1240
      2       11.9568  0.1190
      3        [36m9.3312[0m  0.1180
      4        [36m1.3920[0m  0.1180
      5        [36m1.3913[0m  0.1180
      6        [36m1.3913[0m  0.1140
      7        1.3913  0.1160
      8        1.3913  0.1200
      9        1.3913  0.1150
     10        1.3913  0.1180
  epoch    train_loss     du

      2        [36m1.0389[0m  0.1180
      3        [36m0.9888[0m  0.1230
      4        [36m0.9750[0m  0.1340
      5        [36m0.9651[0m  0.1310
      6        0.9710  0.1270
      7        [36m0.9515[0m  0.1210
      8        [36m0.9359[0m  0.1210
      9        [36m0.9317[0m  0.1240
     10        [36m0.9273[0m  0.1170
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.8054[0m  0.1270
      2        [36m1.2627[0m  0.1200
      3        [36m1.1049[0m  0.1160
      4        [36m1.0535[0m  0.1230
      5        [36m1.0195[0m  0.1210
      6        [36m0.9960[0m  0.1200
      7        0.9974  0.1210
      8        [36m0.9842[0m  0.1150
      9        [36m0.9830[0m  0.1150
     10        0.9859  0.1210
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4539[0m  0.1210
      2        [36m1.1255[0m  0.1280
      3        [36m1.0867[0m  0.1170
      4        [36m1.0528[0m  0.1200
      5   

      5        1.3868  0.1530
      6        1.3868  0.1180
      7        1.3868  0.1190
      8        1.3868  0.1270
      9        1.3868  0.1180
     10        1.3868  0.1170
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9272[0m  0.1270
      2       11.9568  0.1360
      3       11.9568  0.1290
      4       11.9568  0.1290
      5       11.9568  0.1320
      6       11.9568  0.1290
      7       11.9568  0.1290
      8       11.9568  0.1440
      9       11.9568  0.1310
     10       11.9568  0.1360
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8967[0m  0.1250
      2       11.9547  0.1290
      3       11.9547  0.1400
      4       11.9547  0.1300
      5       11.9547  0.1340
      6       11.9547  0.1280
      7       11.9547  0.1250
      8       11.9547  0.1390
      9       11.9547  0.1410
     10       11.9547  0.1290
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.

      2        [36m1.1112[0m  0.1250
      3        [36m1.0452[0m  0.1260
      4        [36m0.9979[0m  0.1290
      5        [36m0.9715[0m  0.1200
      6        [36m0.9556[0m  0.1220
      7        [36m0.9494[0m  0.1170
      8        [36m0.9422[0m  0.1280
      9        [36m0.9360[0m  0.1260
     10        [36m0.9297[0m  0.1300
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.6284[0m  0.1260
      2        [36m1.2636[0m  0.1240
      3        [36m1.1148[0m  0.1180
      4        [36m1.1113[0m  0.1170
      5        [36m1.0042[0m  0.1240
      6        [36m0.9991[0m  0.1220
      7        [36m0.9889[0m  0.1220
      8        [36m0.9719[0m  0.1240
      9        [36m0.9508[0m  0.1290
     10        [36m0.9445[0m  0.1270
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4230[0m  0.1260
      2        [36m1.0832[0m  0.1270
      3        [36m1.0205[0m  0.1330
      4        [36m0.

      2        [36m1.3867[0m  0.1240
      3        1.3868  0.1260
      4        1.3868  0.1180
      5        1.3868  0.1200
      6        1.3868  0.1200
      7        1.3868  0.1170
      8        1.3868  0.1310
      9        1.3868  0.1200
     10        1.3868  0.1240
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7379[0m  0.1210
      2        [36m1.3868[0m  0.1190
      3        [36m1.3868[0m  0.1180
      4        1.3868  0.1200
      5        1.3868  0.1310
      6        1.3868  0.1195
      7        1.3868  0.1250
      8        1.3868  0.1210
      9        1.3868  0.1260
     10        1.3868  0.1190
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8933[0m  0.1240
      2        [36m9.5577[0m  0.1220
      3        [36m1.3867[0m  0.1200
      4        1.3868  0.1270
      5        1.3868  0.1260
      6        1.3868  0.1290
      7        1.3868  0.1190
      8        1.3868  0.1230
      9

     13        [36m1.0402[0m  0.1210
     14        [36m1.0397[0m  0.1140
     15        [36m1.0276[0m  0.1190
     16        [36m1.0195[0m  0.1180
     17        [36m1.0195[0m  0.1210
     18        [36m1.0142[0m  0.1170
     19        [36m1.0088[0m  0.1160
     20        [36m1.0013[0m  0.1150
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.8387[0m  0.1170
      2        [36m1.3931[0m  0.1180
      3        [36m1.3892[0m  0.1150
      4        [36m1.3876[0m  0.1120
      5        [36m1.3869[0m  0.1140
      6        [36m1.3866[0m  0.1220
      7        [36m1.3865[0m  0.1250
      8        [36m1.3864[0m  0.1150
      9        [36m1.3864[0m  0.1170
     10        [36m1.3864[0m  0.1160
     11        [36m1.3864[0m  0.1120
     12        [36m1.3863[0m  0.1190
     13        [36m1.3863[0m  0.1190
     14        [36m1.3863[0m  0.1140
     15        1.3863  0.1150
     16        1.3864  0.1260
     17        [36m1.

     15        [36m1.3864[0m  0.1280
     16        [36m1.3864[0m  0.1120
     17        [36m1.3864[0m  0.1210
     18        [36m1.3864[0m  0.1180
     19        [36m1.3864[0m  0.1190
     20        [36m1.3864[0m  0.1170
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.3909[0m  0.1190
      2        [36m1.3886[0m  0.1210
      3        [36m1.3873[0m  0.1210
      4        [36m1.3867[0m  0.1170
      5        [36m1.3865[0m  0.1260
      6        [36m1.3864[0m  0.1130
      7        [36m1.3863[0m  0.1180
      8        [36m1.3857[0m  0.1190
      9        [36m1.3742[0m  0.1150
     10        [36m1.3390[0m  0.1220
     11        [36m1.2752[0m  0.1160
     12        [36m1.1859[0m  0.1210
     13        [36m1.1402[0m  0.1227
     14        [36m1.1147[0m  0.1120
     15        [36m1.0969[0m  0.1140
     16        [36m1.0826[0m  0.1210
     17        [36m1.0650[0m  0.1140
     18        [36m1.0540[0m  0.1130
    

      3        [36m1.3869[0m  0.1280
      4        [36m1.3869[0m  0.1180
      5        [36m1.3869[0m  0.1160
      6        [36m1.3869[0m  0.1150
      7        [36m1.3869[0m  0.1190
      8        [36m1.3869[0m  0.1210
      9        [36m1.3869[0m  0.1190
     10        [36m1.3868[0m  0.1180
     11        [36m1.3868[0m  0.1140
     12        [36m1.3868[0m  0.1150
     13        [36m1.3868[0m  0.1280
     14        [36m1.3868[0m  0.1150
     15        [36m1.3868[0m  0.1220
     16        [36m1.3868[0m  0.1240
     17        [36m1.3868[0m  0.1170
     18        [36m1.3868[0m  0.1140
     19        [36m1.3868[0m  0.1120
     20        [36m1.3868[0m  0.1180
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4047[0m  0.1220
      2        [36m1.3869[0m  0.1150
      3        [36m1.3868[0m  0.1170
      4        [36m1.3868[0m  0.1130
      5        [36m1.3868[0m  0.1160
      6        [36m1.3868[0m  0.1150
    

     18        1.3911  0.1140
     19        1.3911  0.1120
     20        1.3911  0.1160
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.3931[0m  0.1170
      2        [36m1.3911[0m  0.1130
      3        1.3911  0.1130
      4        1.3911  0.1170
      5        1.3911  0.1130
      6        1.3911  0.1160
      7        1.3911  0.1170
      8        1.3911  0.1250
      9        1.3911  0.1190
     10        1.3911  0.1210
     11        1.3911  0.1150
     12        1.3911  0.1220
     13        1.3911  0.1160
     14        1.3911  0.1220
     15        1.3911  0.1180
     16        1.3911  0.1120
     17        1.3911  0.1140
     18        1.3911  0.1210
     19        1.3911  0.1170
     20        1.3911  0.1160
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7958[0m  0.1250
      2       11.9568  0.1200
      3       11.9568  0.1170
      4       11.9568  0.1240
      5       11.9568  0.1170
      6      

     12        1.3905  0.1150
     13        1.3905  0.1190
     14        1.3905  0.1190
     15        1.3905  0.1200
     16        1.3905  0.1250
     17        1.3905  0.1260
     18        1.3905  0.1170
     19        1.3905  0.1120
     20        1.3905  0.1140
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4129[0m  0.1140
      2        [36m1.2768[0m  0.1160
      3        [36m1.1366[0m  0.1160
      4        [36m1.0632[0m  0.1170
      5        [36m1.0244[0m  0.1190
      6        [36m0.9987[0m  0.1180
      7        [36m0.9798[0m  0.1200
      8        [36m0.9687[0m  0.1140
      9        [36m0.9600[0m  0.1350
     10        [36m0.9563[0m  0.1150
     11        [36m0.9550[0m  0.1220
     12        0.9580  0.1170
     13        [36m0.9520[0m  0.1140
     14        [36m0.9398[0m  0.1140
     15        [36m0.9361[0m  0.1190
     16        [36m0.9349[0m  0.1190
     17        [36m0.9252[0m  0.1240
     18        

     17        [36m0.9150[0m  0.1240
     18        0.9153  0.1190
     19        0.9151  0.1130
     20        [36m0.9145[0m  0.1270
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4676[0m  0.1200
      2        [36m1.3291[0m  0.1240
      3        [36m1.2445[0m  0.1200
      4        [36m1.1668[0m  0.1180
      5        [36m1.1285[0m  0.1200
      6        [36m1.1036[0m  0.1150
      7        [36m1.0911[0m  0.1270
      8        [36m1.0847[0m  0.1150
      9        [36m1.0729[0m  0.1330
     10        [36m1.0704[0m  0.1410
     11        [36m1.0652[0m  0.1460
     12        [36m1.0589[0m  0.1330
     13        1.0599  0.1310
     14        1.0598  0.1230
     15        [36m1.0570[0m  0.1180
     16        [36m1.0569[0m  0.1200
     17        [36m1.0558[0m  0.1180
     18        1.0567  0.1150
     19        [36m1.0544[0m  0.1170
     20        [36m1.0514[0m  0.1230
  epoch    train_loss     dur
-------  ----------

     18        1.3869  0.1140
     19        1.3869  0.1200
     20        1.3869  0.1250
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6623[0m  0.1190
      2        [36m1.3868[0m  0.1180
      3        1.3868  0.1170
      4        1.3868  0.1130
      5        1.3868  0.1170
      6        1.3868  0.1150
      7        1.3868  0.1230
      8        1.3868  0.1170
      9        1.3868  0.1180
     10        1.3868  0.1170
     11        1.3868  0.1180
     12        1.3868  0.1190
     13        1.3868  0.1140
     14        1.3868  0.1200
     15        1.3868  0.1160
     16        1.3868  0.1150
     17        1.3868  0.1170
     18        1.3868  0.1220
     19        1.3868  0.1190
     20        1.3868  0.1170
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5471[0m  0.1210
      2        [36m1.3868[0m  0.1150
      3        [36m1.3868[0m  0.1150
      4        1.3868  0.1160
      5        1.3868  0.

      8        1.3911  0.1190
      9        1.3911  0.1310
     10        1.3911  0.1250
     11        1.3911  0.1170
     12        1.3911  0.1200
     13        1.3911  0.1220
     14        1.3911  0.1180
     15        1.3911  0.1140
     16        1.3911  0.1210
     17        1.3911  0.1230
     18        1.3911  0.1190
     19        1.3911  0.1220
     20        1.3911  0.1150
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8901[0m  0.1220
      2       11.9568  0.1230
      3       11.9568  0.1190
      4       11.9568  0.1200
      5       11.9568  0.1260
      6       11.9568  0.1170
      7       11.9568  0.1250
      8       11.9568  0.1250
      9       11.9568  0.1290
     10       11.9568  0.1230
     11       11.9568  0.1190
     12        [36m9.3937[0m  0.1230
     13        [36m1.3913[0m  0.1260
     14        [36m1.3911[0m  0.1280
     15        [36m1.3911[0m  0.1200
     16        1.3911  0.1240
     17        1.3911  0.

      4        [36m1.3928[0m  0.1220
      5        [36m1.3905[0m  0.1160
      6        1.3905  0.1210
      7        1.3905  0.1170
      8        1.3905  0.1190
      9        1.3905  0.1180
     10        1.3905  0.1180
     11        1.3905  0.1270
     12        1.3905  0.1210
     13        1.3905  0.1250
     14        1.3905  0.1180
     15        1.3905  0.1260
     16        1.3905  0.1210
     17        1.3905  0.1240
     18        1.3905  0.1250
     19        1.3905  0.1210
     20        1.3905  0.1270
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.3835[0m  0.1170
      2        [36m1.1666[0m  0.1190
      3        [36m1.0655[0m  0.1220
      4        [36m1.0155[0m  0.1150
      5        [36m0.9858[0m  0.1190
      6        [36m0.9713[0m  0.1240
      7        [36m0.9630[0m  0.1290
      8        [36m0.9468[0m  0.1270
      9        [36m0.9421[0m  0.1260
     10        [36m0.9384[0m  0.1220
     11        [36m0.

     11        [36m0.9415[0m  0.1180
     12        [36m0.9383[0m  0.1190
     13        [36m0.9353[0m  0.1230
     14        [36m0.9282[0m  0.1220
     15        0.9287  0.1210
     16        [36m0.9254[0m  0.1190
     17        [36m0.9234[0m  0.1140
     18        [36m0.9227[0m  0.1150
     19        0.9233  0.1180
     20        [36m0.9216[0m  0.1160
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5335[0m  0.1200
      2        [36m1.1097[0m  0.1160
      3        [36m1.0368[0m  0.1210
      4        [36m1.0179[0m  0.1250
      5        [36m0.9887[0m  0.1190
      6        0.9890  0.1190
      7        [36m0.9792[0m  0.1210
      8        [36m0.9760[0m  0.1170
      9        0.9768  0.1340
     10        0.9763  0.1300
     11        [36m0.9734[0m  0.1310
     12        0.9740  0.1240
     13        [36m0.9726[0m  0.1270
     14        [36m0.9721[0m  0.1240
     15        0.9726  0.1240
     16        [36m0.9708[

      7       11.9547  0.1160
      8       11.9547  0.1230
      9        [36m7.9345[0m  0.1250
     10        [36m1.3871[0m  0.1160
     11        [36m1.3869[0m  0.1150
     12        [36m1.3869[0m  0.1260
     13        [36m1.3869[0m  0.1230
     14        [36m1.3869[0m  0.1190
     15        [36m1.3869[0m  0.1210
     16        [36m1.3869[0m  0.1190
     17        [36m1.3869[0m  0.1240
     18        [36m1.3869[0m  0.1180
     19        [36m1.3869[0m  0.1180
     20        [36m1.3869[0m  0.1190
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4552[0m  0.1200
      2        [36m1.3868[0m  0.1260
      3        1.3868  0.1150
      4        1.3868  0.1150
      5        1.3868  0.1200
      6        1.3868  0.1150
      7        1.3868  0.1230
      8        1.3868  0.1200
      9        1.3868  0.1170
     10        1.3868  0.1150
     11        1.3868  0.1180
     12        1.3868  0.1230
     13        1.3868  0.1190
    

     17       11.9589  0.1330
     18       11.9589  0.1280
     19       11.9589  0.1210
     20       11.9589  0.1240
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9457[0m  0.1210
      2       11.9589  0.1190
      3       11.9589  0.1210
      4       11.9589  0.1270
      5       11.9589  0.1240
      6       11.9589  0.1250
      7       11.9589  0.1180
      8       11.9589  0.1240
      9       11.9589  0.1250
     10       11.9589  0.1210
     11       11.9589  0.1210
     12       11.9589  0.1330
     13       11.9589  0.1340
     14       11.9589  0.1270
     15       11.9589  0.1210
     16       11.9589  0.1240
     17       11.9589  0.1230
     18        [36m3.2264[0m  0.1230
     19        [36m1.3911[0m  0.1160
     20        [36m1.3911[0m  0.1180
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9137[0m  0.1230
      2       11.9568  0.1270
      3       11.9568  0.1210
      4       11.9568  0.

     12        [36m1.3904[0m  0.1230
     13        [36m1.3903[0m  0.1190
     14        1.3903  0.1300
     15        1.3903  0.1250
     16        1.3903  0.1250
     17        1.3903  0.1240
     18        1.3903  0.1210
     19        1.3903  0.1220
     20        1.3903  0.1160
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m8.5331[0m  0.1180
      2        [36m5.8817[0m  0.1200
      3        [36m4.2459[0m  0.1250
      4        [36m4.0763[0m  0.1200
      5        4.2840  0.1190
      6        [36m1.4855[0m  0.1150
      7        8.6028  0.1230
      8        5.0969  0.1180
      9        [36m1.3918[0m  0.1200
     10        [36m1.3905[0m  0.1180
     11        [36m1.3905[0m  0.1170
     12        1.3905  0.1240
     13        1.3905  0.1300
     14        1.3905  0.1250
     15        1.3905  0.1180
     16        1.3905  0.1270
     17        1.3905  0.1200
     18        1.3905  0.1180
     19        1.3905  0.1220
     20   

      2        [36m1.2262[0m  0.1220
      3        [36m1.0627[0m  0.1190
      4        [36m1.0234[0m  0.1240
      5        [36m0.9751[0m  0.1170
      6        0.9847  0.1220
      7        [36m0.9708[0m  0.1220
      8        [36m0.9581[0m  0.1220
      9        [36m0.9464[0m  0.1280
     10        [36m0.9394[0m  0.1300
     11        [36m0.9351[0m  0.1170
     12        [36m0.9310[0m  0.1200
     13        [36m0.9232[0m  0.1190
     14        [36m0.9210[0m  0.1230
     15        [36m0.9161[0m  0.1200
     16        [36m0.9155[0m  0.1200
     17        [36m0.9154[0m  0.1200
     18        [36m0.9143[0m  0.1170
     19        0.9377  0.1360
     20        0.9274  0.1220
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5153[0m  0.1230
      2        [36m1.0982[0m  0.1270
      3        [36m1.0406[0m  0.1320
      4        [36m1.0298[0m  0.1160
      5        [36m1.0001[0m  0.1220
      6        [36m0.9924[0m 

      5       11.9568  0.1260
      6       11.9568  0.1270
      7       11.9568  0.1190
      8       11.9568  0.1170
      9        [36m7.3927[0m  0.1180
     10        [36m1.3858[0m  0.1280
     11        1.3868  0.1260
     12        1.3869  0.1200
     13        1.3869  0.1220
     14        1.3869  0.1250
     15        1.3869  0.1230
     16        1.3869  0.1200
     17        1.3869  0.1180
     18        1.3869  0.1220
     19        1.3869  0.1150
     20        1.3869  0.1210
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8366[0m  0.1190
      2       11.9547  0.1240
      3       11.9547  0.1240
      4       11.9547  0.1270
      5       11.9547  0.1190
      6       11.9547  0.1290
      7       11.9546  0.1190
      8        [36m1.8042[0m  0.1180
      9        [36m1.3871[0m  0.1170
     10        [36m1.3870[0m  0.1180
     11        [36m1.3870[0m  0.1160
     12        [36m1.3870[0m  0.1160
     13        [36m1.3869[

     19       11.9589  0.1260
     20       11.9589  0.1220
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9280[0m  0.1350
      2       11.9547  0.1220
      3       11.9547  0.1300
      4       11.9547  0.1380
      5       11.9547  0.1180
      6       11.9547  0.1180
      7       11.9547  0.1290
      8       11.9547  0.1370
      9       11.9547  0.1190
     10       11.9547  0.1280
     11       11.9547  0.1260
     12       11.9547  0.1320
     13       11.9547  0.1180
     14       11.9547  0.1240
     15       11.9547  0.1210
     16       11.9547  0.1260
     17       11.9547  0.1290
     18       11.9547  0.1230
     19       11.9547  0.1230
     20       11.9547  0.1210
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4166[0m  0.1230
      2        [36m1.3912[0m  0.1170
      3        [36m1.3911[0m  0.1190
      4        [36m1.3911[0m  0.1230
      5        [36m1.3911[0m  0.1240
      6        1

     11        1.3903  0.1220
     12        1.3903  0.1230
     13        1.3903  0.1200
     14        1.3903  0.1170
     15        [36m1.3903[0m  0.1220
     16        1.3903  0.1170
     17        1.3903  0.1170
     18        1.3903  0.1230
     19        1.3903  0.1170
     20        1.3903  0.1290
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.4304[0m  0.1290
      2       [36m11.2316[0m  0.1230
      3        [36m5.7304[0m  0.1280
      4        [36m1.4761[0m  0.1200
      5        3.3817  0.1250
      6        2.3714  0.1180
      7        [36m1.3918[0m  0.1230
      8        [36m1.3910[0m  0.1260
      9        [36m1.3905[0m  0.1280
     10        1.3905  0.1270
     11        1.3905  0.1170
     12        1.3905  0.1200
     13        1.3905  0.1180
     14        1.3905  0.1210
     15        1.3905  0.1230
     16        1.3905  0.1220
     17        1.3905  0.1220
     18        1.3905  0.1170
     19        1.3905  0.120

      8        [36m1.3869[0m  0.1150
      9        [36m1.3867[0m  0.1180
     10        [36m1.3865[0m  0.1150
     11        [36m1.3865[0m  0.1180
     12        [36m1.3864[0m  0.1150
     13        [36m1.3864[0m  0.1160
     14        [36m1.3864[0m  0.1170
     15        [36m1.3864[0m  0.1200
     16        [36m1.3864[0m  0.1260
     17        [36m1.3864[0m  0.1210
     18        [36m1.3864[0m  0.1190
     19        [36m1.3864[0m  0.1150
     20        [36m1.3864[0m  0.1200
     21        [36m1.3864[0m  0.1210
     22        [36m1.3864[0m  0.1170
     23        [36m1.3864[0m  0.1210
     24        [36m1.3864[0m  0.1160
     25        [36m1.3864[0m  0.1250
     26        [36m1.3864[0m  0.1160
     27        [36m1.3864[0m  0.1180
     28        [36m1.3864[0m  0.1240
     29        [36m1.3864[0m  0.1200
     30        [36m1.3864[0m  0.1250
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5760[0m  0.1150
    

     10        [36m0.9897[0m  0.1240
     11        [36m0.9848[0m  0.1170
     12        [36m0.9807[0m  0.1160
     13        [36m0.9805[0m  0.1150
     14        [36m0.9768[0m  0.1150
     15        0.9772  0.1180
     16        [36m0.9732[0m  0.1160
     17        0.9749  0.1150
     18        [36m0.9712[0m  0.1150
     19        0.9712  0.1130
     20        [36m0.9705[0m  0.1170
     21        [36m0.9685[0m  0.1160
     22        0.9699  0.1120
     23        0.9689  0.1190
     24        [36m0.9674[0m  0.1160
     25        0.9675  0.1150
     26        0.9688  0.1170
     27        0.9691  0.1180
     28        [36m0.9657[0m  0.1270
     29        0.9675  0.1150
     30        0.9687  0.1130
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.4329[0m  0.1140
      2        [36m1.3931[0m  0.1200
      3        [36m1.3891[0m  0.1220
      4        [36m1.3875[0m  0.1200
      5        [36m1.3868[0m  0.1160
      6        

     17        [36m1.3869[0m  0.1190
     18        [36m1.3869[0m  0.1120
     19        [36m1.3869[0m  0.1170
     20        [36m1.3869[0m  0.1130
     21        [36m1.3869[0m  0.1220
     22        [36m1.3869[0m  0.1150
     23        1.3869  0.1200
     24        1.3869  0.1170
     25        1.3869  0.1130
     26        1.3869  0.1140
     27        1.3869  0.1170
     28        1.3869  0.1200
     29        1.3869  0.1160
     30        1.3869  0.1190
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5717[0m  0.1180
      2        [36m1.3869[0m  0.1200
      3        [36m1.3868[0m  0.1140
      4        [36m1.3868[0m  0.1130
      5        1.3868  0.1190
      6        1.3868  0.1160
      7        1.3868  0.1140
      8        1.3868  0.1180
      9        1.3868  0.1170
     10        [36m1.3868[0m  0.1180
     11        1.3868  0.1170
     12        1.3868  0.1200
     13        1.3868  0.1150
     14        1.3868  0.1150
 

     13        1.3869  0.1200
     14        1.3869  0.1190
     15        1.3869  0.1170
     16        1.3869  0.1150
     17        1.3869  0.1140
     18        1.3869  0.1160
     19        1.3869  0.1250
     20        1.3869  0.1120
     21        1.3869  0.1140
     22        1.3869  0.1260
     23        1.3869  0.1170
     24        1.3869  0.1250
     25        1.3869  0.1230
     26        1.3869  0.1160
     27        1.3869  0.1160
     28        1.3869  0.1120
     29        1.3869  0.1130
     30        1.3869  0.1140
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m10.9928[0m  0.1180
      2        [36m1.3873[0m  0.1130
      3        [36m1.3868[0m  0.1240
      4        1.3868  0.1140
      5        1.3868  0.1130
      6        1.3868  0.1180
      7        1.3868  0.1190
      8        1.3868  0.1170
      9        1.3868  0.1210
     10        1.3868  0.1190
     11        1.3868  0.1150
     12        1.3868  0.1130
     13      

     24        1.3913  0.1160
     25        1.3913  0.1110
     26        1.3913  0.1110
     27        1.3913  0.1120
     28        1.3913  0.1120
     29        1.3913  0.1110
     30        1.3913  0.1180
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7502[0m  0.1210
      2       11.9547  0.1150
      3       11.8380  0.1210
      4        [36m1.3915[0m  0.1170
      5        [36m1.3910[0m  0.1140
      6        [36m1.3910[0m  0.1180
      7        [36m1.3910[0m  0.1210
      8        [36m1.3910[0m  0.1180
      9        1.3910  0.1170
     10        1.3910  0.1140
     11        1.3910  0.1160
     12        1.3910  0.1150
     13        1.3910  0.1150
     14        1.3910  0.1110
     15        1.3910  0.1110
     16        1.3910  0.1140
     17        [36m1.3910[0m  0.1170
     18        [36m1.3910[0m  0.1290
     19        1.3910  0.1190
     20        1.3910  0.1180
     21        1.3910  0.1130
     22        1.3910  0.114

     29        1.3905  0.1220
     30        1.3905  0.1180
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4825[0m  0.1170
      2        [36m1.3960[0m  0.1160
      3        [36m1.3914[0m  0.1180
      4        [36m1.3890[0m  0.1200
      5        [36m1.3877[0m  0.1210
      6        [36m1.3871[0m  0.1240
      7        [36m1.3867[0m  0.1170
      8        [36m1.3865[0m  0.1130
      9        [36m1.3864[0m  0.1290
     10        [36m1.3864[0m  0.1160
     11        [36m1.3864[0m  0.1130
     12        [36m1.3864[0m  0.1130
     13        [36m1.3864[0m  0.1160
     14        1.3864  0.1130
     15        1.3864  0.1160
     16        1.3864  0.1170
     17        1.3864  0.1180
     18        1.3864  0.1130
     19        1.3864  0.1160
     20        1.3864  0.1170
     21        1.3864  0.1200
     22        1.3864  0.1190
     23        1.3864  0.1216
     24        1.3864  0.1210
     25        1.3864  0.1140
     26      

      2        [36m1.3890[0m  0.1170
      3        [36m1.3859[0m  0.1240
      4        [36m1.3832[0m  0.1130
      5        [36m1.3790[0m  0.1130
      6        [36m1.3659[0m  0.1170
      7        [36m1.3288[0m  0.1190
      8        [36m1.2359[0m  0.1160
      9        [36m1.1469[0m  0.1130
     10        [36m1.1008[0m  0.1130
     11        [36m1.0797[0m  0.1210
     12        [36m1.0557[0m  0.1130
     13        [36m1.0392[0m  0.1130
     14        [36m1.0233[0m  0.1130
     15        [36m1.0184[0m  0.1160
     16        1.0292  0.1130
     17        [36m1.0059[0m  0.1140
     18        1.0077  0.1170
     19        1.0127  0.1280
     20        1.0559  0.1180
     21        [36m0.9891[0m  0.1250
     22        1.0079  0.1140
     23        0.9903  0.1160
     24        1.0059  0.1160
     25        [36m0.9872[0m  0.1140
     26        [36m0.9636[0m  0.1160
     27        0.9757  0.1250
     28        0.9662  0.1190
     29        [36m0.9620[

     10        1.0071  0.1190
     11        [36m0.9842[0m  0.1190
     12        [36m0.9687[0m  0.1260
     13        0.9698  0.1210
     14        0.9694  0.1140
     15        0.9691  0.1170
     16        [36m0.9682[0m  0.1220
     17        0.9682  0.1220
     18        0.9682  0.1160
     19        [36m0.9674[0m  0.1190
     20        [36m0.9666[0m  0.1140
     21        0.9682  0.1190
     22        0.9671  0.1230
     23        0.9667  0.1160
     24        [36m0.9639[0m  0.1210
     25        0.9653  0.1170
     26        0.9673  0.1190
     27        [36m0.9630[0m  0.1180
     28        0.9635  0.1220
     29        0.9642  0.1160
     30        0.9652  0.1200
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4984[0m  0.1120
      2        [36m1.3867[0m  0.1160
      3        [36m1.3866[0m  0.1180
      4        [36m1.3866[0m  0.1190
      5        [36m1.3865[0m  0.1160
      6        [36m1.3865[0m  0.1240
      7      

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5044[0m  0.1150
      2        [36m1.3868[0m  0.1150
      3        1.3868  0.1160
      4        1.3868  0.1210
      5        1.3868  0.1160
      6        1.3868  0.1140
      7        1.3868  0.1200
      8        1.3868  0.1190
      9        1.3868  0.1170
     10        1.3868  0.1250
     11        1.3868  0.1280
     12        1.3868  0.1190
     13        1.3868  0.1200
     14        1.3868  0.1130
     15        1.3868  0.1160
     16        1.3868  0.1160
     17        1.3868  0.1130
     18        1.3868  0.1220
     19        1.3868  0.1160
     20        1.3868  0.1120
     21        1.3868  0.1160
     22        1.3868  0.1190
     23        1.3868  0.1160
     24        1.3868  0.1220
     25        1.3868  0.1140
     26        1.3868  0.1180
     27        1.3868  0.1130
     28        1.3868  0.1220
     29        1.3868  0.1130
     30        1.3868  0.1130
  epoch    train_loss 

     28        1.3868  0.1220
     29        1.3868  0.1160
     30        1.3868  0.1150
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9473[0m  0.1180
      2       11.9568  0.1160
      3       11.9568  0.1180
      4       11.9568  0.1220
      5       11.9568  0.1210
      6       11.9568  0.1180
      7       11.9568  0.1220
      8       11.9568  0.1180
      9       11.9568  0.1170
     10       11.9568  0.1160
     11       11.9568  0.1330
     12       11.9568  0.1220
     13       11.9568  0.1150
     14       11.9568  0.1210
     15       11.9568  0.1220
     16       11.9568  0.1230
     17       11.9568  0.1170
     18       11.9568  0.1220
     19       11.9568  0.1250
     20       11.9568  0.1300
     21       11.9568  0.1220
     22       11.9568  0.1280
     23       11.9568  0.1200
     24       11.9568  0.1330
     25       11.9568  0.1250
     26       11.9568  0.1250
     27       11.9568  0.1270
     28       11.9568  0.1140
 

      5        1.3910  0.1190
      6        1.3910  0.1210
      7        1.3910  0.1160
      8        1.3910  0.1210
      9        1.3910  0.1130
     10        1.3910  0.1130
     11        1.3910  0.1190
     12        1.3910  0.1160
     13        1.3910  0.1160
     14        1.3910  0.1220
     15        1.3910  0.1270
     16        1.3910  0.1220
     17        1.3910  0.1130
     18        1.3910  0.1230
     19        1.3910  0.1200
     20        1.3910  0.1130
     21        1.3910  0.1130
     22        1.3910  0.1220
     23        1.3910  0.1150
     24        1.3910  0.1150
     25        1.3910  0.1210
     26        1.3910  0.1160
     27        1.3910  0.1260
     28        1.3910  0.1130
     29        1.3910  0.1160
     30        1.3910  0.1170
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4591[0m  0.1250
      2        [36m1.3920[0m  0.1250
      3        [36m1.3920[0m  0.1170
      4        [36m1.3920[0m  0.1160
    

      6        [36m1.2052[0m  0.1240
      7        [36m1.1207[0m  0.1130
      8        [36m1.0846[0m  0.1190
      9        [36m1.0652[0m  0.1150
     10        [36m1.0453[0m  0.1170
     11        [36m1.0240[0m  0.1200
     12        [36m1.0072[0m  0.1140
     13        [36m0.9958[0m  0.1160
     14        1.0130  0.1350
     15        [36m0.9931[0m  0.1180
     16        [36m0.9916[0m  0.1160
     17        0.9947  0.1140
     18        [36m0.9912[0m  0.1150
     19        [36m0.9720[0m  0.1280
     20        0.9748  0.1200
     21        0.9843  0.1180
     22        0.9731  0.1190
     23        [36m0.9646[0m  0.1340
     24        [36m0.9519[0m  0.1930
     25        0.9572  0.1600
     26        [36m0.9489[0m  0.1720
     27        0.9507  0.1340
     28        0.9703  0.1340
     29        0.9683  0.1200
     30        0.9550  0.1260
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5976[0m  0.1440
      2        

      8        0.9372  0.1250
      9        0.9366  0.1380
     10        [36m0.9332[0m  0.1260
     11        [36m0.9238[0m  0.1190
     12        0.9242  0.1220
     13        0.9257  0.1250
     14        [36m0.9196[0m  0.1200
     15        [36m0.9186[0m  0.1270
     16        [36m0.9174[0m  0.1320
     17        [36m0.9113[0m  0.1320
     18        [36m0.9106[0m  0.1240
     19        [36m0.9062[0m  0.1260
     20        [36m0.9059[0m  0.1320
     21        [36m0.9051[0m  0.1310
     22        [36m0.9019[0m  0.1300
     23        0.9022  0.1200
     24        0.9054  0.1290
     25        0.9049  0.1300
     26        0.9052  0.1300
     27        0.9049  0.1190
     28        0.9032  0.1170
     29        0.9023  0.1260
     30        [36m0.9013[0m  0.1300
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6192[0m  0.1160
      2        [36m1.3317[0m  0.1200
      3        [36m1.2797[0m  0.1160
      4        [36m1.198

     28       11.9589  0.1260
     29       11.9589  0.1240
     30       11.9589  0.1190
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5534[0m  0.1190
      2        [36m1.3868[0m  0.1220
      3        1.3868  0.1180
      4        1.3868  0.1180
      5        1.3868  0.1200
      6        1.3868  0.1240
      7        1.3868  0.1220
      8        1.3868  0.1150
      9        1.3868  0.1230
     10        1.3868  0.1160
     11        1.3868  0.1230
     12        1.3868  0.1230
     13        1.3868  0.1180
     14        1.3868  0.1180
     15        1.3868  0.1180
     16        1.3868  0.1230
     17        1.3868  0.1310
     18        1.3868  0.1190
     19        1.3868  0.1250
     20        1.3868  0.1270
     21        1.3868  0.1170
     22        1.3868  0.1200
     23        1.3868  0.1180
     24        1.3868  0.1180
     25        1.3868  0.1160
     26        1.3868  0.1230
     27        1.3868  0.1230
     28        1.3868 

     28        1.3869  0.1260
     29        1.3869  0.1190
     30        1.3869  0.1150
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5392[0m  0.1200
      2        [36m1.3869[0m  0.1150
      3        1.3869  0.1190
      4        1.3869  0.1180
      5        1.3869  0.1150
      6        1.3869  0.1150
      7        1.3869  0.1220
      8        1.3869  0.1300
      9        1.3869  0.1240
     10        1.3869  0.1250
     11        1.3869  0.1170
     12        1.3869  0.1180
     13        1.3869  0.1220
     14        1.3869  0.1160
     15        1.3869  0.1260
     16        1.3869  0.1150
     17        1.3869  0.1200
     18        1.3869  0.1210
     19        1.3869  0.1240
     20        1.3869  0.1390
     21        1.3869  0.1180
     22        1.3869  0.1200
     23        1.3869  0.1240
     24        1.3869  0.1190
     25        1.3869  0.1200
     26        1.3869  0.1190
     27        1.3869  0.1230
     28        1.3869 

      6       11.9547  0.1210
      7       11.9547  0.1220
      8       11.9547  0.1380
      9       11.9547  0.1300
     10       11.9547  0.1230
     11       11.9547  0.1240
     12       11.9547  0.1230
     13       11.9547  0.1180
     14       11.9547  0.1240
     15       11.9547  0.1260
     16       11.9547  0.1250
     17       11.9547  0.1270
     18       11.9547  0.1180
     19       11.9547  0.1200
     20       11.9547  0.1210
     21       11.9547  0.1250
     22       11.9547  0.1230
     23       11.9547  0.1230
     24       11.9547  0.1180
     25       11.9547  0.1240
     26       11.9547  0.1210
     27       11.9547  0.1190
     28       11.9547  0.1230
     29       11.9547  0.1210
     30       11.9547  0.1240
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9534[0m  0.1230
      2       11.9568  0.1260
      3       11.9568  0.1210
      4       11.9568  0.1260
      5       11.9568  0.1200
      6       11.9568  0.1230
 

     11        1.3894  0.1270
     12        1.3894  0.1220
     13        1.3894  0.1190
     14        1.3894  0.1160
     15        1.3894  0.1220
     16        1.3894  0.1230
     17        1.3894  0.1170
     18        1.3894  0.1220
     19        1.3894  0.1160
     20        1.3894  0.1280
     21        1.3894  0.1250
     22        1.3894  0.1230
     23        1.3894  0.1260
     24        1.3894  0.1180
     25        1.3894  0.1180
     26        1.3894  0.1270
     27        1.3894  0.1150
     28        1.3894  0.1190
     29        1.3894  0.1160
     30        1.3894  0.1230
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.6378[0m  0.1310
      2        [36m6.1813[0m  0.1260
      3        [36m1.4329[0m  0.1300
      4        [36m1.3934[0m  0.1290
      5        [36m1.3912[0m  0.1160
      6        1.3913  0.1160
      7        1.3913  0.1190
      8        1.3913  0.1220
      9        1.3913  0.1300
     10        1.3913  0.

      5        [36m0.9440[0m  0.1220
      6        [36m0.9350[0m  0.1190
      7        [36m0.9292[0m  0.1180
      8        0.9298  0.1210
      9        [36m0.9233[0m  0.1220
     10        [36m0.9201[0m  0.1230
     11        0.9201  0.1210
     12        [36m0.9140[0m  0.1360
     13        [36m0.9106[0m  0.1200
     14        [36m0.9046[0m  0.1220
     15        [36m0.8988[0m  0.1160
     16        [36m0.8962[0m  0.1220
     17        [36m0.8949[0m  0.1170
     18        [36m0.8923[0m  0.1210
     19        [36m0.8918[0m  0.1170
     20        0.8920  0.1270
     21        0.8918  0.1240
     22        [36m0.8892[0m  0.1340
     23        [36m0.8878[0m  0.1250
     24        [36m0.8876[0m  0.1250
     25        [36m0.8811[0m  0.1160
     26        0.8830  0.1280
     27        [36m0.8778[0m  0.1250
     28        0.8781  0.1180
     29        0.8801  0.1210
     30        [36m0.8751[0m  0.1230
  epoch    train_loss     dur
-------  ----------

     10        [36m0.9765[0m  0.1160
     11        [36m0.9737[0m  0.1190
     12        0.9745  0.1350
     13        0.9745  0.1250
     14        0.9739  0.1160
     15        [36m0.9729[0m  0.1320
     16        [36m0.9728[0m  0.1220
     17        0.9737  0.1200
     18        0.9731  0.1230
     19        [36m0.9726[0m  0.1190
     20        0.9726  0.1210
     21        [36m0.9723[0m  0.1220
     22        [36m0.9719[0m  0.1300
     23        0.9723  0.1310
     24        0.9724  0.1190
     25        [36m0.9707[0m  0.1170
     26        0.9721  0.1210
     27        0.9709  0.1220
     28        0.9717  0.1200
     29        0.9711  0.1240
     30        [36m0.9703[0m  0.1250
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7466[0m  0.1190
      2        [36m1.0911[0m  0.1180
      3        [36m1.0695[0m  0.1220
      4        [36m1.0497[0m  0.1240
      5        [36m1.0444[0m  0.1200
      6        [36m1.0094[0m  0.

      7       11.9568  0.1280
      8       11.9568  0.1250
      9       11.9568  0.1210
     10       11.9568  0.1180
     11       11.9568  0.1200
     12       11.9568  0.1360
     13       11.9568  0.1220
     14       11.9568  0.1240
     15       11.9568  0.1210
     16       11.9568  0.1220
     17       11.9568  0.1270
     18       11.9568  0.1240
     19       11.9568  0.1310
     20       11.9568  0.1230
     21       11.9568  0.1230
     22       11.9568  0.1280
     23       11.9568  0.1240
     24       11.9568  0.1230
     25       11.9568  0.1230
     26       11.9568  0.1210
     27       11.9568  0.1300
     28       11.9568  0.1280
     29       11.9568  0.1240
     30       11.9568  0.1250
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9379[0m  0.1180
      2       11.9568  0.1190
      3       11.9568  0.1230
      4       11.9568  0.1270
      5       11.9568  0.1240
      6       11.9568  0.1320
      7       11.9568  0.1280
 

      2        [36m1.3868[0m  0.1220
      3        1.3868  0.1200
      4        1.3868  0.1190
      5        1.3868  0.1210
      6        1.3868  0.1240
      7        1.3868  0.1170
      8        1.3868  0.1220
      9        1.3868  0.1220
     10        1.3868  0.1180
     11        1.3868  0.1190
     12        1.3868  0.1220
     13        1.3868  0.1180
     14        1.3868  0.1220
     15        1.3868  0.1220
     16        1.3868  0.1240
     17        1.3868  0.1170
     18        1.3868  0.1240
     19        1.3868  0.1190
     20        1.3868  0.1180
     21        1.3868  0.1200
     22        1.3868  0.1260
     23        1.3868  0.1260
     24        1.3868  0.1200
     25        1.3868  0.1250
     26        1.3868  0.1220
     27        1.3868  0.1240
     28        1.3868  0.1300
     29        1.3868  0.1270
     30        1.3868  0.1170
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m9.9011[0m  0.1240
      2        [36m1.

     13       11.9568  0.1240
     14       11.9568  0.1220
     15       11.9568  0.1240
     16       11.9568  0.1240
     17       11.9568  0.1240
     18       11.9568  0.1240
     19       11.9568  0.1210
     20       11.9568  0.1200
     21        [36m9.9901[0m  0.1250
     22        [36m1.3924[0m  0.1220
     23        [36m1.3922[0m  0.1200
     24        [36m1.3922[0m  0.1240
     25        [36m1.3922[0m  0.1190
     26        1.3922  0.1160
     27        1.3922  0.1230
     28        1.3922  0.1210
     29        1.3922  0.1240
     30        1.3922  0.1270
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9193[0m  0.1200
      2       11.9568  0.1180
      3        [36m1.6165[0m  0.1210
      4        [36m1.3900[0m  0.1150
      5        1.3900  0.1230
      6        1.3900  0.1270
      7        1.3900  0.1190
      8        1.3900  0.1250
      9        1.3900  0.1250
     10        1.3900  0.1160
     11        1.3900  0.122

     16        1.3904  0.1150
     17        1.3904  0.1180
     18        1.3904  0.1230
     19        1.3904  0.1260
     20        1.3904  0.1250
     21        1.3904  0.1260
     22        1.3904  0.1220
     23        1.3904  0.1210
     24        1.3904  0.1180
     25        1.3904  0.1230
     26        1.3904  0.1220
     27        1.3904  0.1160
     28        1.3904  0.1270
     29        1.3904  0.1210
     30        1.3904  0.1210
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m7.6024[0m  0.1200
      2       10.3794  0.1260
      3        [36m5.8638[0m  0.1210
      4        [36m1.4039[0m  0.1180
      5        [36m1.3906[0m  0.1280
      6        [36m1.3904[0m  0.1190
      7        [36m1.3903[0m  0.1210
      8        [36m1.3903[0m  0.1260
      9        1.3903  0.1200
     10        1.3903  0.1230
     11        1.3903  0.1170
     12        1.3903  0.1200
     13        1.3903  0.1150
     14        [36m1.3903[0m  0.120

     35        [36m1.3863[0m  0.1160
     36        [36m1.3863[0m  0.1150
     37        [36m1.3863[0m  0.1190
     38        [36m1.3863[0m  0.1140
     39        1.3863  0.1170
     40        [36m1.3863[0m  0.1170
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4855[0m  0.1190
      2        [36m1.4106[0m  0.1200
      3        [36m1.3998[0m  0.1200
      4        [36m1.3938[0m  0.1220
      5        [36m1.3905[0m  0.1210
      6        [36m1.3887[0m  0.1220
      7        [36m1.3877[0m  0.1310
      8        [36m1.3871[0m  0.1230
      9        [36m1.3868[0m  0.1160
     10        [36m1.3866[0m  0.1200
     11        [36m1.3865[0m  0.1190
     12        [36m1.3865[0m  0.1180
     13        [36m1.3864[0m  0.1190
     14        [36m1.3864[0m  0.1200
     15        [36m1.3864[0m  0.1180
     16        [36m1.3864[0m  0.1150
     17        [36m1.3864[0m  0.1190
     18        [36m1.3864[0m  0.1190
     19      

     16        1.3864  0.1140
     17        1.3864  0.1160
     18        1.3864  0.1190
     19        1.3864  0.1210
     20        1.3864  0.1180
     21        1.3864  0.1200
     22        1.3864  0.1220
     23        1.3864  0.1250
     24        1.3864  0.1240
     25        1.3864  0.1260
     26        1.3864  0.1310
     27        1.3864  0.1280
     28        1.3864  0.1260
     29        1.3864  0.1290
     30        1.3864  0.1270
     31        1.3864  0.1260
     32        1.3864  0.1270
     33        1.3864  0.1170
     34        1.3864  0.1300
     35        1.3864  0.1270
     36        1.3864  0.1240
     37        1.3864  0.1220
     38        1.3864  0.1200
     39        1.3864  0.1180
     40        1.3864  0.1180
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.8073[0m  0.1120
      2        [36m1.3924[0m  0.1240
      3        [36m1.3883[0m  0.1180
      4        [36m1.3871[0m  0.1190
      5        [36m1.3866[0m  0.

      2        [36m1.3868[0m  0.1230
      3        1.3869  0.1150
      4        1.3869  0.1170
      5        1.3869  0.1190
      6        1.3869  0.1170
      7        1.3869  0.1130
      8        1.3869  0.1230
      9        1.3869  0.1220
     10        1.3869  0.1130
     11        1.3869  0.1160
     12        1.3869  0.1160
     13        1.3869  0.1170
     14        1.3869  0.1230
     15        1.3869  0.1130
     16        1.3869  0.1150
     17        1.3869  0.1160
     18        1.3869  0.1180
     19        1.3869  0.1170
     20        1.3869  0.1200
     21        1.3869  0.1150
     22        1.3869  0.1310
     23        1.3869  0.1276
     24        1.3869  0.1160
     25        1.3869  0.1190
     26        1.3869  0.1210
     27        1.3869  0.1130
     28        1.3869  0.1270
     29        1.3869  0.1220
     30        1.3869  0.1230
     31        1.3869  0.1240
     32        1.3869  0.1210
     33        1.3869  0.1180
     34        1.3869  0.1210
 

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4093[0m  0.1220
      2        [36m1.3862[0m  0.1160
      3        1.3868  0.1290
      4        1.3868  0.1190
      5        1.3868  0.1120
      6        1.3868  0.1190
      7        1.3868  0.1230
      8        1.3868  0.1160
      9        1.3868  0.1140
     10        1.3868  0.1230
     11        1.3868  0.1200
     12        1.3868  0.1190
     13        1.3868  0.1150
     14        1.3868  0.1220
     15        1.3868  0.1260
     16        1.3868  0.1190
     17        1.3868  0.1140
     18        1.3868  0.1180
     19        1.3868  0.1180
     20        1.3868  0.1150
     21        1.3868  0.1190
     22        1.3868  0.1180
     23        1.3868  0.1250
     24        1.3868  0.1140
     25        1.3868  0.1160
     26        1.3868  0.1160
     27        1.3868  0.1170
     28        1.3868  0.1140
     29        1.3868  0.1180
     30        1.3868  0.1160
     31        1.3868 

     36        1.3868  0.1200
     37        1.3868  0.1150
     38        1.3868  0.1200
     39        1.3868  0.1130
     40        1.3868  0.1200
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4121[0m  0.1120
      2        [36m1.3868[0m  0.1170
      3        [36m1.3868[0m  0.1250
      4        1.3868  0.1260
      5        1.3868  0.1210
      6        1.3868  0.1150
      7        1.3868  0.1130
      8        1.3868  0.1160
      9        1.3868  0.1190
     10        1.3868  0.1200
     11        1.3868  0.1210
     12        1.3868  0.1130
     13        1.3868  0.1200
     14        1.3868  0.1200
     15        1.3868  0.1180
     16        1.3868  0.1170
     17        1.3868  0.1180
     18        1.3868  0.1250
     19        1.3868  0.1190
     20        1.3868  0.1200
     21        1.3868  0.1130
     22        1.3868  0.1260
     23        1.3868  0.1130
     24        1.3868  0.1170
     25        1.3868  0.1160
     26      

     10       11.9568  0.1270
     11       11.9568  0.1190
     12       11.9568  0.1210
     13       11.9568  0.1170
     14       11.9568  0.1300
     15       11.9568  0.1220
     16       11.9568  0.1140
     17       11.9568  0.1160
     18        [36m9.0880[0m  0.1180
     19        [36m1.3909[0m  0.1160
     20        1.3911  0.1170
     21        1.3911  0.1150
     22        1.3911  0.1120
     23        1.3911  0.1170
     24        1.3911  0.1210
     25        1.3911  0.1180
     26        1.3911  0.1230
     27        1.3911  0.1130
     28        1.3911  0.1210
     29        1.3911  0.1120
     30        1.3911  0.1170
     31        1.3911  0.1150
     32        1.3911  0.1240
     33        1.3911  0.1230
     34        1.3911  0.1150
     35        1.3911  0.1180
     36        1.3911  0.1200
     37        1.3911  0.1140
     38        1.3911  0.1220
     39        1.3911  0.1210
     40        1.3911  0.1140
  epoch    train_loss     dur
-------  ------------ 

     25        1.3920  0.1260
     26        1.3920  0.1200
     27        1.3920  0.1220
     28        1.3920  0.1140
     29        1.3920  0.1190
     30        1.3920  0.1140
     31        1.3920  0.1130
     32        1.3920  0.1150
     33        1.3920  0.1190
     34        1.3920  0.1220
     35        1.3920  0.1140
     36        1.3920  0.1150
     37        1.3920  0.1180
     38        1.3920  0.1200
     39        1.3920  0.1130
     40        1.3920  0.1260
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m5.3408[0m  0.1150
      2        6.8349  0.1180
      3        [36m4.4789[0m  0.1280
      4        [36m4.2441[0m  0.1250
      5        [36m1.3893[0m  0.1160
      6        1.3894  0.1150
      7        1.3894  0.1210
      8        1.3894  0.1260
      9        1.3894  0.1200
     10        1.3894  0.1160
     11        1.3894  0.1120
     12        1.3894  0.1160
     13        1.3894  0.1120
     14        1.3894  0.1150
    

     32        [36m0.9807[0m  0.1180
     33        [36m0.9787[0m  0.1150
     34        0.9792  0.1240
     35        [36m0.9744[0m  0.1240
     36        [36m0.9673[0m  0.1170
     37        0.9680  0.1150
     38        [36m0.9602[0m  0.1200
     39        0.9661  0.1210
     40        0.9610  0.1290
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4877[0m  0.1170
      2        [36m1.3246[0m  0.1260
      3        [36m1.2127[0m  0.1200
      4        [36m1.0852[0m  0.1170
      5        [36m1.0351[0m  0.1190
      6        1.1262  0.1180
      7        1.1032  0.1170
      8        1.0681  0.1140
      9        1.0522  0.1170
     10        1.0361  0.1260
     11        [36m1.0297[0m  0.1250
     12        [36m1.0182[0m  0.1200
     13        1.0323  0.1170
     14        [36m1.0032[0m  0.1170
     15        [36m1.0016[0m  0.1240
     16        1.0066  0.1210
     17        [36m0.9791[0m  0.1160
     18        [36m0.974

     10        [36m1.3864[0m  0.1260
     11        [36m1.3864[0m  0.1280
     12        [36m1.3864[0m  0.1290
     13        [36m1.3863[0m  0.1160
     14        [36m1.3863[0m  0.1260
     15        [36m1.3863[0m  0.1170
     16        [36m1.3863[0m  0.1190
     17        [36m1.3863[0m  0.1230
     18        [36m1.3863[0m  0.1200
     19        [36m1.3863[0m  0.1320
     20        [36m1.3863[0m  0.1250
     21        [36m1.3863[0m  0.1290
     22        [36m1.3863[0m  0.1260
     23        [36m1.3863[0m  0.1140
     24        [36m1.3863[0m  0.1250
     25        1.3863  0.1160
     26        1.3863  0.1150
     27        1.3863  0.1230
     28        1.3863  0.1190
     29        1.3863  0.1200
     30        1.3863  0.1220
     31        1.3863  0.1250
     32        1.3863  0.1180
     33        1.3863  0.1160
     34        1.3863  0.1180
     35        1.3863  0.1140
     36        [36m1.3863[0m  0.1170
     37        1.3863  0.1140
     38        1

     28        0.9919  0.1230
     29        0.9930  0.1210
     30        0.9936  0.1240
     31        0.9894  0.1210
     32        0.9894  0.1200
     33        0.9910  0.1180
     34        0.9908  0.1250
     35        0.9909  0.1240
     36        0.9909  0.1300
     37        0.9900  0.1180
     38        [36m0.9878[0m  0.1210
     39        0.9890  0.1290
     40        0.9915  0.1200
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.0065[0m  0.1250
      2        [36m1.3859[0m  0.1190
      3        [36m1.3818[0m  0.1280
      4        [36m1.3693[0m  0.1280
      5        [36m1.3296[0m  0.1150
      6        [36m1.2328[0m  0.1150
      7        [36m1.1485[0m  0.1200
      8        [36m1.1124[0m  0.1280
      9        [36m1.1029[0m  0.1180
     10        [36m1.0733[0m  0.1300
     11        [36m1.0622[0m  0.1150
     12        [36m1.0532[0m  0.1240
     13        [36m1.0482[0m  0.1170
     14        [36m1.0460[0m  0.

     32       11.9568  0.1350
     33       11.9568  0.1260
     34       11.9568  0.1280
     35       11.9568  0.1360
     36       11.9568  0.1300
     37       11.9568  0.1270
     38       11.9568  0.1300
     39       11.9568  0.1360
     40       11.9568  0.1280
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5730[0m  0.1200
      2        [36m1.3877[0m  0.1170
      3        [36m1.3877[0m  0.1320
      4        [36m1.3877[0m  0.1270
      5        [36m1.3877[0m  0.1160
      6        [36m1.3877[0m  0.1220
      7        [36m1.3877[0m  0.1190
      8        [36m1.3877[0m  0.1270
      9        [36m1.3877[0m  0.1200
     10        [36m1.3876[0m  0.1200
     11        [36m1.3876[0m  0.1190
     12        [36m1.3876[0m  0.1240
     13        [36m1.3876[0m  0.1160
     14        [36m1.3876[0m  0.1190
     15        [36m1.3876[0m  0.1200
     16        [36m1.3876[0m  0.1270
     17        [36m1.3876[0m  0.1250
     18

     25        [36m1.3867[0m  0.1160
     26        [36m1.3809[0m  0.1160
     27        1.3869  0.1190
     28        1.3869  0.1190
     29        1.3869  0.1200
     30        1.3869  0.1220
     31        1.3869  0.1160
     32        1.3869  0.1170
     33        1.3869  0.1180
     34        1.3869  0.1270
     35        1.3869  0.1290
     36        1.3869  0.1180
     37        1.3869  0.1280
     38        1.3869  0.1210
     39        1.3869  0.1220
     40        1.3869  0.1210
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5532[0m  0.1180
      2        [36m1.3869[0m  0.1210
      3        1.3869  0.1190
      4        1.3869  0.1160
      5        1.3869  0.1180
      6        1.3869  0.1220
      7        1.3869  0.1270
      8        1.3869  0.1160
      9        1.3869  0.1200
     10        1.3869  0.1200
     11        1.3869  0.1230
     12        1.3869  0.1140
     13        1.3869  0.1200
     14        1.3869  0.1250
    

     40        1.3868  0.1190
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9177[0m  0.1180
      2       11.9589  0.1210
      3       11.9589  0.1250
      4       11.9589  0.1190
      5       11.9589  0.1280
      6       11.9589  0.1230
      7       11.9589  0.1240
      8       11.9589  0.1300
      9       11.9589  0.1250
     10       11.9589  0.1250
     11       11.9589  0.1260
     12       11.9589  0.1290
     13       11.9589  0.1250
     14       11.9589  0.1180
     15       11.9589  0.1220
     16       11.9589  0.1230
     17       11.9589  0.1250
     18       11.9589  0.1270
     19       11.9589  0.1260
     20       11.9589  0.1370
     21       11.9589  0.1300
     22       11.9589  0.1350
     23       11.9589  0.1250
     24       11.9589  0.1290
     25       11.9589  0.1270
     26       11.9589  0.1250
     27       11.9589  0.1390
     28       11.9589  0.1210
     29       11.9589  0.1260
     30       11.9589  0.1330
 

      7        1.3913  0.1200
      8        1.3913  0.1170
      9        1.3913  0.1220
     10        1.3913  0.1220
     11        1.3913  0.1240
     12        1.3913  0.1170
     13        1.3913  0.1190
     14        1.3913  0.1200
     15        1.3913  0.1180
     16        1.3913  0.1190
     17        1.3913  0.1180
     18        1.3913  0.1220
     19        1.3913  0.1250
     20        1.3913  0.1270
     21        1.3913  0.1240
     22        1.3913  0.1200
     23        1.3913  0.1160
     24        1.3913  0.1270
     25        1.3913  0.1270
     26        1.3913  0.1290
     27        1.3913  0.1330
     28        1.3913  0.1490
     29        1.3913  0.1360
     30        1.3913  0.1360
     31        1.3913  0.1450
     32        1.3913  0.1420
     33        1.3913  0.1390
     34        1.3913  0.1440
     35        1.3913  0.1340
     36        1.3913  0.1350
     37        1.3913  0.1310
     38        1.3913  0.1330
     39        1.3913  0.1350
     40   

     18        1.3904  0.1240
     19        1.3904  0.1230
     20        1.3904  0.1170
     21        1.3904  0.1180
     22        1.3904  0.1200
     23        1.3904  0.1250
     24        1.3904  0.1220
     25        1.3904  0.1240
     26        1.3904  0.1180
     27        1.3904  0.1140
     28        1.3904  0.1170
     29        1.3904  0.1250
     30        1.3904  0.1250
     31        1.3904  0.1190
     32        1.3904  0.1260
     33        1.3904  0.1280
     34        1.3904  0.1190
     35        1.3904  0.1200
     36        1.3904  0.1210
     37        1.3904  0.1200
     38        1.3904  0.1210
     39        1.3904  0.1250
     40        1.3904  0.1200
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m8.5859[0m  0.1220
      2        [36m5.1088[0m  0.1210
      3        6.0838  0.1210
      4        7.8348  0.1320
      5        8.0547  0.1340
      6        [36m2.3126[0m  0.1290
      7       10.2377  0.1190
      8      

      7        [36m0.9820[0m  0.1270
      8        [36m0.9644[0m  0.1210
      9        [36m0.9529[0m  0.1270
     10        [36m0.9395[0m  0.1220
     11        [36m0.9325[0m  0.1200
     12        [36m0.9198[0m  0.1260
     13        [36m0.9165[0m  0.1220
     14        0.9184  0.1250
     15        [36m0.9114[0m  0.1200
     16        [36m0.9110[0m  0.1240
     17        0.9132  0.1150
     18        [36m0.9024[0m  0.1190
     19        0.9070  0.1310
     20        [36m0.9018[0m  0.1210
     21        [36m0.8939[0m  0.1190
     22        [36m0.8896[0m  0.1210
     23        [36m0.8860[0m  0.1200
     24        0.8940  0.1250
     25        [36m0.8838[0m  0.1280
     26        [36m0.8813[0m  0.1230
     27        [36m0.8794[0m  0.1310
     28        0.8869  0.1260
     29        0.8854  0.1290
     30        [36m0.8763[0m  0.1260
     31        [36m0.8724[0m  0.1210
     32        0.8819  0.1190
     33        [36m0.8667[0m  0.1160
     34   

     26        [36m1.0033[0m  0.1300
     27        [36m0.9989[0m  0.1330
     28        [36m0.9975[0m  0.1260
     29        [36m0.9946[0m  0.1390
     30        0.9960  0.1270
     31        [36m0.9918[0m  0.1250
     32        [36m0.9883[0m  0.1340
     33        [36m0.9845[0m  0.1320
     34        0.9867  0.1290
     35        0.9848  0.1220
     36        0.9856  0.1320
     37        [36m0.9822[0m  0.1300
     38        [36m0.9818[0m  0.1270
     39        [36m0.9796[0m  0.1150
     40        [36m0.9788[0m  0.1140
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.3579[0m  0.1230
      2        [36m1.2019[0m  0.1180
      3        [36m1.1582[0m  0.1250
      4        [36m1.1119[0m  0.1250
      5        [36m1.0916[0m  0.1240
      6        [36m1.0772[0m  0.1210
      7        [36m1.0675[0m  0.1330
      8        [36m1.0516[0m  0.1210
      9        [36m1.0463[0m  0.1270
     10        1.0515  0.1190
     11   

      7        0.9753  0.1210
      8        [36m0.9673[0m  0.1152
      9        [36m0.9638[0m  0.1240
     10        0.9725  0.1240
     11        [36m0.9622[0m  0.1224
     12        0.9667  0.1220
     13        0.9637  0.1180
     14        [36m0.9606[0m  0.1190
     15        [36m0.9593[0m  0.1220
     16        0.9605  0.1190
     17        0.9651  0.1187
     18        0.9625  0.1210
     19        [36m0.9570[0m  0.1229
     20        0.9612  0.1202
     21        0.9605  0.1280
     22        0.9625  0.1180
     23        0.9590  0.1190
     24        0.9624  0.1250
     25        0.9613  0.1200
     26        0.9583  0.1190
     27        0.9611  0.1180
     28        0.9594  0.1152
     29        0.9614  0.1210
     30        0.9596  0.1223
     31        0.9601  0.1250
     32        0.9590  0.1340
     33        0.9608  0.1250
     34        0.9592  0.1260
     35        0.9600  0.1290
     36        0.9628  0.1460
     37        0.9580  0.1360
     38        0

     40        [36m1.3870[0m  0.1200
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9564[0m  0.1180
      2       11.9589  0.1240
      3       11.9589  0.1180
      4       11.9589  0.1220
      5       11.9589  0.1280
      6       11.9589  0.1280
      7       11.9589  0.1200
      8       11.9966  0.1280
      9       11.9568  0.1220
     10       11.9568  0.1320
     11       11.9568  0.1230
     12        [36m8.4714[0m  0.1280
     13        [36m1.3867[0m  0.1190
     14        1.3869  0.1200
     15        1.3869  0.1360
     16        1.3869  0.1170
     17        1.3869  0.1170
     18        1.3869  0.1190
     19        1.3869  0.1170
     20        1.3869  0.1160
     21        1.3869  0.1300
     22        1.3869  0.1330
     23        1.3869  0.1300
     24        1.3869  0.1330
     25        1.3869  0.1410
     26        1.3869  0.1360
     27        1.3869  0.1370
     28        1.3869  0.1200
     29        1.3869  0.1230
    

      2        [36m1.3878[0m  0.1180
      3        [36m1.3868[0m  0.1250
      4        [36m1.3868[0m  0.1210
      5        [36m1.3868[0m  0.1190
      6        [36m1.3868[0m  0.1220
      7        1.3868  0.1180
      8        1.3868  0.1180
      9        1.3868  0.1170
     10        1.3868  0.1240
     11        1.3868  0.1270
     12        1.3868  0.1190
     13        1.3868  0.1220
     14        1.3868  0.1174
     15        1.3868  0.1170
     16        1.3868  0.1140
     17        1.3868  0.1180
     18        1.3868  0.1170
     19        1.3868  0.1210
     20        1.3868  0.1180
     21        1.3868  0.1220
     22        1.3868  0.1220
     23        1.3868  0.1210
     24        1.3868  0.1220
     25        1.3868  0.1150
     26        1.3868  0.1150
     27        1.3868  0.1200
     28        1.3868  0.1160
     29        1.3868  0.1150
     30        1.3868  0.1150
     31        1.3868  0.1180
     32        1.3868  0.1330
     33        1.3868  0.

     16       11.9547  0.1210
     17       11.9547  0.1230
     18       11.9547  0.1290
     19       11.9547  0.1360
     20       11.9547  0.1250
     21       11.9547  0.1270
     22       11.9547  0.1290
     23       11.9547  0.1320
     24       11.9547  0.1250
     25       11.9547  0.1290
     26       11.9547  0.1290
     27       11.9547  0.1290
     28       11.9547  0.1200
     29       11.9547  0.1190
     30       11.9547  0.1160
     31       11.9547  0.1200
     32       [36m10.5299[0m  0.1210
     33        [36m1.3920[0m  0.1180
     34        [36m1.3911[0m  0.1150
     35        [36m1.3911[0m  0.1150
     36        1.3911  0.1180
     37        1.3911  0.1170
     38        [36m1.3911[0m  0.1180
     39        1.3911  0.1160
     40        1.3911  0.1165
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8988[0m  0.1280
      2       11.9568  0.1190
      3       11.9568  0.1260
      4       11.9568  0.1280
      5       11

     26        1.3910  0.1210
     27        1.3910  0.1180
     28        1.3910  0.1220
     29        1.3910  0.1210
     30        1.3910  0.1160
     31        1.3910  0.1230
     32        1.3910  0.1270
     33        1.3910  0.1220
     34        1.3910  0.1280
     35        1.3910  0.1140
     36        1.3910  0.1170
     37        1.3910  0.1180
     38        1.3910  0.1210
     39        1.3910  0.1200
     40        1.3910  0.1140
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.0156[0m  0.1280
      2        [36m1.3918[0m  0.1200
      3        1.3920  0.1160
      4        1.3920  0.1200
      5        1.3920  0.1180
      6        1.3920  0.1180
      7        1.3920  0.1260
      8        1.3920  0.1210
      9        1.3920  0.1190
     10        1.3920  0.1190
     11        1.3920  0.1230
     12        1.3920  0.1300
     13        1.3920  0.1150
     14        1.3920  0.1170
     15        1.3920  0.1160
     16        1.3920 

     39        1.3905  0.1200
     40        1.3905  0.1210
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.2528[0m  0.1210
      2        [36m1.0406[0m  0.1260
      3        [36m0.9952[0m  0.1230
      4        [36m0.9720[0m  0.1310
      5        [36m0.9477[0m  0.1160
      6        [36m0.9403[0m  0.1210
      7        [36m0.9313[0m  0.1180
      8        [36m0.9293[0m  0.1250
      9        [36m0.9225[0m  0.1150
     10        [36m0.9159[0m  0.1210
     11        0.9180  0.1220
     12        0.9257  0.1210
     13        0.9286  0.1330
     14        0.9169  0.1290
     15        [36m0.9147[0m  0.1320
     16        [36m0.9077[0m  0.1260
     17        [36m0.9020[0m  0.1260
     18        [36m0.8976[0m  0.1590
     19        [36m0.8973[0m  0.1380
     20        [36m0.8900[0m  0.1400
     21        0.8917  0.1150
     22        0.8937  0.1190
     23        [36m0.8872[0m  0.1190
     24        [36m0.8868[0m  0.117

     14        [36m0.9157[0m  0.1210
     15        0.9244  0.1190
     16        0.9294  0.1190
     17        [36m0.9092[0m  0.1200
     18        [36m0.9027[0m  0.1220
     19        0.9028  0.1240
     20        [36m0.9022[0m  0.1210
     21        [36m0.8980[0m  0.1160
     22        0.9051  0.1190
     23        0.8980  0.1190
     24        0.9087  0.1220
     25        0.9051  0.1310
     26        [36m0.8954[0m  0.1180
     27        0.9022  0.1180
     28        0.9047  0.1210
     29        0.9001  0.1160
     30        0.8986  0.1260
     31        0.8976  0.1220
     32        [36m0.8932[0m  0.1260
     33        [36m0.8906[0m  0.1270
     34        0.8916  0.1220
     35        [36m0.8861[0m  0.1250
     36        [36m0.8854[0m  0.1210
     37        0.8871  0.1190
     38        [36m0.8852[0m  0.1220
     39        [36m0.8814[0m  0.1170
     40        0.8845  0.1200
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.

      2        [36m1.0824[0m  0.1190
      3        [36m1.0376[0m  0.1220
      4        1.0391  0.1300
      5        [36m1.0196[0m  0.1160
      6        [36m1.0034[0m  0.1230
      7        [36m0.9997[0m  0.1170
      8        1.0109  0.1210
      9        1.0044  0.1160
     10        1.0050  0.1210
     11        [36m0.9985[0m  0.1190
     12        [36m0.9924[0m  0.1230
     13        [36m0.9892[0m  0.1170
     14        0.9946  0.1190
     15        0.9929  0.1230
     16        [36m0.9866[0m  0.1220
     17        0.9919  0.1240
     18        0.9871  0.1250
     19        0.9892  0.1210
     20        0.9911  0.1270
     21        0.9899  0.1160
     22        0.9877  0.1150
     23        0.9896  0.1180
     24        0.9890  0.1160
     25        0.9873  0.1160
     26        0.9899  0.1220
     27        0.9888  0.1150
     28        0.9893  0.1180
     29        [36m0.9858[0m  0.1260
     30        0.9910  0.1170
     31        0.9868  0.1250
     32   

      8       11.9568  0.1310
      9       11.9568  0.1260
     10       11.9568  0.1200
     11       11.9568  0.1290
     12       11.9568  0.1350
     13       11.9568  0.1240
     14       11.9568  0.1370
     15       11.9568  0.1370
     16       11.9568  0.1330
     17       11.9568  0.1340
     18       11.9568  0.1390
     19       11.9568  0.1240
     20       11.9568  0.1230
     21       11.9568  0.1250
     22       11.9568  0.1240
     23       11.9568  0.1300
     24       11.9568  0.1230
     25       11.9568  0.1240
     26       11.9568  0.1330
     27       11.9568  0.1230
     28       11.9568  0.1220
     29       11.9568  0.1390
     30       11.9568  0.1290
     31       11.9568  0.1220
     32       11.9568  0.1410
     33       11.9568  0.1480
     34       11.9568  0.1250
     35       11.9568  0.1220
     36       11.9568  0.1210
     37       11.9568  0.1200
     38       11.9568  0.1350
     39       11.9568  0.1220
     40       11.9568  0.1180
  epoch   

     22        [36m1.3869[0m  0.1190
     23        [36m1.3869[0m  0.1210
     24        [36m1.3869[0m  0.1240
     25        [36m1.3869[0m  0.1210
     26        [36m1.3869[0m  0.1180
     27        [36m1.3869[0m  0.1230
     28        [36m1.3869[0m  0.1150
     29        [36m1.3869[0m  0.1220
     30        [36m1.3869[0m  0.1220
     31        [36m1.3869[0m  0.1210
     32        [36m1.3869[0m  0.1290
     33        [36m1.3869[0m  0.1190
     34        [36m1.3869[0m  0.1160
     35        [36m1.3869[0m  0.1210
     36        [36m1.3869[0m  0.1160
     37        [36m1.3869[0m  0.1180
     38        [36m1.3869[0m  0.1190
     39        1.3869  0.1220
     40        [36m1.3869[0m  0.1210
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5514[0m  0.1150
      2        [36m1.3869[0m  0.1220
      3        1.3869  0.1320
      4        1.3869  0.1190
      5        1.3869  0.1400
      6        1.3869  0.1320
      7   

     32        1.3868  0.1210
     33        1.3868  0.1150
     34        1.3868  0.1180
     35        1.3868  0.1180
     36        1.3868  0.1150
     37        1.3868  0.1190
     38        1.3868  0.1310
     39        1.3868  0.1260
     40        1.3868  0.1260
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9767[0m  0.1260
      2       [36m11.9589[0m  0.1280
      3       11.9589  0.1180
      4       11.9589  0.1220
      5       11.9589  0.1290
      6       11.9589  0.1240
      7       11.9589  0.1210
      8       11.9589  0.1210
      9       11.9589  0.1240
     10       11.9589  0.1250
     11       11.9589  0.1230
     12       11.9589  0.1190
     13       11.9589  0.1220
     14       11.9589  0.1210
     15       11.9589  0.1210
     16       11.9589  0.1180
     17       11.9589  0.1210
     18       11.9589  0.1210
     19       11.9589  0.1190
     20       11.9589  0.1210
     21       11.9589  0.1190
     22       11.9589 

      4        [36m9.2128[0m  0.1380
      5        [36m1.3913[0m  0.1220
      6        1.3913  0.1190
      7        1.3913  0.1250
      8        1.3913  0.1270
      9        1.3913  0.1180
     10        1.3913  0.1220
     11        1.3913  0.1180
     12        1.3913  0.1170
     13        1.3913  0.1150
     14        1.3913  0.1250
     15        1.3913  0.1240
     16        1.3913  0.1220
     17        1.3913  0.1180
     18        1.3913  0.1350
     19        1.3913  0.1220
     20        1.3913  0.1230
     21        1.3913  0.1220
     22        1.3913  0.1150
     23        1.3913  0.1280
     24        1.3913  0.1290
     25        1.3913  0.1210
     26        1.3913  0.1150
     27        1.3913  0.1240
     28        1.3913  0.1190
     29        1.3913  0.1270
     30        1.3913  0.1290
     31        1.3913  0.1200
     32        1.3913  0.1200
     33        1.3913  0.1220
     34        1.3913  0.1178
     35        1.3913  0.1160
     36        1.3913 

     16        1.3904  0.1170
     17        1.3904  0.1250
     18        1.3904  0.1280
     19        1.3904  0.1220
     20        1.3904  0.1210
     21        1.3904  0.1230
     22        1.3904  0.1160
     23        1.3904  0.1340
     24        1.3904  0.1300
     25        1.3904  0.1221
     26        1.3904  0.1180
     27        1.3904  0.1270
     28        1.3904  0.1190
     29        1.3904  0.1190
     30        1.3904  0.1220
     31        1.3904  0.1280
     32        1.3904  0.1300
     33        1.3904  0.1200
     34        1.3904  0.1210
     35        1.3904  0.1250
     36        1.3904  0.1190
     37        1.3904  0.1150
     38        1.3904  0.1190
     39        1.3904  0.1190
     40        1.3904  0.1180
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m5.3060[0m  0.1170
      2        [36m3.8023[0m  0.1150
      3        [36m1.3902[0m  0.1140
      4        1.3903  0.1190
      5        1.3903  0.1210
      6      

     26        [36m0.9477[0m  0.1150
     27        [36m0.9442[0m  0.1240
     28        [36m0.9375[0m  0.1160
     29        0.9486  0.1200
     30        [36m0.9274[0m  0.1140
     31        0.9326  0.1140
     32        [36m0.9272[0m  0.1190
     33        0.9318  0.1140
     34        0.9298  0.1140
     35        0.9280  0.1180
     36        0.9335  0.1260
     37        [36m0.9247[0m  0.1200
     38        0.9258  0.1190
     39        [36m0.9224[0m  0.1180
     40        0.9234  0.1140
     41        0.9241  0.1220
     42        0.9239  0.1130
     43        0.9241  0.1260
     44        0.9244  0.1290
     45        0.9247  0.1190
     46        0.9232  0.1210
     47        [36m0.9214[0m  0.1160
     48        0.9221  0.1150
     49        [36m0.9214[0m  0.1210
     50        0.9218  0.1154
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5405[0m  0.1170
      2        [36m1.4012[0m  0.1150
      3        [36m1.3948[0m 

     48        [36m1.3864[0m  0.1220
     49        [36m1.3864[0m  0.1180
     50        [36m1.3864[0m  0.1160
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5094[0m  0.1140
      2        [36m1.3898[0m  0.1190
      3        [36m1.3879[0m  0.1170
      4        [36m1.3871[0m  0.1160
      5        [36m1.3867[0m  0.1130
      6        [36m1.3865[0m  0.1150
      7        [36m1.3864[0m  0.1130
      8        [36m1.3864[0m  0.1180
      9        [36m1.3864[0m  0.1240
     10        [36m1.3864[0m  0.1140
     11        [36m1.3864[0m  0.1150
     12        [36m1.3864[0m  0.1170
     13        1.3864  0.1150
     14        [36m1.3864[0m  0.1170
     15        [36m1.3863[0m  0.1150
     16        [36m1.3863[0m  0.1190
     17        1.3864  0.1140
     18        1.3863  0.1180
     19        1.3863  0.1120
     20        1.3863  0.1180
     21        1.3864  0.1170
     22        1.3864  0.1210
     23        1.3863  0.113

     27        [36m1.3864[0m  0.1200
     28        [36m1.3864[0m  0.1180
     29        1.3864  0.1190
     30        1.3864  0.1130
     31        1.3864  0.1150
     32        1.3864  0.1140
     33        1.3864  0.1130
     34        1.3864  0.1120
     35        1.3864  0.1130
     36        1.3864  0.1150
     37        1.3864  0.1160
     38        1.3864  0.1210
     39        1.3864  0.1200
     40        1.3864  0.1150
     41        1.3864  0.1150
     42        1.3864  0.1190
     43        1.3864  0.1120
     44        1.3864  0.1170
     45        1.3864  0.1170
     46        1.3864  0.1130
     47        [36m1.3864[0m  0.1140
     48        1.3864  0.1120
     49        1.3864  0.1120
     50        1.3864  0.1140
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4197[0m  0.1170
      2        [36m1.3920[0m  0.1110
      3        [36m1.3890[0m  0.1160
      4        [36m1.3879[0m  0.1150
      5        [36m1.3873[0m  0.116

     48        [36m1.3869[0m  0.1120
     49        [36m1.3869[0m  0.1210
     50        [36m1.3869[0m  0.1200
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.3929[0m  0.1280
      2        [36m1.3869[0m  0.1200
      3        [36m1.3868[0m  0.1190
      4        [36m1.3868[0m  0.1120
      5        [36m1.3868[0m  0.1180
      6        [36m1.3868[0m  0.1150
      7        [36m1.3867[0m  0.1250
      8        [36m1.3867[0m  0.1160
      9        [36m1.3867[0m  0.1250
     10        [36m1.3867[0m  0.1280
     11        1.3867  0.1170
     12        1.3867  0.1140
     13        [36m1.3867[0m  0.1160
     14        1.3867  0.1130
     15        [36m1.3866[0m  0.1160
     16        [36m1.3866[0m  0.1150
     17        [36m1.3866[0m  0.1160
     18        [36m1.3866[0m  0.1150
     19        [36m1.3866[0m  0.1150
     20        1.3866  0.1130
     21        [36m1.3866[0m  0.1200
     22        [36m1.3866[0m  0.1130
 

     28        [36m1.3869[0m  0.1180
     29        [36m1.3869[0m  0.1150
     30        [36m1.3869[0m  0.1120
     31        [36m1.3869[0m  0.1210
     32        [36m1.3869[0m  0.1150
     33        [36m1.3869[0m  0.1160
     34        1.3869  0.1160
     35        1.3869  0.1120
     36        1.3869  0.1120
     37        1.3869  0.1240
     38        1.3869  0.1190
     39        1.3869  0.1200
     40        1.3869  0.1210
     41        1.3869  0.1170
     42        1.3869  0.1180
     43        1.3869  0.1190
     44        1.3869  0.1130
     45        1.3869  0.1110
     46        1.3869  0.1190
     47        1.3869  0.1150
     48        1.3869  0.1130
     49        1.3869  0.1130
     50        1.3869  0.1160
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m10.0918[0m  0.1140
      2        [36m1.3818[0m  0.1220
      3        1.3869  0.1120
      4        1.3869  0.1230
      5        1.3869  0.1150
      6        1.3869  0.129

      9        1.3868  0.1120
     10        1.3868  0.1180
     11        1.3868  0.1130
     12        1.3868  0.1260
     13        1.3868  0.1180
     14        1.3868  0.1150
     15        1.3868  0.1110
     16        1.3868  0.1160
     17        1.3868  0.1150
     18        1.3868  0.1220
     19        1.3868  0.1160
     20        1.3868  0.1230
     21        1.3868  0.1120
     22        1.3868  0.1190
     23        1.3868  0.1190
     24        1.3868  0.1180
     25        1.3868  0.1120
     26        1.3868  0.1120
     27        1.3868  0.1190
     28        1.3868  0.1160
     29        1.3868  0.1120
     30        1.3868  0.1150
     31        1.3868  0.1140
     32        1.3868  0.1230
     33        1.3868  0.1130
     34        1.3868  0.1110
     35        1.3868  0.1120
     36        1.3868  0.1120
     37        1.3868  0.1130
     38        1.3868  0.1130
     39        1.3868  0.1180
     40        1.3868  0.1190
     41        1.3868  0.1256
     42   

     15        1.3901  0.1170
     16        1.3901  0.1150
     17        1.3901  0.1150
     18        1.3901  0.1120
     19        [36m1.3901[0m  0.1110
     20        1.3901  0.1200
     21        1.3901  0.1120
     22        1.3901  0.1120
     23        1.3901  0.1140
     24        1.3901  0.1130
     25        1.3901  0.1130
     26        1.3901  0.1200
     27        1.3901  0.1110
     28        1.3901  0.1140
     29        [36m1.3901[0m  0.1140
     30        1.3901  0.1180
     31        1.3901  0.1130
     32        1.3901  0.1120
     33        1.3901  0.1160
     34        1.3901  0.1180
     35        1.3901  0.1180
     36        1.3901  0.1130
     37        1.3901  0.1130
     38        1.3901  0.1120
     39        [36m1.3901[0m  0.1180
     40        1.3901  0.1140
     41        1.3901  0.1170
     42        1.3901  0.1150
     43        1.3901  0.1110
     44        1.3901  0.1180
     45        1.3901  0.1150
     46        1.3901  0.1120
     47      

     21        1.3900  0.1160
     22        1.3900  0.1120
     23        1.3900  0.1210
     24        1.3900  0.1140
     25        1.3900  0.1200
     26        [36m1.3900[0m  0.1150
     27        1.3900  0.1140
     28        1.3900  0.1160
     29        1.3900  0.1190
     30        1.3900  0.1270
     31        1.3900  0.1150
     32        1.3900  0.1150
     33        1.3900  0.1190
     34        1.3900  0.1210
     35        1.3900  0.1170
     36        1.3900  0.1149
     37        1.3900  0.1176
     38        1.3900  0.1140
     39        1.3900  0.1130
     40        1.3900  0.1110
     41        1.3900  0.1150
     42        1.3900  0.1160
     43        1.3900  0.1200
     44        1.3900  0.1150
     45        1.3900  0.1140
     46        1.3900  0.1140
     47        1.3900  0.1290
     48        1.3900  0.1160
     49        1.3900  0.1190
     50        1.3900  0.1150
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4171[0m 

     27        1.3894  0.1220
     28        1.3894  0.1140
     29        1.3894  0.1160
     30        1.3894  0.1120
     31        1.3894  0.1140
     32        1.3894  0.1130
     33        1.3894  0.1140
     34        1.3894  0.1120
     35        1.3894  0.1150
     36        1.3894  0.1150
     37        1.3894  0.1160
     38        1.3894  0.1140
     39        1.3894  0.1190
     40        1.3894  0.1190
     41        1.3894  0.1210
     42        1.3894  0.1150
     43        1.3894  0.1120
     44        1.3894  0.1150
     45        1.3894  0.1120
     46        1.3894  0.1120
     47        1.3894  0.1120
     48        1.3894  0.1130
     49        1.3894  0.1130
     50        1.3894  0.1160
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4036[0m  0.1190
      2        [36m1.3913[0m  0.1150
      3        1.3913  0.1190
      4        1.3913  0.1130
      5        1.3913  0.1120
      6        1.3913  0.1140
      7        1.3913 

     29        [36m1.3863[0m  0.1250
     30        [36m1.3863[0m  0.1160
     31        [36m1.3863[0m  0.1140
     32        [36m1.3863[0m  0.1150
     33        [36m1.3863[0m  0.1220
     34        [36m1.3863[0m  0.1220
     35        1.3863  0.1130
     36        1.3863  0.1130
     37        [36m1.3863[0m  0.1200
     38        [36m1.3863[0m  0.1170
     39        [36m1.3863[0m  0.1160
     40        [36m1.3863[0m  0.1160
     41        [36m1.3863[0m  0.1230
     42        [36m1.3863[0m  0.1180
     43        [36m1.3863[0m  0.1170
     44        [36m1.3863[0m  0.1200
     45        [36m1.3863[0m  0.1180
     46        [36m1.3863[0m  0.1140
     47        [36m1.3863[0m  0.1190
     48        [36m1.3863[0m  0.1190
     49        [36m1.3863[0m  0.1190
     50        [36m1.3863[0m  0.1160
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7151[0m  0.1120
      2        [36m1.3441[0m  0.1160
      3        [36m1.

      4        [36m1.3546[0m  0.1170
      5        [36m1.2982[0m  0.1180
      6        [36m1.2395[0m  0.1180
      7        [36m1.1760[0m  0.1150
      8        [36m1.1463[0m  0.1200
      9        [36m1.1422[0m  0.1130
     10        [36m1.0931[0m  0.1140
     11        [36m1.0556[0m  0.1140
     12        [36m1.0412[0m  0.1190
     13        [36m1.0326[0m  0.1150
     14        [36m1.0201[0m  0.1210
     15        1.0351  0.1150
     16        1.0297  0.1220
     17        [36m0.9984[0m  0.1140
     18        1.0171  0.1130
     19        1.0029  0.1200
     20        [36m0.9917[0m  0.1200
     21        [36m0.9836[0m  0.1250
     22        1.0275  0.1210
     23        0.9890  0.1250
     24        0.9858  0.1150
     25        1.0061  0.1170
     26        0.9961  0.1200
     27        1.0076  0.1140
     28        0.9929  0.1180
     29        [36m0.9745[0m  0.1280
     30        0.9902  0.1190
     31        0.9919  0.1170
     32        0.9783  0.

     33        1.3863  0.1160
     34        1.3863  0.1270
     35        1.3863  0.1250
     36        1.3863  0.1210
     37        1.3863  0.1216
     38        1.3863  0.1180
     39        1.3863  0.1170
     40        1.3863  0.1180
     41        1.3863  0.1170
     42        1.3863  0.1160
     43        1.3863  0.1140
     44        [36m1.3814[0m  0.1130
     45        [36m1.3246[0m  0.1130
     46        [36m1.2309[0m  0.1160
     47        [36m1.1774[0m  0.1160
     48        [36m1.1376[0m  0.1170
     49        [36m1.0976[0m  0.1170
     50        [36m1.0844[0m  0.1150
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4335[0m  0.1130
      2        [36m1.2837[0m  0.1200
      3        [36m1.1962[0m  0.1170
      4        [36m1.1058[0m  0.1140
      5        [36m1.0541[0m  0.1210
      6        [36m1.0239[0m  0.1150
      7        [36m1.0065[0m  0.1190
      8        [36m0.9958[0m  0.1140
      9        [36m0.989

     20        0.9775  0.1220
     21        0.9780  0.1270
     22        0.9704  0.1271
     23        0.9813  0.1220
     24        0.9735  0.1220
     25        0.9795  0.1190
     26        0.9747  0.1150
     27        0.9723  0.1190
     28        0.9731  0.1138
     29        0.9734  0.1160
     30        0.9727  0.1150
     31        0.9743  0.1170
     32        [36m0.9679[0m  0.1190
     33        0.9811  0.1200
     34        0.9728  0.1230
     35        0.9783  0.1280
     36        0.9733  0.1170
     37        0.9786  0.1150
     38        0.9680  0.1160
     39        0.9729  0.1150
     40        0.9756  0.1160
     41        0.9701  0.1150
     42        0.9722  0.1160
     43        0.9726  0.1210
     44        0.9753  0.1160
     45        0.9727  0.1250
     46        0.9701  0.1180
     47        0.9737  0.1210
     48        0.9707  0.1200
     49        0.9771  0.1200
     50        0.9725  0.1150
  epoch    train_loss     dur
-------  ------------  ------
 

      2        [36m1.3871[0m  0.1170
      3        [36m1.3871[0m  0.1150
      4        [36m1.3871[0m  0.1200
      5        [36m1.3870[0m  0.1200
      6        [36m1.3870[0m  0.1160
      7        [36m1.3870[0m  0.1220
      8        [36m1.3870[0m  0.1230
      9        [36m1.3870[0m  0.1370
     10        [36m1.3870[0m  0.1290
     11        [36m1.3870[0m  0.1300
     12        [36m1.3870[0m  0.1160
     13        [36m1.3870[0m  0.1210
     14        [36m1.3870[0m  0.1232
     15        [36m1.3870[0m  0.1150
     16        [36m1.3870[0m  0.1220
     17        [36m1.3870[0m  0.1200
     18        [36m1.3870[0m  0.1170
     19        [36m1.3870[0m  0.1250
     20        [36m1.3870[0m  0.1200
     21        [36m1.3870[0m  0.1170
     22        [36m1.3870[0m  0.1210
     23        [36m1.3870[0m  0.1280
     24        [36m1.3870[0m  0.1200
     25        [36m1.3870[0m  0.1150
     26        [36m1.3870[0m  0.1190
     27        [36m1.387

     38        1.3869  0.1230
     39        1.3869  0.1260
     40        1.3869  0.1180
     41        1.3869  0.1280
     42        1.3869  0.1180
     43        1.3869  0.1160
     44        1.3869  0.1200
     45        1.3869  0.1220
     46        1.3869  0.1330
     47        [36m1.3869[0m  0.1210
     48        [36m1.3865[0m  0.1260
     49        [36m1.3831[0m  0.1180
     50        [36m1.3787[0m  0.1180
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9103[0m  0.1200
      2       11.9568  0.1320
      3       11.9568  0.1170
      4       11.9568  0.1170
      5       11.9568  0.1150
      6        [36m5.6473[0m  0.1150
      7        [36m1.3874[0m  0.1150
      8        [36m1.3869[0m  0.1170
      9        1.3869  0.1170
     10        1.3869  0.1220
     11        1.3869  0.1210
     12        1.3869  0.1210
     13        1.3869  0.1170
     14        1.3869  0.1250
     15        [36m1.3869[0m  0.1160
     16        [36

     34        1.3869  0.1200
     35        1.3869  0.1210
     36        1.3869  0.1210
     37        1.3869  0.1250
     38        1.3869  0.1237
     39        1.3869  0.1230
     40        1.3869  0.1230
     41        1.3869  0.1210
     42        1.3869  0.1240
     43        1.3869  0.1290
     44        1.3869  0.1174
     45        1.3869  0.1201
     46        1.3869  0.1144
     47        1.3869  0.1153
     48        1.3869  0.1230
     49        1.3869  0.1187
     50        1.3869  0.1210
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4464[0m  0.1150
      2        [36m1.3868[0m  0.1280
      3        [36m1.3868[0m  0.1160
      4        [36m1.3868[0m  0.1230
      5        [36m1.3868[0m  0.1230
      6        [36m1.3868[0m  0.1240
      7        1.3868  0.1190
      8        1.3868  0.1360
      9        1.3868  0.1150
     10        1.3868  0.1200
     11        1.3868  0.1180
     12        1.3868  0.1250
     13        1

     37        1.3911  0.1200
     38        1.3911  0.1180
     39        1.3911  0.1180
     40        1.3911  0.1170
     41        1.3911  0.1210
     42        1.3911  0.1210
     43        1.3911  0.1260
     44        1.3911  0.1175
     45        1.3911  0.1140
     46        1.3911  0.1220
     47        1.3911  0.1210
     48        1.3911  0.1180
     49        1.3911  0.1210
     50        1.3911  0.1170
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8845[0m  0.1300
      2       11.9568  0.1270
      3       11.9568  0.1230
      4       11.9568  0.1210
      5       11.9568  0.1250
      6       11.9568  0.1180
      7       11.9568  0.1200
      8       11.9568  0.1250
      9       11.9568  0.1240
     10       11.9568  0.1290
     11       11.9568  0.1190
     12       11.9568  0.1280
     13       11.9568  0.1200
     14       11.9568  0.1280
     15       11.9568  0.1204
     16       11.9105  0.1210
     17       11.9568  0.1320
 

     43        1.3910  0.1210
     44        1.3910  0.1200
     45        1.3910  0.1180
     46        1.3910  0.1150
     47        1.3910  0.1160
     48        1.3910  0.1280
     49        1.3910  0.1210
     50        1.3910  0.1180
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5267[0m  0.1160
      2        [36m1.4536[0m  0.1220
      3        [36m1.3920[0m  0.1150
      4        [36m1.3920[0m  0.1180
      5        [36m1.3920[0m  0.1260
      6        [36m1.3920[0m  0.1240
      7        1.3920  0.1160
      8        1.3920  0.1180
      9        1.3920  0.1160
     10        1.3920  0.1180
     11        1.3920  0.1280
     12        1.3920  0.1210
     13        1.3920  0.1200
     14        1.3920  0.1250
     15        1.3920  0.1270
     16        1.3920  0.1180
     17        1.3920  0.1180
     18        1.3920  0.1250
     19        [36m1.3920[0m  0.1170
     20        1.3920  0.1190
     21        1.3920  0.1190
     22

     49        1.3903  0.1270
     50        1.3903  0.1200
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m7.8040[0m  0.1260
      2        [36m4.2037[0m  0.1200
      3        7.2431  0.1190
      4        7.4568  0.1220
      5        5.2434  0.1190
      6        6.5308  0.1180
      7        9.5042  0.1200
      8        6.7473  0.1190
      9        [36m1.3958[0m  0.1250
     10        [36m1.3904[0m  0.1260
     11        1.3905  0.1180
     12        1.3905  0.1170
     13        1.3905  0.1150
     14        1.3905  0.1160
     15        1.3905  0.1200
     16        1.3905  0.1150
     17        1.3905  0.1180
     18        1.3905  0.1180
     19        1.3905  0.1200
     20        1.3905  0.1170
     21        1.3905  0.1140
     22        1.3905  0.1210
     23        1.3905  0.1230
     24        1.3905  0.1250
     25        1.3905  0.1170
     26        1.3905  0.1160
     27        1.3905  0.1230
     28        1.3905  0.1210
    

     29        [36m0.8900[0m  0.1180
     30        [36m0.8882[0m  0.1254
     31        [36m0.8862[0m  0.1230
     32        [36m0.8853[0m  0.1220
     33        0.8860  0.1280
     34        0.8856  0.1290
     35        0.8861  0.1170
     36        [36m0.8839[0m  0.1220
     37        [36m0.8824[0m  0.1240
     38        [36m0.8814[0m  0.1210
     39        [36m0.8798[0m  0.1240
     40        [36m0.8797[0m  0.1160
     41        0.8816  0.1220
     42        0.8809  0.1230
     43        [36m0.8796[0m  0.1180
     44        [36m0.8783[0m  0.1190
     45        0.8789  0.1180
     46        0.8800  0.1190
     47        0.8802  0.1270
     48        0.8823  0.1200
     49        0.8920  0.1220
     50        0.8876  0.1220
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5286[0m  0.1210
      2        [36m1.2935[0m  0.1230
      3        [36m1.1937[0m  0.1200
      4        [36m1.1010[0m  0.1270
      5        [36m1.032

     50        [36m0.9231[0m  0.1242
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4735[0m  0.1210
      2        [36m1.3474[0m  0.1250
      3        [36m1.2982[0m  0.1250
      4        [36m1.1903[0m  0.1280
      5        [36m1.1263[0m  0.1160
      6        [36m1.0827[0m  0.1190
      7        [36m1.0555[0m  0.1190
      8        [36m1.0525[0m  0.1210
      9        [36m1.0251[0m  0.1251
     10        [36m1.0150[0m  0.1250
     11        [36m1.0098[0m  0.1230
     12        [36m0.9980[0m  0.1270
     13        [36m0.9792[0m  0.1200
     14        [36m0.9775[0m  0.1260
     15        [36m0.9741[0m  0.1200
     16        0.9755  0.1220
     17        [36m0.9636[0m  0.1180
     18        0.9829  0.1250
     19        0.9647  0.1220
     20        [36m0.9636[0m  0.1280
     21        0.9727  0.1160
     22        [36m0.9521[0m  0.1180
     23        [36m0.9473[0m  0.1210
     24        [36m0.9459[0m  0.1230
 

     31        [36m0.9653[0m  0.1200
     32        0.9654  0.1190
     33        [36m0.9650[0m  0.1150
     34        0.9658  0.1160
     35        [36m0.9642[0m  0.1180
     36        0.9651  0.1170
     37        0.9652  0.1230
     38        0.9650  0.1320
     39        0.9651  0.1220
     40        0.9649  0.1240
     41        0.9648  0.1230
     42        0.9646  0.1210
     43        0.9649  0.1180
     44        0.9646  0.1220
     45        [36m0.9638[0m  0.1170
     46        0.9648  0.1200
     47        0.9640  0.1190
     48        0.9658  0.1170
     49        0.9641  0.1170
     50        0.9650  0.1200
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.8587[0m  0.1230
      2        [36m1.1702[0m  0.1246
      3        [36m1.0696[0m  0.1200
      4        [36m1.0322[0m  0.1280
      5        [36m1.0113[0m  0.1250
      6        [36m0.9949[0m  0.1230
      7        [36m0.9895[0m  0.1175
      8        [36m0.9726[0m 

     33        1.3868  0.1160
     34        1.3868  0.1200
     35        1.3868  0.1180
     36        1.3868  0.1220
     37        1.3868  0.1140
     38        1.3868  0.1260
     39        1.3868  0.1220
     40        1.3868  0.1200
     41        1.3868  0.1160
     42        1.3868  0.1290
     43        1.3868  0.1160
     44        1.3868  0.1240
     45        1.3868  0.1250
     46        1.3868  0.1240
     47        1.3868  0.1180
     48        1.3868  0.1240
     49        1.3868  0.1320
     50        1.3868  0.1200
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5424[0m  0.1140
      2        [36m1.3858[0m  0.1210
      3        1.3871  0.1210
      4        1.3871  0.1260
      5        1.3871  0.1170
      6        1.3871  0.1240
      7        1.3871  0.1280
      8        1.3871  0.1240
      9        1.3871  0.1250
     10        1.3871  0.1230
     11        1.3871  0.1180
     12        1.3871  0.1210
     13        1.3871 

     43        1.3868  0.1200
     44        1.3868  0.1160
     45        1.3868  0.1160
     46        1.3868  0.1320
     47        1.3868  0.1280
     48        1.3868  0.1240
     49        1.3868  0.1160
     50        1.3868  0.1210
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9127[0m  0.1350
      2       11.9568  0.1270
      3       11.9568  0.1200
      4       11.9568  0.1190
      5       11.9568  0.1170
      6       11.9568  0.1230
      7       11.9568  0.1320
      8       11.9568  0.1200
      9       11.9568  0.1270
     10       11.9568  0.1250
     11       11.9568  0.1220
     12       [36m10.5916[0m  0.1290
     13        [36m1.3870[0m  0.1170
     14        [36m1.3869[0m  0.1210
     15        [36m1.3869[0m  0.1170
     16        [36m1.3869[0m  0.1210
     17        1.3869  0.1260
     18        1.3869  0.1230
     19        [36m1.3869[0m  0.1177
     20        1.3869  0.1300
     21        1.3869  0.1210
     22

     50        1.3868  0.1240
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9136[0m  0.1258
      2        [36m4.9794[0m  0.1300
      3        [36m1.3868[0m  0.1160
      4        1.3869  0.1250
      5        1.3869  0.1180
      6        1.3869  0.1250
      7        1.3869  0.1270
      8        1.3869  0.1270
      9        1.3869  0.1190
     10        1.3869  0.1220
     11        1.3869  0.1150
     12        1.3869  0.1200
     13        1.3869  0.1180
     14        1.3869  0.1270
     15        1.3869  0.1170
     16        1.3869  0.1180
     17        1.3869  0.1230
     18        1.3869  0.1220
     19        1.3869  0.1170
     20        1.3869  0.1150
     21        1.3869  0.1200
     22        1.3869  0.1280
     23        1.3869  0.1280
     24        1.3869  0.1270
     25        1.3869  0.1240
     26        1.3869  0.1200
     27        1.3869  0.1260
     28        1.3869  0.1230
     29        1.3869  0.1300
     30      

      6       11.9568  0.1310
      7       11.9568  0.1230
      8       11.9568  0.1240
      9       11.9568  0.1200
     10       11.9568  0.1180
     11       11.9568  0.1210
     12       11.9568  0.1260
     13       11.9568  0.1230
     14       11.9568  0.1230
     15       11.9568  0.1270
     16       11.9568  0.1190
     17       11.9568  0.1260
     18       11.9568  0.1210
     19       11.9568  0.1230
     20       11.9568  0.1220
     21       11.9568  0.1160
     22        [36m7.7539[0m  0.1190
     23        [36m1.3912[0m  0.1290
     24        [36m1.3911[0m  0.1290
     25        [36m1.3911[0m  0.1220
     26        [36m1.3911[0m  0.1210
     27        1.3911  0.1210
     28        1.3911  0.1190
     29        [36m1.3911[0m  0.1220
     30        1.3911  0.1150
     31        1.3911  0.1190
     32        1.3911  0.1180
     33        [36m1.3911[0m  0.1250
     34        1.3911  0.1180
     35        1.3911  0.1280
     36        1.3911  0.1240
     37

     12        1.3910  0.1150
     13        1.3910  0.1160
     14        1.3910  0.1220
     15        1.3910  0.1210
     16        1.3910  0.1210
     17        1.3910  0.1240
     18        1.3910  0.1200
     19        1.3910  0.1200
     20        1.3910  0.1260
     21        1.3910  0.1210
     22        1.3910  0.1160
     23        1.3910  0.1240
     24        1.3910  0.1200
     25        1.3910  0.1200
     26        1.3910  0.1200
     27        1.3910  0.1240
     28        1.3910  0.1250
     29        1.3910  0.1170
     30        1.3910  0.1210
     31        1.3910  0.1220
     32        1.3910  0.1140
     33        1.3910  0.1190
     34        1.3910  0.1180
     35        1.3910  0.1180
     36        1.3910  0.1170
     37        1.3910  0.1180
     38        1.3910  0.1180
     39        1.3910  0.1210
     40        1.3910  0.1190
     41        1.3910  0.1160
     42        1.3910  0.1160
     43        1.3910  0.1220
     44        1.3910  0.1200
     45   

     16        1.3903  0.1170
     17        1.3903  0.1220
     18        1.3903  0.1210
     19        1.3903  0.1210
     20        1.3903  0.1220
     21        1.3903  0.1160
     22        1.3903  0.1160
     23        1.3903  0.1180
     24        1.3903  0.1170
     25        1.3903  0.1230
     26        1.3903  0.1160
     27        1.3903  0.1210
     28        1.3903  0.1250
     29        1.3903  0.1230
     30        1.3903  0.1220
     31        1.3903  0.1160
     32        1.3903  0.1240
     33        1.3903  0.1210
     34        1.3903  0.1180
     35        1.3903  0.1220
     36        1.3903  0.1220
     37        1.3903  0.1140
     38        1.3903  0.1230
     39        1.3903  0.1210
     40        1.3903  0.1150
     41        1.3903  0.1160
     42        1.3903  0.1170
     43        1.3903  0.1190
     44        1.3903  0.1230
     45        1.3903  0.1170
     46        1.3903  0.1190
     47        1.3903  0.1250
     48        1.3903  0.1180
     49   

      3        [36m0.9971[0m  0.1320
      4        [36m0.9686[0m  0.1340
      5        [36m0.9441[0m  0.1300
      6        [36m0.9336[0m  0.1230
      7        0.9339  0.1260
      8        [36m0.9291[0m  0.1250
      9        [36m0.9263[0m  0.1200
     10        0.9306  0.1290
     11        [36m0.9145[0m  0.1260
     12        [36m0.9140[0m  0.1300
     13        [36m0.9012[0m  0.1260
     14        [36m0.8972[0m  0.1310
     15        0.8973  0.1260
     16        0.8986  0.1330
     17        0.9022  0.1280
     18        0.9043  0.1280
     19        0.9003  0.1280
     20        [36m0.8892[0m  0.1220
     21        [36m0.8862[0m  0.1300
     22        [36m0.8859[0m  0.1250
     23        [36m0.8839[0m  0.1240
     24        [36m0.8825[0m  0.1190
     25        0.8841  0.1230
     26        0.8839  0.1230
     27        [36m0.8793[0m  0.1260
     28        0.8799  0.1210
     29        0.8821  0.1250
     30        [36m0.8746[0m  0.1220
     31

     26        0.8960  0.1210
     27        [36m0.8928[0m  0.1180
     28        0.8931  0.1250
     29        [36m0.8875[0m  0.1170
     30        0.8877  0.1200
     31        [36m0.8863[0m  0.1250
     32        0.8886  0.1220
     33        [36m0.8836[0m  0.1180
     34        0.8863  0.1170
     35        [36m0.8830[0m  0.1220
     36        [36m0.8796[0m  0.1240
     37        [36m0.8756[0m  0.1300
     38        0.8778  0.1200
     39        0.8800  0.1290
     40        0.8807  0.1250
     41        0.8790  0.1250
     42        0.8761  0.1220
     43        0.8787  0.1270
     44        0.8760  0.1250
     45        [36m0.8685[0m  0.1240
     46        0.8757  0.1240
     47        0.8747  0.1230
     48        0.8720  0.1490
     49        0.8703  0.1300
     50        0.8713  0.1380
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5104[0m  0.1290
      2        [36m1.2449[0m  0.1360
      3        [36m1.0980[0m  0.1620
 

      7        [36m0.9766[0m  0.1180
      8        [36m0.9759[0m  0.1230
      9        [36m0.9724[0m  0.1160
     10        [36m0.9706[0m  0.1290
     11        [36m0.9684[0m  0.1210
     12        0.9698  0.1310
     13        0.9695  0.1320
     14        [36m0.9666[0m  0.1300
     15        0.9690  0.1350
     16        0.9677  0.1330
     17        0.9672  0.1260
     18        0.9671  0.1240
     19        0.9666  0.1230
     20        0.9672  0.1277
     21        0.9668  0.1240
     22        [36m0.9663[0m  0.1290
     23        0.9665  0.1240
     24        0.9680  0.1210
     25        0.9664  0.1210
     26        0.9666  0.1330
     27        0.9665  0.1190
     28        0.9665  0.1190
     29        [36m0.9661[0m  0.1300
     30        0.9666  0.1250
     31        0.9668  0.1260
     32        0.9667  0.1240
     33        0.9667  0.1230
     34        0.9677  0.1250
     35        0.9662  0.1480
     36        [36m0.9659[0m  0.1460
     37        [36

      2       11.9568  0.1380
      3       11.9568  0.1270
      4       11.9568  0.1280
      5       11.9568  0.1260
      6       11.9568  0.1230
      7       11.9568  0.1330
      8       11.9568  0.1300
      9       11.9568  0.1410
     10       11.9568  0.1270
     11       11.9568  0.1230
     12       11.9568  0.1290
     13       11.9568  0.1250
     14       11.9568  0.1290
     15       11.9568  0.1220
     16       11.9568  0.1250
     17       11.9568  0.1400
     18       11.9568  0.1260
     19       11.9568  0.1330
     20       11.9568  0.1310
     21       11.9568  0.1243
     22       11.9568  0.1260
     23       11.9568  0.1292
     24       11.9568  0.1338
     25       11.9568  0.1290
     26       11.9568  0.1340
     27       11.9568  0.1280
     28       11.9568  0.1330
     29       11.9568  0.1400
     30       11.9568  0.1280
     31       11.9568  0.1340
     32       11.9568  0.1290
     33       11.9568  0.1380
     34       11.9568  0.1270
     35   

  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9586[0m  0.1300
      2       [36m11.9547[0m  0.1330
      3       11.9547  0.1300
      4       11.9547  0.1250
      5       11.9547  0.1280
      6       [36m11.9547[0m  0.1250
      7        [36m4.1082[0m  0.1180
      8        [36m1.3868[0m  0.1220
      9        1.3868  0.1200
     10        1.3868  0.1220
     11        1.3868  0.1220
     12        1.3868  0.1180
     13        1.3868  0.1230
     14        1.3868  0.1250
     15        1.3868  0.1260
     16        1.3868  0.1170
     17        1.3868  0.1250
     18        1.3868  0.1230
     19        1.3868  0.1200
     20        1.3868  0.1290
     21        1.3868  0.1210
     22        1.3868  0.1270
     23        1.3868  0.1180
     24        1.3868  0.1195
     25        1.3868  0.1210
     26        1.3868  0.1210
     27        1.3868  0.1210
     28        1.3868  0.1270
     29        1.3868  0.1300
     30        1.3868  0.

      4        [36m1.3868[0m  0.1285
      5        1.3868  0.1230
      6        1.3868  0.1250
      7        1.3868  0.1270
      8        1.3868  0.1220
      9        1.3868  0.1230
     10        1.3868  0.1260
     11        1.3868  0.1230
     12        1.3868  0.1330
     13        [36m1.3868[0m  0.1270
     14        1.3868  0.1250
     15        1.3868  0.1240
     16        1.3868  0.1280
     17        1.3868  0.1280
     18        1.3868  0.1230
     19        1.3868  0.1350
     20        1.3868  0.1310
     21        1.3868  0.1230
     22        1.3868  0.1290
     23        1.3868  0.1310
     24        1.3868  0.1250
     25        1.3868  0.1280
     26        1.3868  0.1200
     27        1.3868  0.1300
     28        1.3868  0.1250
     29        1.3868  0.1300
     30        1.3868  0.1310
     31        1.3868  0.1230
     32        1.3868  0.1486
     33        1.3868  0.1350
     34        1.3868  0.1280
     35        1.3868  0.1310
     36        1.3868 

     11       11.9568  0.1314
     12       11.9568  0.1360
     13       12.0034  0.1320
     14       11.9568  0.1293
     15       11.9568  0.1310
     16       11.9568  0.1320
     17       11.9568  0.1230
     18       11.9568  0.1260
     19       11.9568  0.1290
     20       11.9568  0.1360
     21       11.9568  0.1323
     22       11.9568  0.1292
     23       11.9568  0.1270
     24       11.9568  0.1260
     25       11.9568  0.1312
     26       11.9568  0.1310
     27       11.9568  0.1250
     28       11.9568  0.1340
     29       11.9568  0.1360
     30       11.9568  0.1380
     31       11.9568  0.1350
     32       11.9568  0.1330
     33       11.9568  0.1290
     34       11.9568  0.1290
     35       [36m11.4838[0m  0.1320
     36        [36m1.3910[0m  0.1290
     37        1.3911  0.1300
     38        1.3911  0.1250
     39        1.3911  0.1260
     40        1.3911  0.1330
     41        1.3911  0.1280
     42        1.3911  0.1270
     43        1.3911 

     14        1.3910  0.1310
     15        1.3910  0.1280
     16        1.3910  0.1260
     17        1.3910  0.1280
     18        1.3910  0.1300
     19        1.3910  0.1230
     20        1.3910  0.1290
     21        1.3910  0.1280
     22        1.3910  0.1280
     23        1.3910  0.1290
     24        1.3910  0.1210
     25        1.3910  0.1320
     26        1.3910  0.1320
     27        1.3910  0.1280
     28        1.3910  0.1280
     29        1.3910  0.1230
     30        1.3910  0.1250
     31        [36m1.3910[0m  0.1290
     32        1.3910  0.1270
     33        1.3910  0.1300
     34        1.3910  0.1310
     35        1.3910  0.1300
     36        1.3910  0.1270
     37        1.3910  0.1350
     38        1.3910  0.1370
     39        1.3910  0.1300
     40        1.3910  0.1260
     41        1.3910  0.1291
     42        1.3910  0.1320
     43        1.3910  0.1320
     44        1.3910  0.1340
     45        1.3910  0.1320
     46        1.3910  0.1310
 

     19        1.3904  0.1310
     20        1.3904  0.1430
     21        1.3904  0.1410
     22        1.3904  0.1370
     23        1.3904  0.1460
     24        1.3904  0.1350
     25        1.3904  0.1380
     26        1.3904  0.1370
     27        1.3904  0.1400
     28        1.3904  0.1410
     29        1.3904  0.1545
     30        1.3904  0.1440
     31        1.3904  0.1370
     32        1.3904  0.1370
     33        1.3904  0.1394
     34        1.3904  0.1490
     35        1.3904  0.1302
     36        1.3904  0.1290
     37        1.3904  0.1350
     38        1.3904  0.1490
     39        1.3904  0.1420
     40        1.3904  0.1298
     41        1.3904  0.1471
     42        1.3904  0.1420
     43        1.3904  0.1370
     44        1.3904  0.1339
     45        1.3904  0.1310
     46        1.3904  0.1432
     47        1.3904  0.1420
     48        1.3904  0.1320
     49        1.3904  0.1410
     50        1.3904  0.1380
  epoch    train_loss     dur
-------  -

      9        [36m1.3886[0m  0.0953
     10        [36m1.3879[0m  0.0885
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5371[0m  0.0890
      2        [36m1.4265[0m  0.0880
      3        [36m1.4159[0m  0.1010
      4        [36m1.4081[0m  0.0980
      5        [36m1.4024[0m  0.0980
      6        [36m1.3981[0m  0.0910
      7        [36m1.3950[0m  0.0880
      8        [36m1.3927[0m  0.0940
      9        [36m1.3910[0m  0.0900
     10        [36m1.3898[0m  0.0950
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4480[0m  0.0990
      2        [36m1.3887[0m  0.0980
      3        [36m1.3878[0m  0.0870
      4        [36m1.3873[0m  0.0900
      5        [36m1.3870[0m  0.0920
      6        [36m1.3867[0m  0.0929
      7        [36m1.3866[0m  0.0920
      8        [36m1.3865[0m  0.0900
      9        [36m1.3864[0m  0.0850
     10        [36m1.3864[0m  0.0940
  epoch    train_loss 

      2        [36m1.3864[0m  0.0940
      3        1.3866  0.0960
      4        1.3866  0.0890
      5        1.3866  0.0900
      6        1.3866  0.0920
      7        1.3866  0.0900
      8        1.3866  0.0890
      9        1.3866  0.0870
     10        1.3866  0.0870
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4167[0m  0.0940
      2        [36m1.3865[0m  0.0860
      3        1.3865  0.0900
      4        1.3865  0.0940
      5        1.3865  0.0930
      6        1.3865  0.0960
      7        1.3865  0.0950
      8        1.3865  0.0950
      9        1.3865  0.0960
     10        1.3865  0.0920
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6190[0m  0.0930
      2        [36m1.3877[0m  0.0909
      3        [36m1.3877[0m  0.0850
      4        1.3877  0.0960
      5        1.3877  0.0960
      6        1.3877  0.0960
      7        1.3877  0.0860
      8        1.3877  0.0890
      9        1

      9        [36m1.0660[0m  0.0920
     10        [36m1.0523[0m  0.0910
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5594[0m  0.0930
      2        [36m1.3181[0m  0.0900
      3        [36m1.2762[0m  0.0890
      4        [36m1.2332[0m  0.0900
      5        [36m1.2031[0m  0.0940
      6        [36m1.1779[0m  0.0910
      7        [36m1.1581[0m  0.0920
      8        [36m1.1392[0m  0.0990
      9        [36m1.1227[0m  0.0930
     10        [36m1.1108[0m  0.0960
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5333[0m  0.0990
      2        [36m1.3218[0m  0.0890
      3        [36m1.2428[0m  0.0890
      4        [36m1.1319[0m  0.0910
      5        [36m1.0126[0m  0.0920
      6        [36m0.9670[0m  0.0950
      7        [36m0.9513[0m  0.0970
      8        [36m0.9381[0m  0.0940
      9        [36m0.9294[0m  0.0990
     10        [36m0.9228[0m  0.0990
  epoch    train_loss 

     10       11.9568  0.0960
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4260[0m  0.0900
      2        [36m1.3868[0m  0.0900
      3        [36m1.3867[0m  0.0940
      4        [36m1.3866[0m  0.1030
      5        [36m1.3866[0m  0.0900
      6        [36m1.3866[0m  0.0910
      7        [36m1.3866[0m  0.0900
      8        [36m1.3866[0m  0.0840
      9        [36m1.3866[0m  0.0920
     10        [36m1.3866[0m  0.0924
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m3.8493[0m  0.0910
      2        [36m1.3865[0m  0.0948
      3        1.3867  0.0880
      4        1.3866  0.0890
      5        1.3866  0.0960
      6        [36m1.3856[0m  0.0910
      7        1.3860  0.0960
      8        [36m1.3663[0m  0.0910
      9        [36m1.3624[0m  0.0930
     10        1.3876  0.1010
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m10.0746[0m  0.0900
      2        

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m5.5852[0m  0.0990
      2        [36m3.2456[0m  0.0970
      3        [36m1.4977[0m  0.0980
      4       10.9663  0.0990
      5       10.0908  0.1000
      6       11.8378  0.1020
      7        2.5943  0.0960
      8        1.5622  0.0960
      9        [36m1.3921[0m  0.0940
     10        [36m1.3880[0m  0.0930
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.3907[0m  0.0970
      2        [36m1.1690[0m  0.0975
      3        [36m1.0376[0m  0.0950
      4        [36m0.9938[0m  0.0940
      5        [36m0.9685[0m  0.1010
      6        [36m0.9479[0m  0.0980
      7        [36m0.9375[0m  0.1020
      8        [36m0.9260[0m  0.0950
      9        [36m0.9181[0m  0.1030
     10        [36m0.9161[0m  0.0990
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4910[0m  0.1031
      2        [36m1.2922[0m  0.1030
      3

      6       11.9589  0.1010
      7       11.9589  0.0930
      8       11.9589  0.0890
      9       11.9589  0.0960
     10       11.9589  0.0980
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.6697[0m  0.0980
      2       11.9568  0.0960
      3       11.9568  0.0970
      4       11.9568  0.0980
      5       11.9568  0.1010
      6       11.9568  0.1052
      7       11.9568  0.1080
      8       11.9568  0.0980
      9       11.9568  0.1040
     10       11.9568  0.1000
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.3470[0m  0.0940
      2        1.3902  0.0860
      3        1.3866  0.0900
      4        1.3866  0.0950
      5        1.3866  0.0950
      6        1.3866  0.1020
      7        1.3866  0.0940
      8        1.3866  0.0940
      9        1.3866  0.0910
     10        1.3866  0.0870
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5891[0m  0.0920
      2      

      4       11.9568  0.0980
      5        [36m9.3302[0m  0.0920
      6        [36m1.3882[0m  0.0920
      7        1.3884  0.0860
      8        1.3884  0.0870
      9        1.3884  0.0880
     10        1.3884  0.0920
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9125[0m  0.0860
      2       11.9568  0.0910
      3       11.9568  0.0890
      4       11.9568  0.0980
      5       11.9568  0.0898
      6       11.9568  0.0890
      7       [36m10.1826[0m  0.0890
      8        [36m1.3881[0m  0.0850
      9        1.3882  0.0880
     10        1.3881  0.0880
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7576[0m  0.0860
      2        [36m5.5010[0m  0.0940
      3        [36m5.4552[0m  0.0880
      4        [36m1.4757[0m  0.0870
      5        6.6331  0.0910
      6        7.3211  0.0970
      7        6.9880  0.0860
      8        1.4948  0.0900
      9        1.4838  0.0881
     10        [36

      3        [36m1.0130[0m  0.0960
      4        [36m0.9662[0m  0.0950
      5        [36m0.9555[0m  0.0890
      6        [36m0.9519[0m  0.0900
      7        0.9569  0.0940
      8        [36m0.9459[0m  0.0930
      9        [36m0.9425[0m  0.0920
     10        [36m0.9410[0m  0.0850
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.9734[0m  0.0870
      2        [36m1.1551[0m  0.0890
      3        [36m1.0478[0m  0.0870
      4        [36m0.9615[0m  0.0930
      5        [36m0.9448[0m  0.0880
      6        [36m0.9368[0m  0.0929
      7        [36m0.9300[0m  0.0888
      8        0.9438  0.0930
      9        [36m0.9224[0m  0.0980
     10        0.9315  0.0940
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6573[0m  0.0950
      2        [36m1.2916[0m  0.0970
      3        [36m1.2409[0m  0.1040
      4        [36m1.1015[0m  0.1040
      5        [36m1.0287[0m  0.1020
      6   

      9       11.9568  0.1120
     10       11.9568  0.1150
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8753[0m  0.1060
      2       11.9568  0.1130
      3       11.9568  0.1160
      4       11.9568  0.1100
      5       11.9568  0.1060
      6       11.9568  0.1030
      7       11.9568  0.0990
      8       11.9568  0.1080
      9       11.9568  0.1160
     10       11.9568  0.1080
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8988[0m  0.0950
      2       11.9568  0.0930
      3       11.9568  0.0940
      4       11.9568  0.0960
      5       11.9568  0.0950
      6       11.9568  0.0940
      7       11.9568  0.0970
      8       11.9568  0.0980
      9       11.9568  0.0930
     10       11.9568  0.0930
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9019[0m  0.1230
      2       11.9568  0.0970
      3       11.9568  0.0960
      4       11.9568  0.0940
      5      

      2        [36m1.3882[0m  0.0970
      3        [36m1.3877[0m  0.0980
      4        [36m1.3873[0m  0.0970
      5        [36m1.3871[0m  0.0880
      6        [36m1.3869[0m  0.0920
      7        [36m1.3867[0m  0.0880
      8        [36m1.3866[0m  0.0880
      9        [36m1.3866[0m  0.0940
     10        [36m1.3865[0m  0.0950
     11        [36m1.3865[0m  0.0970
     12        [36m1.3864[0m  0.0900
     13        [36m1.3864[0m  0.0950
     14        [36m1.3864[0m  0.0890
     15        [36m1.3864[0m  0.0900
     16        [36m1.3864[0m  0.0900
     17        [36m1.3864[0m  0.0880
     18        [36m1.3863[0m  0.0980
     19        [36m1.3863[0m  0.0910
     20        [36m1.3863[0m  0.0890
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.1904[0m  0.0880
      2        [36m1.3911[0m  0.0900
      3        [36m1.3894[0m  0.0910
      4        [36m1.3884[0m  0.0870
      5        [36m1.3877[0m  0.0910
    

     20        0.9309  0.0900
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5444[0m  0.0962
      2        [36m1.4087[0m  0.0980
      3        [36m1.4013[0m  0.0990
      4        [36m1.3963[0m  0.0960
      5        [36m1.3929[0m  0.0970
      6        [36m1.3907[0m  0.0910
      7        [36m1.3892[0m  0.0960
      8        [36m1.3882[0m  0.0950
      9        [36m1.3876[0m  0.0950
     10        [36m1.3872[0m  0.1000
     11        [36m1.3869[0m  0.0950
     12        [36m1.3867[0m  0.0970
     13        [36m1.3866[0m  0.0960
     14        [36m1.3865[0m  0.0920
     15        [36m1.3864[0m  0.0958
     16        [36m1.3864[0m  0.0950
     17        [36m1.3864[0m  0.1050
     18        [36m1.3864[0m  0.1010
     19        [36m1.3863[0m  0.1070
     20        [36m1.3863[0m  0.1000
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6079[0m  0.1010
      2        [36m1.3881[0m 

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6937[0m  0.0890
      2        [36m1.3864[0m  0.0930
      3        1.3866  0.1010
      4        1.3866  0.0900
      5        1.3866  0.0970
      6        1.3866  0.0900
      7        1.3866  0.0890
      8        1.3866  0.0950
      9        1.3866  0.0940
     10        1.3866  0.0970
     11        1.3866  0.0980
     12        1.3866  0.0870
     13        1.3866  0.0930
     14        1.3866  0.0990
     15        1.3866  0.0950
     16        1.3866  0.0940
     17        1.3866  0.0990
     18        1.3866  0.0990
     19        1.3866  0.0920
     20        1.3866  0.1050
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4093[0m  0.0980
      2        [36m1.3866[0m  0.0850
      3        [36m1.3865[0m  0.0850
      4        [36m1.3865[0m  0.0980
      5        [36m1.3865[0m  0.1010
      6        1.3865  0.0960
      7        1.3865  0.0930
      8

     13        1.3875  0.1040
     14        1.3875  0.0980
     15        1.3875  0.1050
     16        1.3875  0.1080
     17        1.3875  0.1000
     18        1.3875  0.1030
     19        1.3875  0.0960
     20        1.3875  0.0900
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8788[0m  0.1050
      2       11.9568  0.1030
      3       11.9568  0.0930
      4       11.9568  0.0920
      5        [36m2.8927[0m  0.0950
      6        [36m1.3879[0m  0.0970
      7        [36m1.3879[0m  0.1040
      8        1.3879  0.0990
      9        1.3879  0.0990
     10        1.3879  0.0990
     11        1.3879  0.0970
     12        1.3879  0.0970
     13        1.3879  0.0890
     14        1.3879  0.0960
     15        1.3879  0.0930
     16        1.3879  0.0970
     17        1.3879  0.0970
     18        1.3879  0.0890
     19        1.3879  0.0880
     20        1.3879  0.0880
  epoch    train_loss     dur
-------  ------------  ------
    

     17        0.9414  0.0950
     18        0.9279  0.1040
     19        0.9248  0.0900
     20        0.9221  0.0900
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.3624[0m  0.0940
      2        [36m1.1082[0m  0.1220
      3        [36m0.9878[0m  0.1020
      4        [36m0.9557[0m  0.0890
      5        [36m0.9517[0m  0.0930
      6        [36m0.9458[0m  0.0900
      7        0.9558  0.0970
      8        [36m0.9234[0m  0.0980
      9        0.9237  0.0960
     10        [36m0.9193[0m  0.0960
     11        0.9325  0.0990
     12        0.9242  0.0930
     13        0.9244  0.0870
     14        0.9238  0.0910
     15        0.9336  0.1000
     16        0.9399  0.0970
     17        0.9255  0.0880
     18        0.9213  0.0890
     19        0.9194  0.0880
     20        [36m0.9160[0m  0.0900
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.3659[0m  0.0950
      2        [36m1.3957[0m  0.0890
 

      3        [36m1.3463[0m  0.0950
      4        [36m1.3131[0m  0.0930
      5        [36m1.2617[0m  0.0930
      6        [36m1.1802[0m  0.0920
      7        [36m1.0807[0m  0.0960
      8        [36m1.0325[0m  0.1000
      9        [36m0.9725[0m  0.0940
     10        [36m0.9615[0m  0.0960
     11        [36m0.9432[0m  0.0930
     12        [36m0.9387[0m  0.0860
     13        0.9403  0.0950
     14        [36m0.9348[0m  0.0974
     15        [36m0.9320[0m  0.0910
     16        [36m0.9302[0m  0.0910
     17        [36m0.9294[0m  0.0940
     18        [36m0.9279[0m  0.0940
     19        [36m0.9272[0m  0.0970
     20        0.9299  0.0925
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6063[0m  0.0930
      2        [36m1.3129[0m  0.1010
      3        [36m1.2220[0m  0.1040
      4        [36m1.1373[0m  0.0990
      5        [36m1.0708[0m  0.0910
      6        [36m1.0533[0m  0.0940
      7        [36m1.

      2        [36m1.3863[0m  0.0940
      3        [36m1.3795[0m  0.1010
      4        [36m1.3148[0m  0.1010
      5        1.3641  0.1000
      6        1.3871  0.0950
      7        1.3865  0.0970
      8        1.3865  0.0993
      9        1.3865  0.0920
     10        1.3865  0.0910
     11        1.3865  0.0940
     12        1.3865  0.0920
     13        1.3865  0.0930
     14        1.3865  0.0990
     15        1.3865  0.1070
     16        1.3858  0.1020
     17        1.3875  0.0970
     18        1.3865  0.0980
     19        1.3865  0.0970
     20        1.3865  0.0940
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4665[0m  0.1040
      2        [36m1.3866[0m  0.1020
      3        [36m1.3866[0m  0.0990
      4        [36m1.3866[0m  0.0940
      5        [36m1.3866[0m  0.0990
      6        [36m1.3866[0m  0.1000
      7        [36m1.3866[0m  0.0960
      8        [36m1.3866[0m  0.0920
      9        [36m1.3866[0m 

      2       11.9568  0.0990
      3       11.9568  0.0930
      4        [36m9.2701[0m  0.0920
      5        [36m1.3880[0m  0.0940
      6        [36m1.3875[0m  0.0910
      7        1.3875  0.0960
      8        1.3875  0.0980
      9        1.3875  0.0880
     10        1.3875  0.0960
     11        1.3875  0.0940
     12        1.3875  0.0950
     13        1.3875  0.0930
     14        1.3875  0.0930
     15        1.3875  0.1020
     16        1.3875  0.0970
     17        1.3875  0.1000
     18        1.3875  0.0920
     19        1.3875  0.0990
     20        1.3875  0.1330
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7428[0m  0.1020
      2        [36m1.3887[0m  0.0980
      3        [36m1.3880[0m  0.1010
      4        [36m1.3879[0m  0.0960
      5        [36m1.3879[0m  0.0980
      6        [36m1.3879[0m  0.0930
      7        [36m1.3879[0m  0.0990
      8        [36m1.3879[0m  0.0960
      9        1.3879  0.0980
 

     10       11.9547  0.0920
     11       11.9547  0.0980
     12       11.9547  0.1000
     13       11.9547  0.0960
     14       [36m11.9547[0m  0.0960
     15       11.9547  0.0970
     16       11.9547  0.0950
     17       11.9547  0.0910
     18       11.9547  0.0980
     19       11.9547  0.0940
     20       11.9547  0.0970
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.1285[0m  0.0930
      2        [36m1.2782[0m  0.0940
      3        [36m1.1066[0m  0.0940
      4        [36m1.0053[0m  0.0960
      5        [36m0.9623[0m  0.0960
      6        [36m0.9602[0m  0.0930
      7        0.9610  0.0910
      8        [36m0.9412[0m  0.0910
      9        [36m0.9284[0m  0.1040
     10        [36m0.9230[0m  0.0920
     11        [36m0.9182[0m  0.0940
     12        [36m0.9149[0m  0.0960
     13        0.9155  0.0920
     14        [36m0.9073[0m  0.1000
     15        0.9081  0.1010
     16        0.9103  0.0970
     17      

     19        1.0683  0.0990
     20        1.0742  0.0984
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5325[0m  0.0890
      2        [36m1.2070[0m  0.0940
      3        [36m1.0551[0m  0.1370
      4        [36m0.9730[0m  0.1034
      5        [36m0.9544[0m  0.0970
      6        [36m0.9484[0m  0.0890
      7        [36m0.9419[0m  0.0960
      8        [36m0.9411[0m  0.0940
      9        [36m0.9395[0m  0.0890
     10        [36m0.9387[0m  0.0900
     11        0.9393  0.0920
     12        [36m0.9383[0m  0.0900
     13        [36m0.9356[0m  0.0950
     14        0.9367  0.0950
     15        [36m0.9343[0m  0.0960
     16        [36m0.9339[0m  0.0960
     17        [36m0.9322[0m  0.0950
     18        0.9324  0.0995
     19        0.9322  0.0930
     20        [36m0.9312[0m  0.0950
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.8169[0m  0.0970
      2        [36m1.3870[0m  0.089

     18        [36m1.3866[0m  0.0970
     19        [36m1.3866[0m  0.0926
     20        [36m1.3866[0m  0.0920
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5127[0m  0.0900
      2        [36m1.2859[0m  0.0920
      3        1.3342  0.1000
      4        1.3870  0.1010
      5        1.3866  0.0980
      6        1.3866  0.0940
      7        1.3866  0.0990
      8        1.3866  0.0970
      9        1.3866  0.1000
     10        1.3866  0.0968
     11        1.3866  0.1030
     12        1.3866  0.1000
     13        1.3866  0.1020
     14        1.3866  0.0980
     15        1.3865  0.0990
     16        1.3865  0.0970
     17        1.3865  0.0940
     18        1.3865  0.0930
     19        1.3865  0.0940
     20        1.3865  0.0900
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6240[0m  0.1080
      2        [36m1.3878[0m  0.1030
      3        [36m1.3863[0m  0.0990
      4        [36m1.3675[

     13        1.3876  0.1040
     14        1.3876  0.0910
     15        1.3876  0.0940
     16        1.3876  0.0930
     17        1.3876  0.0920
     18        1.3876  0.0940
     19        1.3876  0.0990
     20        1.3876  0.1010
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8899[0m  0.1030
      2       11.9568  0.1000
      3       11.9568  0.1020
      4       11.9568  0.1000
      5        [36m9.6341[0m  0.1000
      6        [36m1.3876[0m  0.1010
      7        [36m1.3876[0m  0.0990
      8        [36m1.3875[0m  0.0990
      9        [36m1.3875[0m  0.1040
     10        [36m1.3875[0m  0.0950
     11        1.3875  0.1020
     12        [36m1.3875[0m  0.0940
     13        1.3875  0.0970
     14        1.3875  0.0930
     15        [36m1.3875[0m  0.0910
     16        1.3875  0.0880
     17        1.3875  0.0920
     18        1.3875  0.0970
     19        1.3875  0.0930
     20        1.3875  0.0960
  epoch    train_lo

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4362[0m  0.1010
      2        [36m1.1487[0m  0.1190
      3        [36m1.0255[0m  0.1080
      4        [36m0.9990[0m  0.0980
      5        [36m0.9675[0m  0.0950
      6        [36m0.9524[0m  0.0900
      7        [36m0.9440[0m  0.0870
      8        0.9445  0.0930
      9        [36m0.9384[0m  0.0900
     10        0.9447  0.0980
     11        [36m0.9243[0m  0.1030
     12        [36m0.9220[0m  0.0950
     13        [36m0.9198[0m  0.0940
     14        [36m0.9168[0m  0.1000
     15        [36m0.9165[0m  0.0940
     16        [36m0.9158[0m  0.0990
     17        0.9226  0.0970
     18        0.9269  0.0920
     19        0.9165  0.0970
     20        [36m0.9070[0m  0.0970
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.1262[0m  0.0920
      2        [36m1.3859[0m  0.0880
      3        [36m1.3716[0m  0.0940
      4        [36m1.3551[

      5        [36m0.9944[0m  0.0930
      6        [36m0.9898[0m  0.0940
      7        [36m0.9835[0m  0.0910
      8        [36m0.9676[0m  0.0870
      9        [36m0.9582[0m  0.0920
     10        [36m0.9568[0m  0.0950
     11        [36m0.9537[0m  0.0940
     12        [36m0.9520[0m  0.1000
     13        [36m0.9517[0m  0.0950
     14        0.9529  0.0920
     15        [36m0.9507[0m  0.0920
     16        [36m0.9483[0m  0.0860
     17        [36m0.9481[0m  0.0930
     18        [36m0.9459[0m  0.0870
     19        [36m0.9451[0m  0.0890
     20        [36m0.9442[0m  0.0880
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7640[0m  0.0909
      2        [36m1.1989[0m  0.0930
      3        [36m1.0403[0m  0.0890
      4        [36m0.9612[0m  0.0910
      5        [36m0.9571[0m  0.0940
      6        [36m0.9467[0m  0.0960
      7        [36m0.9401[0m  0.0840
      8        [36m0.9357[0m  0.0880
      9      

      7       11.9568  0.0870
      8       11.9568  0.0870
      9       11.9568  0.0910
     10       11.9568  0.0880
     11       11.9568  0.0850
     12       11.9568  0.0920
     13       11.9568  0.0860
     14       11.9568  0.0900
     15       11.9568  0.0910
     16       11.9568  0.0900
     17       11.9568  0.0880
     18       11.9568  0.0910
     19       11.9568  0.0870
     20       11.9568  0.0910
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.9228[0m  0.0860
      2        [36m1.3867[0m  0.0850
      3        [36m1.3865[0m  0.0850
      4        [36m1.3864[0m  0.0890
      5        [36m1.3863[0m  0.0820
      6        [36m1.3826[0m  0.0870
      7        1.3864  0.0880
      8        1.3863  0.0880
      9        1.3860  0.0840
     10        [36m1.3765[0m  0.0890
     11        [36m1.3362[0m  0.0920
     12        [36m1.3169[0m  0.0900
     13        1.3757  0.0820
     14        1.3866  0.0850
     15        1.38

      3       11.9568  0.0960
      4       11.9568  0.0940
      5       11.9568  0.1000
      6        [36m2.9203[0m  0.0870
      7        [36m1.3877[0m  0.0870
      8        [36m1.3876[0m  0.0940
      9        1.3876  0.0850
     10        1.3876  0.0860
     11        1.3876  0.0850
     12        1.3876  0.0860
     13        1.3876  0.0890
     14        1.3876  0.0940
     15        1.3876  0.0980
     16        1.3876  0.0850
     17        1.3876  0.0950
     18        1.3876  0.0930
     19        1.3876  0.0890
     20        1.3876  0.0920
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9138[0m  0.0890
      2       11.9631  0.0970
      3       11.9589  0.0910
      4       11.9589  0.0900
      5       11.9589  0.0940
      6       11.9589  0.0930
      7       11.9589  0.0900
      8        [36m6.5663[0m  0.0880
      9        [36m1.3875[0m  0.0890
     10        1.3875  0.0890
     11        1.3875  0.0910
     12        1

      2        [36m1.4057[0m  0.0890
      3        [36m1.4009[0m  0.0890
      4        [36m1.3972[0m  0.0890
      5        [36m1.3945[0m  0.0870
      6        [36m1.3925[0m  0.0910
      7        [36m1.3909[0m  0.0850
      8        [36m1.3898[0m  0.0850
      9        [36m1.3889[0m  0.0940
     10        [36m1.3883[0m  0.0900
     11        [36m1.3878[0m  0.0860
     12        [36m1.3874[0m  0.0890
     13        [36m1.3871[0m  0.0870
     14        [36m1.3869[0m  0.0850
     15        [36m1.3868[0m  0.0870
     16        [36m1.3866[0m  0.0890
     17        [36m1.3866[0m  0.0870
     18        [36m1.3865[0m  0.0850
     19        [36m1.3864[0m  0.0940
     20        [36m1.3864[0m  0.0930
     21        [36m1.3864[0m  0.0910
     22        [36m1.3864[0m  0.0900
     23        [36m1.3863[0m  0.0910
     24        [36m1.3863[0m  0.0860
     25        [36m1.3863[0m  0.0900
     26        [36m1.3863[0m  0.0920
     27        [36m1.386

     24        [36m1.3863[0m  0.0890
     25        [36m1.3863[0m  0.0930
     26        [36m1.3863[0m  0.0900
     27        [36m1.3863[0m  0.0880
     28        [36m1.3863[0m  0.0890
     29        [36m1.3863[0m  0.0860
     30        [36m1.3863[0m  0.0900
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4049[0m  0.0970
      2        [36m1.3926[0m  0.0950
      3        [36m1.3704[0m  0.0930
      4        [36m1.3468[0m  0.0910
      5        [36m1.3228[0m  0.0900
      6        [36m1.2941[0m  0.0880
      7        [36m1.2583[0m  0.0880
      8        [36m1.2113[0m  0.0900
      9        [36m1.1782[0m  0.0910
     10        [36m1.1508[0m  0.0942
     11        [36m1.1259[0m  0.1020
     12        [36m1.1089[0m  0.0990
     13        [36m1.0899[0m  0.0940
     14        [36m1.0735[0m  0.1010
     15        [36m1.0580[0m  0.1040
     16        [36m1.0460[0m  0.1010
     17        1.0473  0.1010
     18      

     15        [36m1.3863[0m  0.0920
     16        [36m1.3862[0m  0.0940
     17        [36m1.3862[0m  0.0880
     18        [36m1.3854[0m  0.0930
     19        [36m1.3825[0m  0.0870
     20        [36m1.3776[0m  0.0840
     21        [36m1.3685[0m  0.0860
     22        [36m1.3523[0m  0.0810
     23        [36m1.3282[0m  0.0840
     24        [36m1.2910[0m  0.0890
     25        [36m1.2419[0m  0.0850
     26        [36m1.1988[0m  0.0860
     27        [36m1.1597[0m  0.0850
     28        [36m1.1383[0m  0.0900
     29        [36m1.1251[0m  0.0890
     30        [36m1.1117[0m  0.0900
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m4.9746[0m  0.0840
      2        [36m1.3869[0m  0.0830
      3        [36m1.3866[0m  0.0880
      4        [36m1.3866[0m  0.0870
      5        1.3866  0.0920
      6        1.3866  0.0910
      7        1.3866  0.0910
      8        1.3866  0.0890
      9        1.3866  0.0900
     10   

     24        [36m1.3865[0m  0.0960
     25        [36m1.3865[0m  0.0870
     26        [36m1.3865[0m  0.0920
     27        [36m1.3865[0m  0.0910
     28        [36m1.3865[0m  0.0920
     29        [36m1.3865[0m  0.0920
     30        [36m1.3865[0m  0.0850
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5261[0m  0.0910
      2        [36m1.3870[0m  0.0900
      3        [36m1.3865[0m  0.0970
      4        [36m1.3865[0m  0.1040
      5        [36m1.3865[0m  0.1010
      6        [36m1.3865[0m  0.0990
      7        [36m1.3865[0m  0.1020
      8        [36m1.3865[0m  0.0880
      9        [36m1.3865[0m  0.0890
     10        [36m1.3865[0m  0.0970
     11        [36m1.3865[0m  0.0910
     12        [36m1.3865[0m  0.1123
     13        [36m1.3865[0m  0.1110
     14        [36m1.3865[0m  0.0970
     15        [36m1.3865[0m  0.1230
     16        [36m1.3865[0m  0.0950
     17        [36m1.3865[0m  0.1090
    

     22        1.3865  0.0880
     23        1.3865  0.0900
     24        1.3865  0.0960
     25        1.3865  0.0920
     26        1.3865  0.0940
     27        1.3865  0.0880
     28        1.3865  0.0940
     29        1.3865  0.0970
     30        1.3865  0.0970
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7536[0m  0.0920
      2        [36m1.3884[0m  0.1070
      3        [36m1.3884[0m  0.0960
      4        [36m1.3883[0m  0.0920
      5        [36m1.3882[0m  0.0890
      6        [36m1.3881[0m  0.0930
      7        [36m1.3880[0m  0.1020
      8        [36m1.3879[0m  0.0970
      9        [36m1.3878[0m  0.1000
     10        [36m1.3878[0m  0.0940
     11        [36m1.3878[0m  0.0850
     12        [36m1.3877[0m  0.0850
     13        [36m1.3877[0m  0.0890
     14        [36m1.3877[0m  0.0930
     15        [36m1.3877[0m  0.0890
     16        [36m1.3877[0m  0.1050
     17        [36m1.3877[0m  0.0870
     18

     22        1.3879  0.0870
     23        1.3879  0.0920
     24        1.3879  0.0910
     25        1.3879  0.0870
     26        1.3879  0.0900
     27        1.3879  0.0900
     28        1.3879  0.0880
     29        1.3879  0.0920
     30        1.3879  0.0890
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6731[0m  0.0860
      2        [36m1.3886[0m  0.0870
      3        [36m1.3884[0m  0.0880
      4        1.3884  0.0870
      5        1.3884  0.0850
      6        1.3884  0.0910
      7        1.3884  0.0900
      8        1.3884  0.0890
      9        1.3884  0.0920
     10        1.3884  0.0900
     11        1.3884  0.0840
     12        1.3884  0.0890
     13        1.3884  0.0860
     14        1.3884  0.0860
     15        1.3884  0.0920
     16        1.3884  0.0910
     17        1.3884  0.0870
     18        1.3884  0.0880
     19        1.3884  0.0880
     20        1.3884  0.0890
     21        1.3884  0.0930
     22      

     24        [36m1.3718[0m  0.0860
     25        [36m1.3702[0m  0.0900
     26        [36m1.3687[0m  0.0900
     27        [36m1.3661[0m  0.0910
     28        [36m1.3627[0m  0.0930
     29        [36m1.3565[0m  0.0960
     30        [36m1.3488[0m  0.0900
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4776[0m  0.0920
      2        [36m1.3278[0m  0.1060
      3        [36m1.2769[0m  0.0960
      4        [36m1.2200[0m  0.0930
      5        [36m1.1008[0m  0.0930
      6        [36m1.0280[0m  0.0970
      7        [36m0.9754[0m  0.0880
      8        [36m0.9536[0m  0.0920
      9        [36m0.9376[0m  0.0970
     10        [36m0.9274[0m  0.0890
     11        [36m0.9199[0m  0.0940
     12        [36m0.9162[0m  0.1070
     13        [36m0.9138[0m  0.0930
     14        0.9151  0.0960
     15        0.9188  0.0950
     16        0.9156  0.0880
     17        0.9156  0.0920
     18        0.9248  0.0970
     19   

     27        [36m0.9957[0m  0.1040
     28        [36m0.9920[0m  0.1080
     29        [36m0.9886[0m  0.1210
     30        1.0033  0.1100
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7417[0m  0.1120
      2        [36m1.3885[0m  0.1110
      3        [36m1.3785[0m  0.1070
      4        [36m1.3558[0m  0.0980
      5        [36m1.3252[0m  0.0970
      6        [36m1.2900[0m  0.1000
      7        [36m1.2496[0m  0.0970
      8        [36m1.2129[0m  0.0980
      9        [36m1.1865[0m  0.1090
     10        [36m1.1383[0m  0.1015
     11        [36m1.0350[0m  0.0960
     12        [36m0.9499[0m  0.1072
     13        0.9610  0.1020
     14        [36m0.9396[0m  0.1040
     15        [36m0.9305[0m  0.1040
     16        [36m0.9274[0m  0.0980
     17        0.9311  0.1070
     18        0.9335  0.1048
     19        [36m0.9237[0m  0.1010
     20        0.9264  0.1020
     21        0.9342  0.0910
     22        0.93

     27        0.9491  0.0980
     28        0.9498  0.0960
     29        [36m0.9431[0m  0.0980
     30        0.9469  0.0950
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.6776[0m  0.0950
      2        [36m1.3867[0m  0.0920
      3        [36m1.3866[0m  0.0940
      4        [36m1.3865[0m  0.0960
      5        [36m1.3865[0m  0.0950
      6        [36m1.3865[0m  0.1050
      7        [36m1.3865[0m  0.1020
      8        [36m1.3865[0m  0.0970
      9        [36m1.3864[0m  0.1030
     10        [36m1.3864[0m  0.0970
     11        [36m1.3864[0m  0.1010
     12        [36m1.3864[0m  0.1310
     13        [36m1.3864[0m  0.1020
     14        [36m1.3864[0m  0.1100
     15        [36m1.3864[0m  0.0910
     16        [36m1.3864[0m  0.0950
     17        [36m1.3863[0m  0.0970
     18        [36m1.3863[0m  0.1050
     19        [36m1.3863[0m  0.1070
     20        [36m1.3863[0m  0.0990
     21        [36m1.3863[0m 

     26        1.3865  0.0901
     27        1.3865  0.0960
     28        1.3865  0.0870
     29        1.3865  0.0870
     30        1.3865  0.0880
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5892[0m  0.0830
      2        [36m1.3863[0m  0.0860
      3        [36m1.3863[0m  0.0910
      4        [36m1.3837[0m  0.0928
      5        [36m1.3789[0m  0.0979
      6        [36m1.3069[0m  0.0920
      7        1.3804  0.1019
      8        1.3870  0.0960
      9        1.3866  0.0930
     10        1.3866  0.0910
     11        1.3866  0.0930
     12        1.3866  0.0910
     13        1.3866  0.0900
     14        1.3865  0.0880
     15        1.3865  0.0940
     16        1.3865  0.1030
     17        1.3865  0.0980
     18        1.3865  0.0990
     19        1.3865  0.0930
     20        1.3866  0.0900
     21        1.3866  0.0920
     22        1.3866  0.0869
     23        1.3866  0.0870
     24        1.3866  0.0910
     25        1

      2       11.9568  0.1040
      3       11.9568  0.1020
      4       11.9568  0.1010
      5       11.9568  0.1000
      6       11.9568  0.1000
      7       11.9568  0.1060
      8       11.9568  0.1040
      9       11.9568  0.0950
     10       11.9568  0.0900
     11       11.9568  0.0920
     12       11.9568  0.0980
     13       11.9568  0.1020
     14       11.9568  0.1050
     15       11.9568  0.0980
     16       11.9568  0.1000
     17       11.9568  0.1010
     18       11.9568  0.0990
     19       11.9568  0.1050
     20       11.9568  0.1040
     21       11.9568  0.1040
     22       11.9568  0.1000
     23       11.9568  0.1010
     24       11.9568  0.0970
     25       11.9568  0.1010
     26       11.9568  0.1000
     27       11.9568  0.1000
     28       11.9568  0.1010
     29       11.9568  0.0990
     30       11.9568  0.1000
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8549[0m  0.1000
      2       11.9547  0.0990
 

     11        1.3881  0.0860
     12        1.3881  0.1000
     13        1.3881  0.0990
     14        1.3881  0.0990
     15        1.3881  0.0970
     16        1.3881  0.0999
     17        1.3881  0.1030
     18        1.3881  0.0990
     19        1.3881  0.0910
     20        1.3881  0.0990
     21        1.3881  0.1030
     22        1.3881  0.0980
     23        1.3881  0.0850
     24        1.3881  0.0959
     25        1.3881  0.0940
     26        1.3881  0.0960
     27        1.3881  0.1040
     28        1.3881  0.1010
     29        1.3881  0.0990
     30        1.3881  0.0930
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.5366[0m  0.0938
      2        [36m4.7013[0m  0.1000
      3        5.5486  0.1000
      4        [36m1.3895[0m  0.0930
      5        [36m1.3874[0m  0.0920
      6        [36m1.3874[0m  0.0889
      7        [36m1.3874[0m  0.0922
      8        1.3874  0.0969
      9        1.3874  0.0988
     10        1

      5        [36m1.3906[0m  0.1070
      6        [36m1.3894[0m  0.0980
      7        [36m1.3818[0m  0.0930
      8        [36m1.3534[0m  0.0880
      9        [36m1.3165[0m  0.0900
     10        [36m1.2946[0m  0.0930
     11        [36m1.2478[0m  0.0900
     12        [36m1.2046[0m  0.0910
     13        [36m1.1574[0m  0.0900
     14        [36m1.1300[0m  0.0950
     15        1.1582  0.1000
     16        [36m1.0929[0m  0.1000
     17        [36m1.0700[0m  0.0900
     18        1.0735  0.0910
     19        [36m1.0619[0m  0.1100
     20        [36m1.0405[0m  0.1010
     21        1.0934  0.1016
     22        1.0462  0.1010
     23        [36m1.0160[0m  0.0990
     24        1.0442  0.0980
     25        1.0237  0.1020
     26        [36m0.9991[0m  0.1000
     27        [36m0.9930[0m  0.0920
     28        [36m0.9833[0m  0.0935
     29        [36m0.9762[0m  0.0980
     30        0.9816  0.0964
  epoch    train_loss     dur
-------  ----------

      9        [36m0.9438[0m  0.0920
     10        [36m0.9343[0m  0.0970
     11        [36m0.9287[0m  0.0880
     12        0.9331  0.0860
     13        0.9323  0.0960
     14        0.9522  0.0940
     15        0.9735  0.0920
     16        0.9538  0.0940
     17        0.9366  0.1020
     18        0.9343  0.0990
     19        0.9329  0.0950
     20        [36m0.9246[0m  0.0930
     21        [36m0.9230[0m  0.0950
     22        [36m0.9211[0m  0.0920
     23        0.9220  0.0941
     24        [36m0.9178[0m  0.0946
     25        [36m0.9094[0m  0.1003
     26        [36m0.9077[0m  0.0940
     27        [36m0.9058[0m  0.0910
     28        [36m0.9034[0m  0.0950
     29        [36m0.9015[0m  0.1000
     30        0.9021  0.1000
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.1585[0m  0.0950
      2        [36m1.3373[0m  0.0910
      3        [36m1.2717[0m  0.0910
      4        [36m1.1819[0m  0.0920
      5        

     21        1.3867  0.0980
     22        1.3867  0.1020
     23        1.3867  0.0990
     24        1.3867  0.0970
     25        1.3867  0.1000
     26        1.3867  0.0909
     27        1.3867  0.0930
     28        1.3867  0.0990
     29        1.3867  0.1010
     30        1.3866  0.1010
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8761[0m  0.1000
      2       11.9568  0.1089
      3       11.9568  0.1010
      4       11.9568  0.1010
      5       11.9568  0.1020
      6       11.9568  0.1025
      7       11.9568  0.1040
      8       11.9568  0.1090
      9       11.9568  0.1050
     10       11.9568  0.1090
     11       11.9568  0.1020
     12       11.9568  0.1040
     13       11.9568  0.1100
     14       11.9568  0.0940
     15       11.9568  0.0920
     16       11.9568  0.0990
     17       11.9568  0.1079
     18       11.9568  0.1010
     19       11.9568  0.1080
     20       11.9568  0.0980
     21       11.9568  0.0970
 

  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9081[0m  0.1050
      2        [36m5.4387[0m  0.0930
      3        [36m1.3878[0m  0.0990
      4        [36m1.3866[0m  0.0940
      5        [36m1.3866[0m  0.0970
      6        [36m1.3866[0m  0.1000
      7        [36m1.3866[0m  0.1090
      8        [36m1.3866[0m  0.0990
      9        [36m1.3866[0m  0.0960
     10        1.3866  0.0940
     11        1.3866  0.0910
     12        1.3866  0.0940
     13        1.3866  0.0872
     14        1.3866  0.0950
     15        1.3866  0.0880
     16        1.3866  0.0890
     17        1.3866  0.0930
     18        1.3866  0.0900
     19        1.3866  0.0920
     20        1.3866  0.0900
     21        1.3866  0.0900
     22        1.3866  0.0899
     23        1.3866  0.0900
     24        1.3866  0.0860
     25        1.3866  0.0860
     26        1.3866  0.0930
     27        1.3866  0.0940
     28        1.3866  0.0940
     29        1.38

      3       11.9568  0.1010
      4       11.9568  0.1000
      5       11.9568  0.1030
      6       11.9568  0.1000
      7       11.9568  0.1010
      8       11.9568  0.1030
      9       11.9568  0.1000
     10       11.9568  0.0990
     11       11.9568  0.1010
     12       11.9568  0.1020
     13       11.9568  0.0990
     14       11.9568  0.1040
     15       11.9568  0.1020
     16       11.9568  0.1060
     17       11.9568  0.1060
     18       11.9568  0.1040
     19       11.9568  0.1010
     20       11.9568  0.0940
     21       11.9568  0.0990
     22       11.9568  0.1020
     23       11.9568  0.1010
     24       11.9568  0.1010
     25       11.9568  0.1000
     26       11.9568  0.1020
     27       11.9568  0.1040
     28       11.9568  0.1040
     29       11.9568  0.1030
     30       11.9568  0.1030
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9641[0m  0.1040
      2       [36m11.9568[0m  0.0970
      3       11.9568 

      9        8.4553  0.1030
     10        8.0748  0.0950
     11        5.4934  0.0950
     12        1.6623  0.0930
     13        6.5218  0.1030
     14        [36m1.4134[0m  0.0900
     15        [36m1.3881[0m  0.1070
     16        1.4704  0.0970
     17        1.5390  0.0950
     18        2.9652  0.0950
     19        5.8746  0.1010
     20        6.8423  0.0940
     21        [36m1.3881[0m  0.0960
     22        [36m1.3874[0m  0.0990
     23        [36m1.3874[0m  0.0950
     24        1.3874  0.0920
     25        1.3874  0.0940
     26        1.3874  0.0970
     27        1.3874  0.0970
     28        1.3874  0.0980
     29        1.3874  0.0960
     30        1.3874  0.0990
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.5682[0m  0.0980
      2       [36m10.7983[0m  0.0970
      3        [36m5.4406[0m  0.0990
      4        5.8893  0.0930
      5        [36m1.3889[0m  0.1050
      6        [36m1.3878[0m  0.0950
      7   

     30        [36m0.9502[0m  0.1040
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4295[0m  0.0970
      2        [36m1.0170[0m  0.0960
      3        1.0217  0.0940
      4        [36m0.9835[0m  0.0970
      5        [36m0.9751[0m  0.0970
      6        [36m0.9639[0m  0.1020
      7        [36m0.9536[0m  0.1110
      8        [36m0.9447[0m  0.1190
      9        [36m0.9373[0m  0.1340
     10        [36m0.9348[0m  0.1080
     11        [36m0.9269[0m  0.1120
     12        [36m0.9202[0m  0.1070
     13        [36m0.9175[0m  0.1120
     14        [36m0.9146[0m  0.1100
     15        [36m0.9112[0m  0.1130
     16        [36m0.9088[0m  0.1200
     17        [36m0.9056[0m  0.1040
     18        [36m0.9036[0m  0.1100
     19        [36m0.9020[0m  0.1160
     20        [36m0.8969[0m  0.1180
     21        0.8970  0.1100
     22        [36m0.8936[0m  0.1020
     23        [36m0.8928[0m  0.1060
     24        [36m0.

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.1070[0m  0.0990
      2        [36m1.1454[0m  0.0920
      3        [36m1.0408[0m  0.1010
      4        [36m0.9881[0m  0.1130
      5        [36m0.9516[0m  0.1080
      6        [36m0.9392[0m  0.0950
      7        [36m0.9368[0m  0.0890
      8        [36m0.9336[0m  0.1010
      9        [36m0.9297[0m  0.1030
     10        0.9337  0.1110
     11        [36m0.9284[0m  0.0960
     12        [36m0.9274[0m  0.0910
     13        0.9282  0.0900
     14        [36m0.9273[0m  0.1100
     15        [36m0.9268[0m  0.1070
     16        0.9279  0.1440
     17        [36m0.9263[0m  0.1070
     18        0.9267  0.0950
     19        0.9275  0.0940
     20        0.9264  0.0970
     21        0.9264  0.0950
     22        [36m0.9259[0m  0.1440
     23        [36m0.9255[0m  0.1360
     24        0.9269  0.0980
     25        0.9269  0.0910
     26        0.9267  0.0900
     27        0

     22       11.9568  0.0930
     23       11.9568  0.1010
     24       11.9568  0.0980
     25       11.9568  0.0890
     26       11.9568  0.0960
     27       11.9568  0.0970
     28       11.9568  0.1018
     29       11.9568  0.1010
     30       11.9568  0.1000
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5345[0m  0.1020
      2        [36m1.3870[0m  0.0900
      3        [36m1.3868[0m  0.0970
      4        [36m1.3868[0m  0.1000
      5        [36m1.3868[0m  0.0890
      6        [36m1.3868[0m  0.0900
      7        [36m1.3868[0m  0.0920
      8        [36m1.3868[0m  0.0930
      9        [36m1.3868[0m  0.0980
     10        [36m1.3868[0m  0.0890
     11        [36m1.3868[0m  0.0890
     12        [36m1.3868[0m  0.0890
     13        [36m1.3868[0m  0.0960
     14        [36m1.3868[0m  0.0930
     15        [36m1.3867[0m  0.0890
     16        [36m1.3867[0m  0.0910
     17        [36m1.3867[0m  0.0881
     18

     24        1.3865  0.1050
     25        1.3865  0.1130
     26        1.3865  0.1080
     27        1.3865  0.1020
     28        1.3865  0.0940
     29        1.3865  0.0950
     30        1.3865  0.1020
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8491[0m  0.0950
      2       11.9568  0.0980
      3       [36m10.3164[0m  0.1020
      4        [36m1.3865[0m  0.1010
      5        [36m1.3864[0m  0.1120
      6        [36m1.3843[0m  0.1090
      7        [36m1.3467[0m  0.1050
      8        [36m1.3251[0m  0.1030
      9        1.3888  0.0980
     10        1.3865  0.1020
     11        1.3865  0.0930
     12        1.3865  0.0940
     13        1.3865  0.0920
     14        1.3865  0.0930
     15        1.3865  0.0920
     16        1.3865  0.0940
     17        1.3865  0.0900
     18        1.3865  0.0950
     19        1.3865  0.0900
     20        1.3865  0.0940
     21        1.3865  0.0910
     22        1.3865  0.0880
     23

      3       11.9568  0.1000
      4       11.9568  0.0950
      5       11.9568  0.1060
      6        [36m5.1237[0m  0.0920
      7        [36m1.3877[0m  0.0950
      8        [36m1.3876[0m  0.0890
      9        1.3876  0.0960
     10        1.3876  0.0900
     11        1.3876  0.0990
     12        1.3876  0.0990
     13        1.3876  0.1000
     14        1.3876  0.1030
     15        1.3876  0.0920
     16        1.3876  0.0950
     17        1.3876  0.0950
     18        1.3876  0.0980
     19        1.3876  0.1010
     20        1.3876  0.0940
     21        1.3876  0.0910
     22        1.3876  0.1060
     23        1.3876  0.1060
     24        1.3876  0.1030
     25        1.3876  0.1000
     26        1.3876  0.0900
     27        1.3876  0.1050
     28        1.3876  0.1020
     29        1.3876  0.0996
     30        1.3876  0.0980
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9162[0m  0.1040
      2       11.9589  0.1080
    

      3        [36m1.3879[0m  0.0960
      4        1.3883  0.0970
      5        1.3883  0.0920
      6        1.3883  0.0970
      7        1.3883  0.0920
      8        1.3883  0.0960
      9        1.3883  0.0930
     10        1.3883  0.0950
     11        1.3883  0.0900
     12        1.3883  0.0920
     13        1.3883  0.0940
     14        1.3883  0.0940
     15        1.3883  0.0920
     16        1.3883  0.0930
     17        1.3883  0.0930
     18        1.3883  0.0930
     19        1.3883  0.0950
     20        1.3883  0.0920
     21        1.3883  0.0960
     22        1.3883  0.0970
     23        1.3883  0.0940
     24        1.3883  0.0880
     25        1.3883  0.0900
     26        1.3883  0.0870
     27        1.3883  0.0870
     28        1.3883  0.0860
     29        1.3883  0.0850
     30        1.3883  0.0960
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m7.8198[0m  0.0890
      2        [36m3.3378[0m  0.0870
      3      

     14        [36m1.1370[0m  0.1050
     15        [36m1.1253[0m  0.1020
     16        [36m1.1139[0m  0.1020
     17        [36m1.1042[0m  0.0890
     18        [36m1.0976[0m  0.0900
     19        [36m1.0912[0m  0.0850
     20        [36m1.0843[0m  0.0930
     21        [36m1.0790[0m  0.0880
     22        [36m1.0750[0m  0.0905
     23        [36m1.0686[0m  0.0920
     24        [36m1.0644[0m  0.0860
     25        [36m1.0593[0m  0.0930
     26        [36m1.0548[0m  0.1500
     27        [36m1.0509[0m  0.0870
     28        [36m1.0474[0m  0.0960
     29        [36m1.0428[0m  0.0920
     30        [36m1.0399[0m  0.0910
     31        [36m1.0381[0m  0.0890
     32        [36m1.0348[0m  0.0890
     33        [36m1.0342[0m  0.0900
     34        [36m1.0293[0m  0.0900
     35        1.0311  0.0900
     36        [36m1.0253[0m  0.0940
     37        [36m1.0227[0m  0.0912
     38        [36m1.0199[0m  0.0890
     39        [36m1.0179[0m  0.

     20        [36m1.3861[0m  0.0850
     21        [36m1.3861[0m  0.0830
     22        [36m1.3860[0m  0.0930
     23        [36m1.3860[0m  0.0990
     24        [36m1.3859[0m  0.0960
     25        [36m1.3858[0m  0.0903
     26        [36m1.3828[0m  0.0893
     27        [36m1.3517[0m  0.0811
     28        [36m1.3176[0m  0.0860
     29        [36m1.2761[0m  0.0870
     30        [36m1.2319[0m  0.0880
     31        [36m1.1920[0m  0.0800
     32        [36m1.1858[0m  0.0860
     33        [36m1.1374[0m  0.0880
     34        [36m1.1197[0m  0.0870
     35        [36m1.0946[0m  0.0920
     36        [36m1.0805[0m  0.0820
     37        [36m1.0637[0m  0.0910
     38        [36m1.0522[0m  0.0937
     39        [36m1.0407[0m  0.0910
     40        [36m1.0290[0m  0.1265
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4064[0m  0.1040
      2        [36m1.3896[0m  0.0940
      3        [36m1.3884[0m  0.0880
    

     35        1.0406  0.0920
     36        1.0409  0.0920
     37        [36m1.0373[0m  0.0990
     38        1.0416  0.0950
     39        1.0412  0.0940
     40        1.0407  0.0910
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6032[0m  0.0940
      2        [36m1.3866[0m  0.0900
      3        [36m1.3865[0m  0.0910
      4        1.3866  0.0900
      5        1.3866  0.0960
      6        1.3866  0.0910
      7        1.3866  0.0910
      8        1.3866  0.0930
      9        1.3866  0.0940
     10        1.3866  0.0950
     11        1.3866  0.0935
     12        1.3866  0.0950
     13        1.3866  0.0891
     14        1.3866  0.0916
     15        1.3866  0.0890
     16        1.3866  0.0900
     17        1.3866  0.0980
     18        1.3866  0.0970
     19        1.3866  0.0930
     20        1.3866  0.0970
     21        1.3866  0.0940
     22        1.3866  0.0890
     23        1.3866  0.0910
     24        1.3866  0.0850
    

      6        [36m1.3865[0m  0.0960
      7        1.3865  0.0905
      8        1.3865  0.0950
      9        1.3865  0.0940
     10        1.3865  0.0950
     11        1.3865  0.0885
     12        1.3865  0.1190
     13        1.3865  0.1240
     14        1.3865  0.1240
     15        1.3865  0.1159
     16        1.3865  0.1040
     17        1.3865  0.1330
     18        1.3865  0.1220
     19        1.3865  0.1920
     20        1.3865  0.1220
     21        1.3865  0.1132
     22        1.3865  0.1128
     23        1.3865  0.1180
     24        1.3865  0.1210
     25        1.3865  0.1170
     26        1.3865  0.0990
     27        1.3865  0.0979
     28        1.3865  0.0940
     29        1.3865  0.0910
     30        1.3865  0.0910
     31        1.3865  0.0910
     32        1.3865  0.0950
     33        1.3865  0.0930
     34        1.3865  0.0890
     35        1.3865  0.1010
     36        1.3865  0.0920
     37        1.3865  0.0970
     38        1.3865  0.0940
 

     31        1.3865  0.0930
     32        1.3865  0.0830
     33        1.3865  0.0960
     34        1.3865  0.0860
     35        1.3865  0.0900
     36        1.3865  0.0860
     37        1.3865  0.0850
     38        1.3865  0.0920
     39        1.3865  0.0910
     40        1.3865  0.0880
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5454[0m  0.0860
      2        [36m1.3865[0m  0.0880
      3        1.3865  0.0870
      4        1.3865  0.0880
      5        1.3865  0.0840
      6        1.3865  0.0915
      7        1.3865  0.0880
      8        1.3865  0.0860
      9        1.3865  0.0910
     10        1.3865  0.0870
     11        1.3865  0.0870
     12        1.3865  0.0910
     13        1.3865  0.0940
     14        1.3865  0.0850
     15        1.3865  0.0880
     16        1.3865  0.0960
     17        1.3865  0.0970
     18        1.3865  0.1000
     19        1.3865  0.0840
     20        1.3865  0.0960
     21        1.3865 

      4       11.9568  0.0940
      5       11.9568  0.0910
      6       11.9568  0.0890
      7       11.9568  0.0910
      8       11.9568  0.0860
      9       11.9568  0.0900
     10       11.9568  0.0930
     11       11.9568  0.0940
     12       11.9568  0.0890
     13       11.9568  0.0940
     14       11.9568  0.0920
     15       11.9568  0.0930
     16       11.9568  0.0940
     17       11.9568  0.0880
     18       11.9568  0.0910
     19       11.9568  0.0890
     20       11.9568  0.0930
     21       11.9568  0.1010
     22       11.9568  0.0940
     23       11.9568  0.1030
     24       11.9568  0.1000
     25       11.9568  0.0930
     26       11.9568  0.0920
     27       11.9568  0.1000
     28       11.9568  0.0990
     29       11.9568  0.0970
     30       11.9568  0.0980
     31       11.9568  0.0990
     32       11.9568  0.0960
     33       11.9568  0.0930
     34       11.9568  0.0920
     35       11.9568  0.0880
     36       11.9568  0.0940
     37   

     11        1.3881  0.0909
     12        [36m1.3881[0m  0.0880
     13        1.3881  0.0890
     14        1.3881  0.0895
     15        1.3881  0.0950
     16        [36m1.3881[0m  0.0900
     17        1.3881  0.0900
     18        1.3881  0.0930
     19        1.3881  0.0900
     20        1.3881  0.0930
     21        1.3881  0.0910
     22        1.3881  0.0870
     23        1.3881  0.0920
     24        1.3881  0.0950
     25        1.3881  0.0833
     26        1.3881  0.0850
     27        [36m1.3881[0m  0.0920
     28        1.3881  0.0880
     29        1.3881  0.0890
     30        [36m1.3881[0m  0.0880
     31        1.3881  0.0880
     32        1.3881  0.0950
     33        1.3881  0.0850
     34        1.3881  0.0880
     35        1.3881  0.0920
     36        1.3881  0.0910
     37        1.3881  0.0870
     38        1.3881  0.0890
     39        1.3881  0.0870
     40        1.3881  0.0890
  epoch    train_loss     dur
-------  ------------  ------
    

     20        [36m1.0062[0m  0.0874
     21        [36m0.9886[0m  0.0930
     22        1.0047  0.0910
     23        [36m0.9837[0m  0.0910
     24        0.9849  0.0900
     25        [36m0.9749[0m  0.0890
     26        [36m0.9734[0m  0.1028
     27        0.9840  0.1054
     28        [36m0.9643[0m  0.0972
     29        0.9846  0.0880
     30        [36m0.9616[0m  0.0880
     31        0.9676  0.0890
     32        0.9757  0.0940
     33        [36m0.9569[0m  0.0940
     34        0.9636  0.1070
     35        [36m0.9568[0m  0.1010
     36        0.9576  0.0900
     37        0.9614  0.0950
     38        [36m0.9521[0m  0.0900
     39        [36m0.9496[0m  0.0930
     40        0.9516  0.0910
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7124[0m  0.1090
      2        [36m1.3471[0m  0.1009
      3        [36m1.2982[0m  0.0860
      4        [36m1.1939[0m  0.0880
      5        [36m1.0753[0m  0.0950
      6        

      3        [36m1.3928[0m  0.0950
      4        [36m1.3909[0m  0.0920
      5        [36m1.3896[0m  0.1020
      6        [36m1.3887[0m  0.0950
      7        [36m1.3880[0m  0.0910
      8        [36m1.3875[0m  0.0870
      9        [36m1.3872[0m  0.0880
     10        [36m1.3870[0m  0.0900
     11        [36m1.3868[0m  0.1000
     12        [36m1.3867[0m  0.0956
     13        [36m1.3866[0m  0.0970
     14        [36m1.3865[0m  0.1010
     15        [36m1.3864[0m  0.0880
     16        [36m1.3864[0m  0.0920
     17        [36m1.3864[0m  0.0920
     18        [36m1.3864[0m  0.0890
     19        [36m1.3864[0m  0.0870
     20        [36m1.3863[0m  0.0900
     21        [36m1.3863[0m  0.0940
     22        [36m1.3863[0m  0.0950
     23        [36m1.3863[0m  0.0880
     24        [36m1.3863[0m  0.0900
     25        [36m1.3863[0m  0.0940
     26        [36m1.3863[0m  0.0880
     27        [36m1.3863[0m  0.0880
     28        [36m1.386

     11        [36m1.3863[0m  0.0970
     12        [36m1.3863[0m  0.0920
     13        [36m1.3863[0m  0.1020
     14        [36m1.3863[0m  0.0900
     15        [36m1.3863[0m  0.0920
     16        [36m1.3863[0m  0.0960
     17        [36m1.3863[0m  0.0960
     18        1.3863  0.0890
     19        1.3863  0.0870
     20        1.3863  0.0890
     21        1.3863  0.0927
     22        1.3863  0.0930
     23        1.3863  0.0920
     24        1.3863  0.0927
     25        1.3863  0.1016
     26        1.3863  0.1170
     27        1.3863  0.1093
     28        1.3863  0.0947
     29        1.3863  0.0940
     30        1.3863  0.0950
     31        1.3863  0.0890
     32        1.3863  0.0970
     33        1.3863  0.0938
     34        1.3863  0.0919
     35        1.3863  0.0880
     36        1.3863  0.0960
     37        1.3863  0.0950
     38        1.3863  0.1000
     39        1.3863  0.0889
     40        1.3863  0.0910
  epoch    train_loss     dur
-------

      3        [36m1.3849[0m  0.0950
      4        1.3849  0.0881
      5        1.3866  0.0898
      6        1.3866  0.0900
      7        1.3866  0.0920
      8        1.3866  0.0950
      9        1.3866  0.0980
     10        1.3866  0.0920
     11        1.3866  0.0940
     12        1.3866  0.0911
     13        1.3866  0.0930
     14        1.3866  0.0890
     15        1.3866  0.0890
     16        1.3866  0.0896
     17        1.3866  0.0908
     18        1.3866  0.0890
     19        1.3866  0.0960
     20        1.3866  0.0900
     21        1.3866  0.0890
     22        1.3866  0.0890
     23        1.3866  0.0896
     24        1.3866  0.0920
     25        1.3866  0.0960
     26        1.3866  0.0910
     27        1.3866  0.0910
     28        1.3866  0.0910
     29        1.3866  0.0870
     30        1.3866  0.0920
     31        1.3866  0.0980
     32        1.3866  0.0890
     33        1.3866  0.0890
     34        1.3866  0.1400
     35        1.3866  0.0930
 

      2       [36m11.9568[0m  0.1002
      3       [36m11.9426[0m  0.0970
      4       11.9568  0.0970
      5       11.9568  0.0930
      6       11.9568  0.0960
      7       11.9568  0.0980
      8       11.9568  0.0950
      9       11.9568  0.0910
     10       [36m11.9147[0m  0.0920
     11       11.9568  0.0990
     12       11.9568  0.0980
     13       11.9568  0.1050
     14       11.9568  0.0965
     15       11.9568  0.0950
     16       11.9568  0.1040
     17       11.9568  0.1023
     18       11.9568  0.1010
     19       11.9568  0.0940
     20       11.9568  0.0998
     21       11.9568  0.1030
     22       11.9568  0.0980
     23       11.9568  0.1050
     24       11.9568  0.1020
     25       11.9568  0.1020
     26       11.9568  0.1000
     27       11.9567  0.1020
     28        [36m5.5498[0m  0.1140
     29        [36m1.3869[0m  0.1010
     30        [36m1.3867[0m  0.1000
     31        [36m1.3867[0m  0.1020
     32        [36m1.3867[0m  0.110

     10        1.3865  0.0890
     11        1.3865  0.1010
     12        1.3865  0.0880
     13        1.3865  0.0900
     14        1.3865  0.0910
     15        1.3865  0.0920
     16        1.3865  0.0970
     17        1.3865  0.0920
     18        1.3865  0.0920
     19        1.3865  0.0990
     20        1.3865  0.0989
     21        1.3865  0.0920
     22        1.3865  0.0960
     23        1.3865  0.0900
     24        1.3865  0.0910
     25        1.3865  0.0940
     26        1.3865  0.0970
     27        1.3865  0.0960
     28        1.3865  0.0880
     29        1.3865  0.0930
     30        1.3865  0.0920
     31        1.3865  0.0950
     32        1.3865  0.0970
     33        1.3865  0.0991
     34        1.3865  0.0980
     35        1.3865  0.0900
     36        1.3865  0.0980
     37        1.3865  0.0950
     38        1.3865  0.0930
     39        1.3865  0.0930
     40        1.3865  0.0940
  epoch    train_loss     dur
-------  ------------  ------
      1   

     22        1.3876  0.0910
     23        1.3876  0.0960
     24        1.3876  0.0960
     25        1.3876  0.0920
     26        1.3876  0.0960
     27        1.3876  0.0920
     28        1.3876  0.0950
     29        1.3876  0.0940
     30        1.3876  0.0950
     31        1.3876  0.0910
     32        1.3876  0.0920
     33        1.3876  0.0960
     34        1.3876  0.0940
     35        1.3876  0.0950
     36        1.3876  0.0890
     37        1.3876  0.0960
     38        1.3876  0.0930
     39        1.3876  0.0950
     40        1.3876  0.0910
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9503[0m  0.0930
      2       11.9568  0.0990
      3       11.9568  0.0980
      4        [36m6.8085[0m  0.0960
      5        [36m1.3880[0m  0.0970
      6        [36m1.3875[0m  0.0980
      7        1.3875  0.1890
      8        1.3875  0.1220
      9        1.3875  0.1080
     10        1.3875  0.0920
     11        1.3875  0.0910
    

     31        1.3874  0.0910
     32        1.3874  0.1370
     33        1.3874  0.0980
     34        1.3874  0.0960
     35        1.3874  0.0930
     36        1.3874  0.0980
     37        1.3874  0.0940
     38        1.3874  0.0930
     39        1.3874  0.0920
     40        1.3874  0.0940
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m7.6262[0m  0.0960
      2        [36m2.7502[0m  0.0880
      3        5.7288  0.0920
      4        [36m1.5118[0m  0.1000
      5        [36m1.3881[0m  0.0890
      6        [36m1.3879[0m  0.0970
      7        [36m1.3878[0m  0.0950
      8        1.3878  0.0930
      9        1.3878  0.0920
     10        1.3878  0.0940
     11        1.3878  0.1020
     12        1.3878  0.0960
     13        1.3878  0.0970
     14        1.3878  0.0920
     15        1.3878  0.0960
     16        1.3878  0.0920
     17        1.3878  0.0990
     18        1.3878  0.0910
     19        1.3878  0.0970
     20        1

     24        [36m0.9102[0m  0.0980
     25        0.9108  0.0930
     26        [36m0.9097[0m  0.0990
     27        0.9115  0.0970
     28        0.9109  0.1150
     29        [36m0.9095[0m  0.1070
     30        [36m0.9070[0m  0.0970
     31        0.9085  0.1020
     32        0.9074  0.0990
     33        0.9085  0.0930
     34        0.9083  0.0970
     35        0.9074  0.0970
     36        0.9079  0.0950
     37        0.9083  0.1000
     38        0.9097  0.0900
     39        0.9152  0.0900
     40        0.9244  0.0970
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.8652[0m  0.0970
      2        [36m1.2923[0m  0.0960
      3        [36m1.2539[0m  0.0970
      4        [36m1.2025[0m  0.0950
      5        [36m1.1605[0m  0.0930
      6        [36m1.1179[0m  0.0910
      7        [36m1.0806[0m  0.0950
      8        [36m1.0285[0m  0.0890
      9        [36m0.9460[0m  0.1000
     10        [36m0.9251[0m  0.0960
    

      2        [36m1.0751[0m  0.0910
      3        [36m0.9774[0m  0.1000
      4        [36m0.9688[0m  0.0920
      5        [36m0.9665[0m  0.0930
      6        [36m0.9621[0m  0.0970
      7        [36m0.9329[0m  0.0980
      8        [36m0.9285[0m  0.0950
      9        [36m0.9217[0m  0.0960
     10        0.9243  0.0930
     11        [36m0.9216[0m  0.0950
     12        [36m0.9122[0m  0.0890
     13        [36m0.9093[0m  0.0900
     14        0.9112  0.1020
     15        0.9105  0.0930
     16        0.9163  0.0950
     17        0.9364  0.0970
     18        0.9198  0.0940
     19        0.9191  0.1010
     20        0.9128  0.1120
     21        0.9107  0.1130
     22        0.9101  0.1060
     23        0.9101  0.0920
     24        [36m0.9041[0m  0.0980
     25        [36m0.9027[0m  0.0960
     26        [36m0.9026[0m  0.0910
     27        [36m0.8993[0m  0.0970
     28        [36m0.8985[0m  0.0898
     29        [36m0.8968[0m  0.0950
     30

     25        [36m1.0673[0m  0.0970
     26        [36m1.0588[0m  0.1470
     27        [36m1.0505[0m  0.0985
     28        [36m1.0453[0m  0.0965
     29        [36m1.0429[0m  0.1028
     30        [36m1.0425[0m  0.0930
     31        [36m1.0402[0m  0.0950
     32        [36m1.0401[0m  0.0970
     33        [36m1.0336[0m  0.1020
     34        1.0352  0.0979
     35        [36m1.0284[0m  0.0920
     36        [36m1.0263[0m  0.0990
     37        1.0274  0.0940
     38        [36m1.0255[0m  0.0970
     39        [36m1.0228[0m  0.0970
     40        [36m1.0189[0m  0.0930
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.2251[0m  0.0959
      2        [36m1.3688[0m  0.0920
      3        [36m1.3426[0m  0.0950
      4        [36m1.3009[0m  0.0945
      5        [36m1.2616[0m  0.0930
      6        [36m1.1992[0m  0.0930
      7        [36m1.0412[0m  0.0950
      8        [36m1.0034[0m  0.1000
      9        1.0071 

     18        1.3895  0.1011
     19        1.3865  0.0980
     20        1.3866  0.0941
     21        1.3866  0.0990
     22        1.3866  0.1006
     23        1.3866  0.0980
     24        1.3866  0.0940
     25        1.3866  0.0930
     26        1.3866  0.0940
     27        1.3866  0.0960
     28        1.3866  0.0950
     29        1.3866  0.0940
     30        1.3866  0.0950
     31        1.3866  0.0930
     32        1.3866  0.0960
     33        1.3866  0.0950
     34        1.3866  0.0940
     35        1.3866  0.0890
     36        1.3866  0.0930
     37        1.3866  0.0970
     38        1.3866  0.0960
     39        1.3866  0.0960
     40        1.3866  0.0990
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9510[0m  0.0980
      2       11.9568  0.0990
      3       11.9568  0.0960
      4       11.9568  0.1020
      5       11.9568  0.0978
      6       11.9568  0.1040
      7       11.9568  0.1013
      8       11.9568  0.0975
 

     23        1.3866  0.0890
     24        1.3866  0.0920
     25        1.3866  0.0990
     26        1.3866  0.0930
     27        1.3866  0.0920
     28        1.3866  0.0860
     29        1.3866  0.0870
     30        1.3866  0.0900
     31        1.3866  0.0980
     32        1.3866  0.0870
     33        1.3866  0.0910
     34        1.3866  0.0860
     35        1.3866  0.0880
     36        1.3866  0.0920
     37        1.3866  0.0880
     38        1.3866  0.0900
     39        1.3866  0.0900
     40        1.3866  0.0890
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8357[0m  0.0990
      2       11.9589  0.0910
      3        [36m4.0111[0m  0.0900
      4        [36m1.3866[0m  0.0910
      5        [36m1.3865[0m  0.0870
      6        [36m1.3865[0m  0.0940
      7        1.3865  0.0940
      8        1.3865  0.0920
      9        1.3865  0.0950
     10        1.3865  0.1140
     11        1.3865  0.0940
     12        1.3865  0.

     39       11.9547  0.0933
     40       11.9547  0.0950
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8474[0m  0.0940
      2       11.9589  0.0990
      3       11.9589  0.0990
      4       11.9589  0.0950
      5       11.9589  0.0940
      6       11.9589  0.0950
      7       11.9589  0.0944
      8       11.9589  0.1078
      9       11.9589  0.1028
     10       11.9589  0.0993
     11       11.9589  0.1060
     12       11.9589  0.0957
     13       11.9589  0.1000
     14       11.9589  0.0929
     15       11.9589  0.1110
     16       11.9589  0.1080
     17       11.9589  0.1030
     18       11.9589  0.1000
     19       11.9589  0.1020
     20       11.9589  0.0970
     21       11.9589  0.1050
     22       11.9589  0.1020
     23       11.9589  0.1030
     24       11.9589  0.1050
     25       11.9589  0.1010
     26       11.9589  0.0990
     27       11.9589  0.0950
     28       11.9589  0.0926
     29       11.9589  0.0910
 

     11        1.3884  0.0940
     12        1.3884  0.0910
     13        1.3884  0.0960
     14        1.3884  0.0920
     15        1.3884  0.0980
     16        1.3884  0.0900
     17        1.3884  0.0870
     18        1.3884  0.0890
     19        1.3884  0.0900
     20        1.3884  0.0910
     21        1.3884  0.0890
     22        1.3884  0.0880
     23        1.3884  0.0930
     24        1.3884  0.0900
     25        1.3884  0.0940
     26        1.3884  0.0940
     27        1.3884  0.1037
     28        1.3884  0.1020
     29        1.3884  0.1050
     30        1.3884  0.1070
     31        1.3884  0.1630
     32        1.3884  0.1010
     33        1.3884  0.1010
     34        1.3884  0.1070
     35        1.3884  0.0950
     36        1.3884  0.1050
     37        1.3884  0.0970
     38        1.3884  0.0970
     39        1.3884  0.1010
     40        1.3884  0.1030
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8041[0m  0.1070
 

     24        1.3880  0.1060
     25        1.3880  0.1060
     26        1.3880  0.1060
     27        1.3880  0.1010
     28        1.3880  0.1040
     29        1.3880  0.1070
     30        1.3880  0.1100
     31        1.3880  0.1180
     32        1.3880  0.1220
     33        1.3880  0.1090
     34        1.3880  0.1100
     35        1.3880  0.1010
     36        1.3880  0.1090
     37        1.3880  0.1000
     38        1.3880  0.1030
     39        1.3880  0.1090
     40        1.3880  0.1030
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m3.1589[0m  0.1040
      2        [36m1.3189[0m  0.1130
      3        [36m1.2719[0m  0.1080
      4        [36m1.1843[0m  0.1050
      5        [36m1.0628[0m  0.1040
      6        [36m0.9765[0m  0.1020
      7        [36m0.9417[0m  0.1040
      8        [36m0.9412[0m  0.1040
      9        [36m0.9251[0m  0.0990
     10        [36m0.9165[0m  0.0990
     11        [36m0.9138[0m  0.1050
 

      6        [36m1.3867[0m  0.1080
      7        [36m1.3851[0m  0.1070
      8        [36m1.3804[0m  0.1000
      9        [36m1.3740[0m  0.0980
     10        [36m1.3671[0m  0.1080
     11        [36m1.3597[0m  0.1100
     12        [36m1.3507[0m  0.1180
     13        [36m1.3364[0m  0.1070
     14        [36m1.3151[0m  0.1020
     15        [36m1.2677[0m  0.1130
     16        [36m1.2148[0m  0.1070
     17        [36m1.1806[0m  0.1140
     18        [36m1.1591[0m  0.1200
     19        [36m1.1331[0m  0.1720
     20        [36m1.1033[0m  0.1180
     21        [36m1.0945[0m  0.1260
     22        [36m1.0765[0m  0.1420
     23        [36m1.0668[0m  0.1180
     24        [36m1.0512[0m  0.1270
     25        [36m1.0459[0m  0.1170
     26        [36m1.0313[0m  0.1020
     27        [36m1.0219[0m  0.1080
     28        [36m1.0146[0m  0.1070
     29        [36m1.0106[0m  0.1170
     30        [36m1.0042[0m  0.1130
     31        [36m0.999

     24        [36m0.9228[0m  0.1230
     25        0.9245  0.1370
     26        0.9231  0.1110
     27        0.9239  0.1000
     28        0.9230  0.1150
     29        0.9230  0.1020
     30        0.9238  0.1040
     31        0.9232  0.1030
     32        [36m0.9220[0m  0.1030
     33        0.9238  0.0940
     34        0.9234  0.0990
     35        [36m0.9218[0m  0.1060
     36        0.9227  0.0980
     37        0.9236  0.1000
     38        0.9225  0.1040
     39        0.9225  0.1030
     40        0.9231  0.1070
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7870[0m  0.1030
      2        [36m1.3924[0m  0.1020
      3        [36m1.3903[0m  0.1000
      4        [36m1.3889[0m  0.0990
      5        [36m1.3880[0m  0.1017
      6        [36m1.3874[0m  0.1030
      7        [36m1.3871[0m  0.1000
      8        [36m1.3868[0m  0.1100
      9        [36m1.3866[0m  0.1300
     10        [36m1.3865[0m  0.1100
     11      

     17       11.9547  0.1040
     18       11.9547  0.1080
     19       11.9547  0.1030
     20       11.9547  0.1070
     21       11.9547  0.1050
     22       11.9547  0.0990
     23       11.9547  0.0960
     24       11.9547  0.1050
     25       11.9547  0.1090
     26       11.9547  0.1030
     27       11.9547  0.1150
     28       11.9547  0.1190
     29       11.9547  0.1140
     30       11.9547  0.1100
     31       11.9547  0.1100
     32       11.9547  0.1170
     33       11.9547  0.1040
     34       11.9547  0.0950
     35       11.9547  0.0930
     36       11.9547  0.1000
     37       11.9547  0.0970
     38       11.9547  0.0950
     39       11.9547  0.1010
     40       11.9547  0.1130
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8606[0m  0.1130
      2       11.9568  0.1020
      3       11.9568  0.0950
      4       11.9568  0.0990
      5       11.9568  0.1009
      6       11.9568  0.1101
      7       11.9568  0.1330
 

     34        1.3865  0.1035
     35        1.3865  0.0970
     36        1.3865  0.0960
     37        1.3865  0.0962
     38        1.3865  0.0966
     39        1.3865  0.0990
     40        1.3865  0.0990
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7626[0m  0.0970
      2        [36m1.3868[0m  0.0960
      3        [36m1.3866[0m  0.1130
      4        1.3866  0.0980
      5        1.3866  0.0970
      6        1.3866  0.1000
      7        [36m1.3866[0m  0.0960
      8        [36m1.3865[0m  0.0960
      9        [36m1.3865[0m  0.1030
     10        [36m1.3865[0m  0.1020
     11        [36m1.3865[0m  0.1140
     12        1.3865  0.0960
     13        1.3865  0.1000
     14        1.3865  0.1530
     15        1.3865  0.1139
     16        1.3865  0.1220
     17        1.3865  0.1018
     18        1.3865  0.0990
     19        1.3865  0.0980
     20        1.3865  0.0930
     21        1.3865  0.0980
     22        1.3866  0.100

      2       11.9568  0.1180
      3        [36m8.8319[0m  0.1120
      4        [36m1.3866[0m  0.1080
      5        [36m1.3865[0m  0.1020
      6        [36m1.3861[0m  0.1000
      7        [36m1.3635[0m  0.0980
      8        [36m1.3619[0m  0.0980
      9        1.3865  0.1010
     10        1.3865  0.0960
     11        1.3865  0.1010
     12        1.3865  0.1190
     13        1.3865  0.1030
     14        1.3865  0.1090
     15        1.3865  0.0990
     16        1.3865  0.1010
     17        1.3865  0.1020
     18        1.3865  0.1010
     19        1.3865  0.0960
     20        1.3865  0.1040
     21        1.3865  0.0967
     22        1.3865  0.1130
     23        1.3865  0.0980
     24        1.3865  0.0980
     25        1.3865  0.1130
     26        1.3865  0.1080
     27        1.3865  0.1060
     28        1.3865  0.1487
     29        1.3865  0.1160
     30        1.3865  0.1027
     31        1.3865  0.1130
     32        1.3865  0.1020
     33        1

     18        1.3876  0.1040
     19        1.3876  0.1020
     20        1.3876  0.1040
     21        1.3876  0.1100
     22        1.3876  0.1140
     23        1.3876  0.1130
     24        1.3876  0.1040
     25        1.3876  0.1070
     26        1.3876  0.1070
     27        1.3876  0.1100
     28        1.3876  0.1130
     29        1.3876  0.1030
     30        1.3876  0.1010
     31        1.3876  0.1080
     32        1.3876  0.1050
     33        1.3876  0.1010
     34        1.3876  0.1050
     35        1.3876  0.1110
     36        1.3876  0.1080
     37        1.3876  0.1080
     38        1.3876  0.1030
     39        1.3876  0.1040
     40        1.3876  0.1030
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8916[0m  0.1080
      2       11.9568  0.1070
      3       11.9568  0.1040
      4       [36m11.8596[0m  0.1060
      5        [36m1.3878[0m  0.1050
      6        [36m1.3875[0m  0.1040
      7        1.3875  0.1040
    

     30        1.3874  0.1162
     31        1.3874  0.1020
     32        1.3874  0.1089
     33        1.3874  0.1190
     34        1.3874  0.1120
     35        1.3874  0.1590
     36        1.3874  0.1149
     37        1.3874  0.1173
     38        1.3874  0.1099
     39        1.3874  0.1093
     40        1.3874  0.1019
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.4590[0m  0.1031
      2        [36m4.4270[0m  0.1070
      3       10.9856  0.1050
      4       11.6871  0.1058
      5        6.1632  0.1060
      6        4.5783  0.1020
      7       11.0496  0.1090
      8        6.6774  0.1042
      9        [36m1.6158[0m  0.1010
     10        5.1933  0.1053
     11        9.9536  0.1060
     12        9.2915  0.1130
     13       10.6062  0.1070
     14        5.3153  0.1092
     15        4.6687  0.1040
     16        [36m1.5807[0m  0.1040
     17        1.7285  0.1080
     18        1.5990  0.1050
     19        [36m1.5221[0m  0.

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7945[0m  0.0950
      2        [36m1.3919[0m  0.1000
      3        [36m1.3840[0m  0.1060
      4        [36m1.3758[0m  0.0980
      5        [36m1.3671[0m  0.1000
      6        [36m1.3545[0m  0.1000
      7        [36m1.3361[0m  0.1060
      8        [36m1.3106[0m  0.1030
      9        [36m1.2809[0m  0.1000
     10        [36m1.2451[0m  0.0970
     11        [36m1.2181[0m  0.0980
     12        [36m1.1961[0m  0.1060
     13        [36m1.1772[0m  0.0970
     14        [36m1.1620[0m  0.0970
     15        [36m1.1471[0m  0.1020
     16        [36m1.1365[0m  0.0990
     17        [36m1.1300[0m  0.1060
     18        [36m1.1271[0m  0.0980
     19        [36m1.1203[0m  0.0960
     20        [36m1.1123[0m  0.0960
     21        [36m1.0978[0m  0.0980
     22        [36m1.0936[0m  0.1050
     23        [36m1.0859[0m  0.0980
     24        [36m1.0780[0m  0.0990
    

     17        [36m1.3864[0m  0.0910
     18        [36m1.3864[0m  0.0920
     19        [36m1.3863[0m  0.0890
     20        [36m1.3863[0m  0.0870
     21        [36m1.3863[0m  0.0890
     22        1.3863  0.0930
     23        [36m1.3863[0m  0.0880
     24        [36m1.3862[0m  0.0850
     25        [36m1.3862[0m  0.0870
     26        1.3863  0.0880
     27        1.3863  0.0890
     28        [36m1.3862[0m  0.0860
     29        1.3862  0.0930
     30        [36m1.3860[0m  0.0840
     31        1.3862  0.0910
     32        [36m1.3854[0m  0.0870
     33        1.3861  0.0870
     34        1.3863  0.0910
     35        1.3863  0.0890
     36        1.3863  0.0960
     37        1.3863  0.0870
     38        1.3863  0.0860
     39        1.3863  0.0900
     40        1.3863  0.0891
     41        1.3863  0.0860
     42        1.3863  0.0870
     43        1.3863  0.0920
     44        1.3863  0.0830
     45        1.3863  0.0910
     46        1.3863  0.0839
 

     32        [36m0.9388[0m  0.0910
     33        [36m0.9384[0m  0.0960
     34        [36m0.9373[0m  0.0980
     35        0.9375  0.1040
     36        0.9377  0.0960
     37        0.9376  0.0920
     38        [36m0.9368[0m  0.0930
     39        [36m0.9368[0m  0.1000
     40        [36m0.9367[0m  0.0940
     41        0.9370  0.0940
     42        0.9367  0.1090
     43        0.9367  0.0890
     44        0.9367  0.0960
     45        [36m0.9366[0m  0.1016
     46        [36m0.9365[0m  0.0990
     47        [36m0.9365[0m  0.0980
     48        [36m0.9364[0m  0.0940
     49        0.9364  0.0880
     50        [36m0.9362[0m  0.0880
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4950[0m  0.0900
      2        [36m1.4125[0m  0.1000
      3        [36m1.4035[0m  0.0980
      4        [36m1.3975[0m  0.1010
      5        [36m1.3936[0m  0.0950
      6        [36m1.3910[0m  0.0940
      7        [36m1.3893[0m  0.092

     48        1.3863  0.1020
     49        1.3863  0.0920
     50        1.3863  0.0970
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5847[0m  0.0960
      2        [36m1.3864[0m  0.0966
      3        1.3865  0.1000
      4        1.3866  0.0980
      5        1.3866  0.0930
      6        1.3866  0.0910
      7        1.3866  0.0910
      8        1.3866  0.0930
      9        1.3866  0.0880
     10        1.3866  0.0940
     11        1.3866  0.0970
     12        1.3866  0.0980
     13        1.3866  0.0920
     14        1.3866  0.0980
     15        1.3866  0.0890
     16        1.3866  0.0870
     17        1.3866  0.0937
     18        1.3866  0.0940
     19        1.3866  0.0960
     20        1.3866  0.0920
     21        1.3866  0.0960
     22        1.3866  0.0900
     23        1.3866  0.0970
     24        1.3866  0.0980
     25        1.3866  0.0980
     26        1.3866  0.1039
     27        1.3866  0.1010
     28        1.3866 

     24        [36m1.3865[0m  0.0950
     25        [36m1.3865[0m  0.0950
     26        [36m1.3865[0m  0.0990
     27        [36m1.3865[0m  0.0990
     28        [36m1.3865[0m  0.1240
     29        [36m1.3865[0m  0.0960
     30        [36m1.3865[0m  0.0930
     31        [36m1.3865[0m  0.0930
     32        [36m1.3865[0m  0.0980
     33        [36m1.3865[0m  0.0970
     34        [36m1.3865[0m  0.0960
     35        [36m1.3865[0m  0.0990
     36        [36m1.3865[0m  0.0920
     37        [36m1.3865[0m  0.0890
     38        [36m1.3865[0m  0.0920
     39        [36m1.3865[0m  0.0860
     40        [36m1.3865[0m  0.0890
     41        [36m1.3865[0m  0.0920
     42        [36m1.3865[0m  0.0954
     43        [36m1.3865[0m  0.0950
     44        [36m1.3865[0m  0.0920
     45        [36m1.3865[0m  0.0910
     46        [36m1.3865[0m  0.1000
     47        [36m1.3865[0m  0.0970
     48        [36m1.3865[0m  0.0930
     49        [36m1.386

      2        [36m1.3870[0m  0.0880
      3        [36m1.3865[0m  0.0900
      4        1.3865  0.1210
      5        1.3865  0.0950
      6        1.3865  0.0940
      7        1.3865  0.0880
      8        1.3865  0.0930
      9        1.3865  0.0800
     10        1.3865  0.0850
     11        1.3865  0.0850
     12        1.3865  0.0870
     13        1.3865  0.0850
     14        1.3865  0.0830
     15        1.3865  0.0800
     16        1.3865  0.0800
     17        1.3865  0.0800
     18        1.3865  0.0820
     19        1.3865  0.0820
     20        1.3865  0.0840
     21        1.3865  0.0840
     22        1.3865  0.0840
     23        1.3865  0.0800
     24        1.3865  0.0810
     25        1.3865  0.0870
     26        1.3865  0.0820
     27        1.3865  0.0880
     28        1.3865  0.0830
     29        1.3865  0.0830
     30        1.3865  0.0790
     31        1.3865  0.0810
     32        1.3865  0.0820
     33        1.3865  0.0800
     34        1.3865 

     10        1.3865  0.0920
     11        1.3865  0.0900
     12        1.3865  0.0890
     13        1.3865  0.0860
     14        1.3865  0.0810
     15        1.3865  0.0860
     16        1.3865  0.0820
     17        1.3865  0.0910
     18        1.3865  0.0880
     19        1.3865  0.0810
     20        1.3865  0.0810
     21        1.3865  0.0840
     22        1.3865  0.0940
     23        1.3865  0.0950
     24        1.3865  0.0940
     25        1.3865  0.0930
     26        1.3865  0.0830
     27        1.3865  0.0890
     28        1.3865  0.0810
     29        1.3865  0.0850
     30        1.3865  0.0820
     31        1.3865  0.0900
     32        1.3865  0.0880
     33        1.3865  0.0830
     34        1.3865  0.0930
     35        1.3865  0.0800
     36        1.3865  0.0850
     37        1.3865  0.0850
     38        1.3865  0.0850
     39        1.3865  0.0870
     40        1.3865  0.0830
     41        1.3865  0.0820
     42        1.3865  0.0860
     43   

     10        [36m1.3882[0m  0.1030
     11        [36m1.3882[0m  0.1080
     12        [36m1.3882[0m  0.0910
     13        [36m1.3882[0m  0.0900
     14        [36m1.3882[0m  0.0900
     15        [36m1.3882[0m  0.0910
     16        [36m1.3882[0m  0.0960
     17        [36m1.3882[0m  0.0920
     18        [36m1.3882[0m  0.0880
     19        [36m1.3882[0m  0.0830
     20        [36m1.3882[0m  0.0880
     21        [36m1.3882[0m  0.0920
     22        1.3882  0.0990
     23        [36m1.3882[0m  0.0960
     24        [36m1.3882[0m  0.0910
     25        [36m1.3882[0m  0.0890
     26        [36m1.3882[0m  0.0820
     27        1.3882  0.0900
     28        1.3882  0.0860
     29        1.3882  0.0910
     30        [36m1.3882[0m  0.0870
     31        1.3882  0.0820
     32        1.3882  0.0850
     33        1.3882  0.0900
     34        1.3882  0.0870
     35        1.3882  0.0890
     36        1.3882  0.0880
     37        1.3882  0.0900
     38

      9        [36m1.3881[0m  0.0830
     10        [36m1.3881[0m  0.0830
     11        1.3881  0.0830
     12        1.3881  0.0840
     13        1.3881  0.0830
     14        [36m1.3881[0m  0.0790
     15        1.3881  0.0820
     16        1.3881  0.0810
     17        1.3881  0.0910
     18        1.3881  0.0870
     19        1.3881  0.0840
     20        1.3881  0.0860
     21        1.3881  0.0800
     22        1.3881  0.0820
     23        1.3881  0.0830
     24        1.3881  0.0800
     25        1.3881  0.0910
     26        1.3881  0.0820
     27        1.3881  0.0930
     28        1.3881  0.0900
     29        1.3881  0.0890
     30        1.3881  0.0810
     31        1.3881  0.0810
     32        1.3881  0.0860
     33        1.3881  0.0870
     34        1.3881  0.0820
     35        1.3881  0.0830
     36        1.3881  0.0800
     37        1.3881  0.0830
     38        1.3881  0.0820
     39        1.3881  0.0810
     40        1.3881  0.0820
     41      

     15        1.3880  0.0850
     16        1.3880  0.0870
     17        1.3880  0.0870
     18        1.3880  0.0830
     19        1.3880  0.0790
     20        1.3880  0.0840
     21        1.3880  0.0920
     22        1.3880  0.1210
     23        1.3880  0.0850
     24        1.3880  0.0810
     25        1.3880  0.0820
     26        1.3880  0.0830
     27        1.3880  0.0830
     28        1.3880  0.0820
     29        1.3880  0.0820
     30        1.3880  0.0840
     31        1.3880  0.0810
     32        1.3880  0.0880
     33        1.3880  0.0930
     34        1.3880  0.0870
     35        1.3880  0.0800
     36        1.3880  0.0860
     37        1.3880  0.0860
     38        1.3880  0.0810
     39        1.3880  0.0870
     40        1.3880  0.0890
     41        1.3880  0.0850
     42        1.3880  0.0940
     43        1.3880  0.0920
     44        1.3880  0.0890
     45        1.3880  0.0900
     46        1.3880  0.0830
     47        1.3880  0.0860
     48   

     38        [36m1.3863[0m  0.0910
     39        [36m1.3863[0m  0.0840
     40        [36m1.3863[0m  0.0940
     41        [36m1.3863[0m  0.0880
     42        [36m1.3863[0m  0.0860
     43        1.3863  0.0910
     44        [36m1.3863[0m  0.0820
     45        [36m1.3863[0m  0.0970
     46        1.3863  0.0890
     47        1.3863  0.0870
     48        [36m1.3863[0m  0.0960
     49        1.3863  0.0820
     50        [36m1.3863[0m  0.0810
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5880[0m  0.0840
      2        [36m1.3611[0m  0.0830
      3        [36m1.3196[0m  0.0920
      4        [36m1.2568[0m  0.0880
      5        [36m1.1598[0m  0.0860
      6        [36m1.0730[0m  0.0820
      7        [36m1.0529[0m  0.0840
      8        [36m1.0224[0m  0.0860
      9        [36m0.9984[0m  0.0820
     10        [36m0.9875[0m  0.0850
     11        [36m0.9721[0m  0.0830
     12        [36m0.9599[0m  0.0860
 

      5        [36m1.2778[0m  0.0860
      6        [36m1.2117[0m  0.0890
      7        [36m1.1485[0m  0.0880
      8        [36m1.1046[0m  0.0880
      9        1.1053  0.0820
     10        [36m1.0626[0m  0.0810
     11        1.0678  0.0830
     12        [36m1.0469[0m  0.0880
     13        [36m1.0444[0m  0.0860
     14        [36m1.0354[0m  0.0880
     15        [36m1.0196[0m  0.0940
     16        1.0255  0.0850
     17        [36m0.9995[0m  0.0900
     18        1.0047  0.0950
     19        [36m0.9857[0m  0.0910
     20        [36m0.9778[0m  0.0830
     21        1.0310  0.0860
     22        [36m0.9722[0m  0.0880
     23        [36m0.9689[0m  0.0820
     24        0.9731  0.0850
     25        0.9942  0.0840
     26        [36m0.9560[0m  0.0840
     27        0.9724  0.0850
     28        [36m0.9525[0m  0.0850
     29        0.9582  0.0910
     30        0.9598  0.0950
     31        [36m0.9429[0m  0.0840
     32        0.9469  0.0890
     33

     30        [36m1.3863[0m  0.1760
     31        [36m1.3863[0m  0.1110
     32        [36m1.3863[0m  0.1009
     33        [36m1.3863[0m  0.0920
     34        [36m1.3863[0m  0.0851
     35        [36m1.3863[0m  0.0891
     36        [36m1.3863[0m  0.0869
     37        [36m1.3863[0m  0.0889
     38        [36m1.3863[0m  0.0951
     39        [36m1.3863[0m  0.0932
     40        [36m1.3863[0m  0.0969
     41        [36m1.3863[0m  0.1377
     42        [36m1.3863[0m  0.1090
     43        [36m1.3863[0m  0.0900
     44        1.3863  0.0910
     45        [36m1.3863[0m  0.0850
     46        [36m1.3863[0m  0.0865
     47        1.3863  0.0880
     48        [36m1.3863[0m  0.0910
     49        [36m1.3863[0m  0.0910
     50        [36m1.3863[0m  0.0830
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.8080[0m  0.0820
      2        [36m1.2496[0m  0.0928
      3        [36m1.1405[0m  0.0850
      4        [36m1.

      3       11.9568  0.0951
      4       11.9568  0.0970
      5       11.9568  0.0940
      6       11.9568  0.0870
      7       11.9568  0.0960
      8       11.9568  0.0880
      9       11.9568  0.1000
     10       11.9568  0.1000
     11       11.9568  0.1080
     12       11.9568  0.0970
     13       11.9568  0.0960
     14       11.9568  0.0870
     15       11.9568  0.0974
     16       11.9568  0.1070
     17       11.9568  0.1020
     18       11.9568  0.0940
     19       11.9568  0.0910
     20       11.9568  0.0920
     21       11.9568  0.0900
     22       11.9568  0.0959
     23       11.9568  0.0990
     24       11.9568  0.0910
     25       11.9568  0.0910
     26       11.9568  0.0920
     27       11.9568  0.0950
     28       11.9568  0.0880
     29       11.9568  0.0970
     30       11.9568  0.0950
     31       11.9568  0.0940
     32       11.9568  0.0970
     33       11.9568  0.1050
     34       11.9568  0.0870
     35       11.9568  0.0940
     36   

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5196[0m  0.0830
      2        [36m1.3867[0m  0.0900
      3        [36m1.3865[0m  0.0880
      4        [36m1.3865[0m  0.0820
      5        1.3865  0.0820
      6        1.3865  0.0870
      7        1.3865  0.0910
      8        1.3865  0.0830
      9        1.3865  0.0850
     10        1.3865  0.0840
     11        1.3865  0.0820
     12        1.3865  0.0810
     13        1.3865  0.0860
     14        1.3865  0.0820
     15        1.3865  0.0900
     16        1.3865  0.0910
     17        1.3865  0.0890
     18        1.3865  0.0880
     19        1.3865  0.0940
     20        1.3865  0.0860
     21        1.3865  0.0880
     22        1.3865  0.0840
     23        1.3865  0.0870
     24        1.3865  0.0820
     25        1.3865  0.0910
     26        1.3865  0.0850
     27        1.3865  0.0900
     28        1.3865  0.0880
     29        1.3865  0.0900
     30        1.3865  0.0890
    

     44        1.3865  0.0930
     45        1.3865  0.0880
     46        1.3865  0.0870
     47        1.3865  0.0870
     48        1.3865  0.0870
     49        1.3865  0.0820
     50        1.3865  0.0870
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7332[0m  0.0880
      2       [36m10.2029[0m  0.0900
      3        [36m1.3872[0m  0.0870
      4        [36m1.3865[0m  0.0820
      5        [36m1.3865[0m  0.0860
      6        [36m1.3865[0m  0.0900
      7        [36m1.3865[0m  0.0830
      8        1.3865  0.0860
      9        1.3865  0.0890
     10        1.3865  0.0890
     11        1.3865  0.0870
     12        1.3865  0.0880
     13        1.3865  0.0920
     14        1.3865  0.0960
     15        1.3865  0.0830
     16        1.3865  0.0820
     17        1.3865  0.0810
     18        1.3865  0.1100
     19        1.3865  0.0890
     20        1.3865  0.0880
     21        1.3865  0.0850
     22        1.3865  0.0879
     23

     41        1.3876  0.0940
     42        1.3876  0.0810
     43        1.3876  0.0880
     44        1.3876  0.0890
     45        1.3876  0.0820
     46        1.3876  0.0860
     47        1.3876  0.0930
     48        1.3876  0.0930
     49        1.3876  0.0990
     50        [36m1.3876[0m  0.0910
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8880[0m  0.0930
      2       11.9589  0.0940
      3       11.9589  0.0860
      4       11.9589  0.0910
      5       11.9589  0.0850
      6       11.9589  0.0850
      7       11.9589  0.0950
      8       11.9589  0.0910
      9       11.9589  0.0870
     10       11.9589  0.0930
     11       11.9589  0.0858
     12       11.9589  0.0879
     13       11.9589  0.0970
     14       11.9589  0.0890
     15       11.9589  0.0850
     16       11.9589  0.0910
     17       11.9589  0.0930
     18       11.9589  0.0950
     19       11.9589  0.0880
     20       11.9589  0.0910
     21       11.9589 

     48        1.3875  0.0866
     49        1.3875  0.0920
     50        1.3875  0.0870
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6376[0m  0.0860
      2        [36m1.3879[0m  0.0880
      3        [36m1.3879[0m  0.0910
      4        [36m1.3879[0m  0.0890
      5        [36m1.3879[0m  0.0830
      6        [36m1.3879[0m  0.0910
      7        [36m1.3879[0m  0.1130
      8        1.3879  0.1040
      9        [36m1.3879[0m  0.0853
     10        1.3879  0.0930
     11        [36m1.3879[0m  0.0950
     12        1.3879  0.0940
     13        [36m1.3879[0m  0.0940
     14        1.3879  0.0910
     15        1.3879  0.0850
     16        1.3879  0.0880
     17        1.3879  0.0893
     18        1.3879  0.0960
     19        1.3879  0.0920
     20        1.3879  0.0864
     21        1.3879  0.0820
     22        1.3879  0.0890
     23        1.3879  0.0950
     24        1.3879  0.0950
     25        1.3879  0.0930
     26   

     50        1.3874  0.0900
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.2892[0m  0.0850
      2       11.6259  0.0951
      3        [36m6.7280[0m  0.0933
      4        [36m1.5582[0m  0.0880
      5        7.3487  0.0870
      6        6.1868  0.0890
      7       10.2183  0.0951
      8        5.5680  0.0880
      9        7.8144  0.0881
     10        6.8368  0.0941
     11        6.1807  0.0951
     12        [36m1.4427[0m  0.0850
     13        [36m1.3885[0m  0.0891
     14        [36m1.3878[0m  0.0921
     15        1.3878  0.0863
     16        1.3878  0.0929
     17        1.3878  0.0893
     18        1.3878  0.0910
     19        1.3878  0.0940
     20        1.3878  0.0890
     21        1.3878  0.0840
     22        1.3878  0.0880
     23        1.3878  0.0910
     24        1.3878  0.0960
     25        1.3878  0.0840
     26        1.3878  0.0880
     27        1.3878  0.0810
     28        1.3878  0.0880
     29        1

     42        [36m0.8721[0m  0.1040
     43        [36m0.8708[0m  0.0970
     44        0.8717  0.0990
     45        0.8721  0.0940
     46        0.8713  0.1028
     47        0.8726  0.1010
     48        [36m0.8695[0m  0.1070
     49        0.8711  0.1150
     50        0.8731  0.0990
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7136[0m  0.0990
      2        [36m1.2098[0m  0.0970
      3        [36m1.0490[0m  0.0900
      4        [36m0.9685[0m  0.0870
      5        [36m0.9468[0m  0.0890
      6        [36m0.9367[0m  0.0930
      7        0.9400  0.0950
      8        [36m0.9204[0m  0.0840
      9        [36m0.9144[0m  0.0910
     10        [36m0.9089[0m  0.0900
     11        0.9124  0.0900
     12        0.9126  0.0870
     13        0.9359  0.0910
     14        0.9265  0.0890
     15        0.9113  0.0880
     16        0.9145  0.0830
     17        [36m0.9044[0m  0.0920
     18        0.9050  0.0970
     19      

      6        [36m1.0240[0m  0.0880
      7        [36m0.9797[0m  0.0995
      8        [36m0.9788[0m  0.0930
      9        [36m0.9464[0m  0.0870
     10        [36m0.9386[0m  0.0850
     11        [36m0.9275[0m  0.0880
     12        [36m0.9219[0m  0.0910
     13        [36m0.9155[0m  0.0900
     14        [36m0.9153[0m  0.0900
     15        [36m0.9121[0m  0.0886
     16        [36m0.9087[0m  0.0940
     17        [36m0.9054[0m  0.0870
     18        [36m0.9053[0m  0.0850
     19        [36m0.9033[0m  0.0930
     20        [36m0.9025[0m  0.0940
     21        [36m0.9016[0m  0.0910
     22        [36m0.9001[0m  0.0890
     23        [36m0.9000[0m  0.0870
     24        [36m0.8981[0m  0.0830
     25        [36m0.8977[0m  0.0920
     26        0.8982  0.0870
     27        0.8985  0.0890
     28        [36m0.8975[0m  0.0930
     29        0.8978  0.0870
     30        [36m0.8965[0m  0.0890
     31        0.8965  0.0880
     32        [36m0.

     24        [36m1.0575[0m  0.0900
     25        [36m1.0550[0m  0.0869
     26        [36m1.0481[0m  0.0850
     27        [36m1.0454[0m  0.0890
     28        1.0474  0.0870
     29        1.0485  0.0930
     30        1.0473  0.0870
     31        1.0474  0.0850
     32        [36m1.0407[0m  0.0970
     33        [36m1.0405[0m  0.0890
     34        1.0410  0.0940
     35        [36m1.0368[0m  0.0930
     36        1.0373  0.0850
     37        1.0384  0.0870
     38        [36m1.0359[0m  0.0910
     39        [36m1.0335[0m  0.0880
     40        1.0349  0.0890
     41        1.0356  0.0950
     42        1.0342  0.0910
     43        [36m1.0334[0m  0.0930
     44        [36m1.0294[0m  0.0898
     45        [36m1.0264[0m  0.0930
     46        [36m1.0242[0m  0.0920
     47        1.0249  0.0890
     48        [36m1.0156[0m  0.0880
     49        [36m1.0150[0m  0.0900
     50        1.0172  0.0950
  epoch    train_loss     dur
-------  ------------  --

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.9892[0m  0.0880
      2        [36m1.3864[0m  0.0930
      3        [36m1.3844[0m  0.0900
      4        [36m1.3726[0m  0.0840
      5        1.3869  0.0900
      6        1.3867  0.0870
      7        1.3867  0.0930
      8        1.3867  0.0950
      9        1.3867  0.0850
     10        1.3867  0.0850
     11        1.3867  0.0860
     12        1.3867  0.1110
     13        1.3867  0.0882
     14        1.3867  0.0870
     15        1.3867  0.0860
     16        1.3867  0.0860
     17        1.3867  0.0880
     18        1.3867  0.0830
     19        1.3867  0.0910
     20        1.3867  0.0840
     21        1.3867  0.0940
     22        1.3867  0.0900
     23        1.3867  0.0920
     24        1.3867  0.0950
     25        1.3867  0.0880
     26        1.3867  0.0840
     27        1.3867  0.0950
     28        1.3867  0.0920
     29        1.3867  0.0890
     30        1.3867  0.0930
    

      9       11.9568  0.0890
     10       11.9568  0.0970
     11       11.9568  0.0940
     12       11.9568  0.0950
     13       11.9568  0.0920
     14       11.9568  0.0870
     15       11.9568  0.0850
     16       11.9568  0.0920
     17       11.9568  0.0846
     18       11.9568  0.0942
     19       11.9633  0.0880
     20       11.9589  0.0880
     21       11.9589  0.0960
     22       11.9589  0.0900
     23       11.9589  0.0920
     24       11.9589  0.1090
     25       11.9589  0.0920
     26       11.9589  0.0990
     27       11.9589  0.0920
     28       11.9589  0.0880
     29       11.9589  0.0890
     30       11.9589  0.0860
     31       11.9589  0.0900
     32       11.9589  0.0881
     33       11.9589  0.0892
     34       11.9589  0.0851
     35       11.9589  0.0891
     36       11.9589  0.0872
     37       [36m10.0718[0m  0.0830
     38        [36m1.3866[0m  0.0880
     39        [36m1.3865[0m  0.0880
     40        1.3866  0.0960
     41      

      6        [36m1.3866[0m  0.0920
      7        [36m1.3866[0m  0.0870
      8        [36m1.3866[0m  0.0880
      9        [36m1.3866[0m  0.0890
     10        [36m1.3866[0m  0.0840
     11        1.3866  0.0880
     12        1.3866  0.0916
     13        1.3866  0.0860
     14        1.3866  0.0860
     15        1.3866  0.0890
     16        1.3866  0.0930
     17        1.3866  0.0950
     18        1.3866  0.0850
     19        1.3866  0.1080
     20        1.3866  0.0890
     21        1.3866  0.0960
     22        1.3866  0.0870
     23        1.3866  0.0830
     24        1.3866  0.0870
     25        1.3866  0.0900
     26        1.3866  0.0850
     27        1.3866  0.0910
     28        1.3866  0.0910
     29        1.3866  0.0880
     30        1.3866  0.0960
     31        1.3866  0.0960
     32        1.3866  0.0870
     33        1.3866  0.0850
     34        1.3866  0.0910
     35        1.3866  0.0840
     36        1.3866  0.0890
     37        1.3866  0.

      9       11.9568  0.1030
     10       11.9568  0.1020
     11       11.9568  0.0950
     12       11.9568  0.0940
     13       11.9568  0.0960
     14       11.9568  0.1000
     15       11.9568  0.0980
     16       11.9568  0.0970
     17       11.9568  0.0980
     18       11.9568  0.0980
     19       11.9568  0.0970
     20       11.9568  0.0980
     21       11.9568  0.0970
     22       11.9568  0.1020
     23       11.9568  0.1000
     24       11.9568  0.1000
     25       11.9568  0.1027
     26       11.9568  0.0980
     27       11.9568  0.1010
     28       11.9568  0.0970
     29       11.9568  0.0990
     30       11.9568  0.0970
     31       11.9568  0.0990
     32       11.9568  0.0958
     33       11.9568  0.0960
     34       11.9568  0.1010
     35       11.9568  0.1040
     36       11.9568  0.0930
     37       11.9568  0.0960
     38       11.9568  0.1220
     39       11.9568  0.0980
     40       11.9568  0.0976
     41       11.9568  0.1030
     42   

      7        [36m1.3877[0m  0.0930
      8        [36m1.3876[0m  0.0920
      9        1.3876  0.0920
     10        1.3876  0.0990
     11        1.3876  0.0950
     12        1.3876  0.0930
     13        1.3876  0.0911
     14        1.3876  0.0990
     15        1.3876  0.0930
     16        1.3876  0.0980
     17        1.3876  0.0920
     18        1.3876  0.0970
     19        1.3876  0.0990
     20        1.3876  0.0930
     21        1.3876  0.0940
     22        1.3876  0.0910
     23        1.3876  0.0830
     24        1.3876  0.0900
     25        1.3876  0.0840
     26        1.3876  0.0860
     27        1.3876  0.0832
     28        1.3876  0.0892
     29        1.3876  0.0860
     30        1.3876  0.0890
     31        1.3876  0.0980
     32        1.3876  0.0910
     33        1.3876  0.0860
     34        1.3876  0.0850
     35        1.3876  0.0870
     36        1.3876  0.0880
     37        1.3876  0.1130
     38        1.3876  0.0960
     39        1.3876 

     12       11.7763  0.0980
     13        7.4954  0.0920
     14        3.1290  0.0880
     15       10.8805  0.0910
     16        5.0998  0.0870
     17        3.2474  0.0915
     18        [36m1.4860[0m  0.0830
     19        9.0584  0.0930
     20        1.6218  0.0920
     21        [36m1.3947[0m  0.0870
     22        [36m1.3874[0m  0.0900
     23        [36m1.3873[0m  0.0910
     24        1.3874  0.0900
     25        1.3874  0.0880
     26        1.3874  0.0840
     27        1.3874  0.0970
     28        1.3874  0.0900
     29        1.3874  0.0920
     30        1.3874  0.0890
     31        1.3874  0.0970
     32        1.3874  0.0910
     33        1.3874  0.0910
     34        1.3874  0.0850
     35        1.3874  0.0860
     36        1.3874  0.0900
     37        1.3874  0.0940
     38        1.3874  0.0940
     39        1.3874  0.0910
     40        1.3874  0.0890
     41        1.3874  0.0920
     42        1.3874  0.0930
     43        1.3874  0.0900
    

     14        [36m0.9269[0m  0.0920
     15        [36m0.9255[0m  0.0910
     16        [36m0.9245[0m  0.0930
     17        [36m0.9239[0m  0.0900
     18        0.9241  0.0890
     19        0.9242  0.0880
     20        0.9245  0.0900
     21        0.9261  0.0890
     22        0.9278  0.0943
     23        0.9311  0.0897
     24        0.9420  0.0850
     25        0.9415  0.0920
     26        0.9293  0.0920
     27        0.9278  0.0880
     28        0.9255  0.0920
     29        [36m0.9224[0m  0.0980
     30        [36m0.9202[0m  0.0870
     31        [36m0.9173[0m  0.0890
     32        [36m0.9153[0m  0.0940
     33        [36m0.9129[0m  0.0965
     34        [36m0.9106[0m  0.0962
     35        [36m0.9075[0m  0.0911
     36        [36m0.9045[0m  0.0982
     37        [36m0.9019[0m  0.0968
     38        [36m0.9007[0m  0.0910
     39        [36m0.8981[0m  0.0890
     40        [36m0.8960[0m  0.0880
     41        [36m0.8909[0m  0.0920
     42

     36        [36m0.8796[0m  0.0920
     37        [36m0.8772[0m  0.1000
     38        [36m0.8748[0m  0.0869
     39        [36m0.8736[0m  0.0901
     40        [36m0.8717[0m  0.0880
     41        [36m0.8702[0m  0.0940
     42        0.8749  0.0944
     43        [36m0.8673[0m  0.0870
     44        [36m0.8622[0m  0.0940
     45        0.8625  0.0930
     46        0.8624  0.0920
     47        [36m0.8540[0m  0.0900
     48        0.8556  0.0900
     49        0.8556  0.0850
     50        [36m0.8517[0m  0.0840
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m4.9556[0m  0.0870
      2        [36m1.3263[0m  0.0880
      3        [36m1.2077[0m  0.0860
      4        [36m1.0532[0m  0.0910
      5        [36m0.9634[0m  0.0870
      6        [36m0.9383[0m  0.0900
      7        [36m0.9321[0m  0.0850
      8        [36m0.9222[0m  0.0830
      9        [36m0.9182[0m  0.0880
     10        [36m0.9163[0m  0.1000
     11   

      5        [36m0.9970[0m  0.0920
      6        [36m0.9715[0m  0.0830
      7        [36m0.9587[0m  0.0900
      8        [36m0.9501[0m  0.0855
      9        [36m0.9489[0m  0.0890
     10        [36m0.9409[0m  0.0960
     11        0.9460  0.0970
     12        0.9435  0.1000
     13        0.9612  0.0860
     14        0.9786  0.0926
     15        0.9521  0.0870
     16        0.9453  0.0840
     17        0.9416  0.0920
     18        [36m0.9378[0m  0.0830
     19        [36m0.9344[0m  0.0860
     20        [36m0.9314[0m  0.0900
     21        [36m0.9295[0m  0.0870
     22        0.9297  0.0930
     23        [36m0.9276[0m  0.0870
     24        [36m0.9242[0m  0.0870
     25        [36m0.9236[0m  0.0920
     26        [36m0.9235[0m  0.0870
     27        [36m0.9196[0m  0.0950
     28        0.9206  0.0900
     29        [36m0.9187[0m  0.0960
     30        0.9189  0.0830
     31        [36m0.9174[0m  0.0860
     32        0.9174  0.0880
     33

     43        0.9180  0.0880
     44        0.9198  0.0890
     45        0.9185  0.0860
     46        0.9195  0.0890
     47        0.9205  0.0900
     48        0.9185  0.0880
     49        0.9196  0.0900
     50        0.9191  0.0860
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.9690[0m  0.0880
      2        [36m1.2522[0m  0.0920
      3        [36m1.1483[0m  0.0930
      4        [36m1.0698[0m  0.0860
      5        [36m1.0427[0m  0.0880
      6        [36m1.0191[0m  0.0960
      7        [36m0.9871[0m  0.0900
      8        0.9942  0.0910
      9        [36m0.9743[0m  0.0840
     10        0.9805  0.0870
     11        [36m0.9650[0m  0.0850
     12        0.9695  0.0860
     13        [36m0.9645[0m  0.0840
     14        0.9650  0.0870
     15        [36m0.9642[0m  0.0880
     16        [36m0.9628[0m  0.0880
     17        [36m0.9625[0m  0.0910
     18        0.9627  0.0860
     19        [36m0.9612[0m  0.0850
    

     50       11.9568  0.0930
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.3664[0m  0.0940
      2        [36m1.3864[0m  0.0910
      3        1.3865  0.0930
      4        1.3865  0.0850
      5        1.3865  0.0880
      6        1.3865  0.0890
      7        1.3865  0.0890
      8        1.3865  0.0900
      9        1.3865  0.0890
     10        1.3865  0.0950
     11        1.3865  0.0890
     12        1.3865  0.0830
     13        1.3865  0.0850
     14        1.3865  0.0940
     15        1.3865  0.0860
     16        1.3865  0.0850
     17        1.3865  0.1080
     18        1.3865  0.0890
     19        1.3865  0.0870
     20        1.3865  0.0860
     21        1.3865  0.0940
     22        1.3865  0.0880
     23        1.3865  0.0960
     24        1.3865  0.0860
     25        1.3865  0.0830
     26        1.3865  0.0940
     27        1.3865  0.0920
     28        1.3865  0.0960
     29        1.3865  0.0880
     30        1.3865 

      6       11.9568  0.0981
      7       11.9568  0.0921
      8       11.9568  0.0933
      9       11.9568  0.0880
     10       11.9568  0.0940
     11       11.9568  0.0900
     12       11.9568  0.0950
     13       11.9568  0.0960
     14       11.9568  0.0900
     15       12.0554  0.1010
     16       11.9568  0.0890
     17       11.9568  0.0900
     18       11.9568  0.0920
     19       11.9568  0.0900
     20       11.9568  0.0860
     21       11.9568  0.0830
     22       11.9568  0.0950
     23       11.9568  0.0930
     24        [36m9.4733[0m  0.0900
     25        [36m1.3769[0m  0.0940
     26        1.3873  0.0960
     27        1.3866  0.0880
     28        1.3866  0.0830
     29        1.3865  0.0890
     30        1.3871  0.0870
     31        1.3858  0.0860
     32        [36m1.3576[0m  0.1060
     33        1.3882  0.0960
     34        1.3865  0.0850
     35        1.3865  0.0950
     36        1.3864  0.0980
     37        1.3821  0.0910
     38      

     11        [36m1.3865[0m  0.0890
     12        [36m1.3865[0m  0.0950
     13        1.3865  0.0902
     14        1.3865  0.0830
     15        1.3865  0.0840
     16        1.3865  0.0910
     17        1.3865  0.1010
     18        1.3865  0.0970
     19        1.3865  0.0930
     20        1.3865  0.0940
     21        1.3865  0.1090
     22        1.3865  0.0870
     23        1.3865  0.0890
     24        1.3865  0.0900
     25        1.3865  0.0870
     26        1.3865  0.0910
     27        1.3865  0.0850
     28        [36m1.3865[0m  0.0830
     29        1.3865  0.0880
     30        1.3865  0.0920
     31        1.3865  0.0920
     32        1.3865  0.0880
     33        [36m1.3865[0m  0.0880
     34        1.3865  0.0880
     35        1.3865  0.0880
     36        1.3865  0.0890
     37        1.3865  0.0920
     38        1.3865  0.0920
     39        1.3865  0.0850
     40        1.3865  0.0910
     41        1.3865  0.0930
     42        1.3865  0.0990
    

     19       11.9568  0.0910
     20       11.9568  0.0880
     21       11.9568  0.0960
     22       11.9568  0.0950
     23       11.9568  0.0960
     24       11.9568  0.0930
     25       11.9568  0.1080
     26       11.9568  0.0930
     27       11.9568  0.0900
     28       11.9568  0.0960
     29       11.9568  0.0920
     30       11.9568  0.0910
     31       11.9568  0.1290
     32       11.9568  0.0980
     33       11.9568  0.0910
     34       11.9568  0.0860
     35       11.9568  0.0990
     36       11.9568  0.0930
     37       11.9568  0.0890
     38       11.9568  0.0910
     39       11.9568  0.1180
     40       11.9568  0.1020
     41       11.9568  0.0900
     42       11.9568  0.0880
     43       11.9568  0.0940
     44       11.9568  0.0930
     45       11.9568  0.0910
     46       11.9568  0.0860
     47       11.9568  0.0930
     48       11.9568  0.0990
     49       11.9568  0.1000
     50       11.9568  0.0990
  epoch    train_loss     dur
-------  -

     26        1.3881  0.0870
     27        1.3881  0.0870
     28        1.3881  0.0900
     29        1.3881  0.0950
     30        1.3881  0.0860
     31        1.3881  0.0890
     32        1.3881  0.0880
     33        1.3881  0.0920
     34        1.3881  0.0880
     35        1.3881  0.0875
     36        1.3881  0.0871
     37        1.3881  0.0960
     38        1.3881  0.0964
     39        1.3881  0.0888
     40        1.3881  0.0900
     41        1.3881  0.0850
     42        1.3881  0.0964
     43        1.3881  0.0850
     44        1.3881  0.0883
     45        1.3881  0.0872
     46        1.3881  0.0858
     47        1.3881  0.0830
     48        1.3881  0.0880
     49        1.3881  0.0870
     50        1.3881  0.0880
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.2452[0m  0.0980
      2        [36m4.3553[0m  0.0890
      3       11.0934  0.0930
      4        9.0437  0.0920
      5        7.0468  0.0870
      6        [36m1.

     28        1.3880  0.0880
     29        1.3880  0.0850
     30        1.3880  0.0870
     31        1.3880  0.0870
     32        1.3880  0.0955
     33        1.3880  0.0910
     34        1.3880  0.0926
     35        1.3880  0.0884
     36        1.3880  0.0860
     37        1.3880  0.0830
     38        1.3880  0.0870
     39        1.3880  0.1080
     40        1.3880  0.0930
     41        1.3880  0.0900
     42        1.3880  0.0890
     43        1.3880  0.0840
     44        1.3880  0.0900
     45        1.3880  0.0970
     46        1.3880  0.0930
     47        1.3880  0.0880
     48        1.3880  0.0860
     49        1.3880  0.0970
     50        1.3880  0.0930
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4018[0m  0.0710
      2        [36m1.3886[0m  0.0650
      3        [36m1.3881[0m  0.0650
      4        [36m1.3877[0m  0.0630
      5        [36m1.3874[0m  0.0670
      6        [36m1.3872[0m  0.0680
      7        

      9        [36m1.3864[0m  0.0700
     10        [36m1.3864[0m  0.0680
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4356[0m  0.0660
      2        [36m1.3925[0m  0.0650
      3        [36m1.3870[0m  0.0640
      4        [36m1.3864[0m  0.0650
      5        [36m1.3864[0m  0.0690
      6        [36m1.3864[0m  0.0720
      7        [36m1.3864[0m  0.0640
      8        1.3864  0.0660
      9        1.3864  0.0700
     10        1.3864  0.0680
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7582[0m  0.0690
      2        [36m1.3920[0m  0.0670
      3        [36m1.3873[0m  0.0670
      4        [36m1.3866[0m  0.0670
      5        [36m1.3864[0m  0.0690
      6        [36m1.3864[0m  0.0630
      7        [36m1.3864[0m  0.0680
      8        [36m1.3864[0m  0.0650
      9        [36m1.3864[0m  0.0740
     10        [36m1.3864[0m  0.0700
  epoch    train_loss     dur
-------  ----------

      7        [36m1.3877[0m  0.0780
      8        [36m1.3877[0m  0.0730
      9        [36m1.3877[0m  0.0690
     10        [36m1.3877[0m  0.0660
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5596[0m  0.0670
      2        [36m1.3884[0m  0.0700
      3        [36m1.3877[0m  0.0700
      4        [36m1.3875[0m  0.0680
      5        [36m1.3875[0m  0.0660
      6        1.3875  0.0720
      7        [36m1.3875[0m  0.0680
      8        [36m1.3875[0m  0.0660
      9        [36m1.3875[0m  0.0700
     10        [36m1.3875[0m  0.0726
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7811[0m  0.0690
      2       11.9568  0.0760
      3       11.9568  0.0730
      4       11.9568  0.0710
      5       11.9568  0.0710
      6       11.9568  0.0710
      7       11.9568  0.0720
      8        [36m9.6502[0m  0.0720
      9        [36m1.3878[0m  0.0650
     10        1.3879  0.0680
  epoch    train

      8        [36m1.3910[0m  0.0670
      9        [36m1.3901[0m  0.0640
     10        [36m1.3893[0m  0.0660
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.8427[0m  0.0750
      2        [36m1.3731[0m  0.0650
      3        [36m1.3568[0m  0.0650
      4        [36m1.3235[0m  0.0710
      5        [36m1.2628[0m  0.0740
      6        [36m1.1872[0m  0.0710
      7        [36m1.1127[0m  0.0660
      8        [36m1.0620[0m  0.0710
      9        [36m1.0106[0m  0.0640
     10        [36m0.9909[0m  0.0720
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.6669[0m  0.0660
      2        [36m1.3932[0m  0.0660
      3        [36m1.3912[0m  0.0680
      4        [36m1.3900[0m  0.0660
      5        [36m1.3891[0m  0.0710
      6        [36m1.3884[0m  0.0680
      7        [36m1.3879[0m  0.0640
      8        [36m1.3875[0m  0.0730
      9        [36m1.3872[0m  0.0680
     10        [36m1.

      4       11.9547  0.0720
      5       11.9547  0.0740
      6       11.9547  0.0740
      7       11.9547  0.0700
      8       11.9547  0.0770
      9       11.9547  0.0740
     10       11.9547  0.0700
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.6726[0m  0.0690
      2       11.9589  0.0720
      3       11.9589  0.0710
      4       11.9589  0.1200
      5       11.9589  0.0830
      6       11.9589  0.0770
      7       11.9589  0.0740
      8       11.9589  0.0750
      9       11.9589  0.0810
     10       11.9589  0.0830
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8652[0m  0.0820
      2       11.9568  0.0770
      3       11.9568  0.0765
      4       11.9568  0.0681
      5       11.9568  0.0753
      6       11.9568  0.0723
      7       11.9568  0.0746
      8       11.9568  0.0760
      9       11.9568  0.0800
     10       11.9568  0.0770
  epoch    train_loss     dur
-------  ------------ 

      8        [36m1.3168[0m  0.0690
      9        [36m1.2961[0m  0.0680
     10        [36m1.2698[0m  0.0710
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.9197[0m  0.0710
      2        [36m1.3018[0m  0.0715
      3        [36m1.2145[0m  0.0720
      4        [36m1.1335[0m  0.0660
      5        [36m1.0463[0m  0.0720
      6        [36m1.0115[0m  0.0710
      7        [36m0.9995[0m  0.0700
      8        [36m0.9705[0m  0.0710
      9        [36m0.9490[0m  0.0660
     10        [36m0.9430[0m  0.0680
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6539[0m  0.0660
      2        [36m1.3612[0m  0.0670
      3        [36m1.2946[0m  0.0690
      4        [36m1.2444[0m  0.0740
      5        [36m1.1826[0m  0.0720
      6        [36m1.0938[0m  0.0660
      7        [36m1.0277[0m  0.0740
      8        [36m1.0046[0m  0.0720
      9        1.0177  0.0680
     10        1.0130  0.0650
 

      3       11.9547  0.0860
      4       11.9547  0.0920
      5        [36m7.3624[0m  0.0730
      6        [36m1.3864[0m  0.0700
      7        1.3865  0.0740
      8        1.3864  0.0760
      9        1.3864  0.0720
     10        1.3864  0.0660
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8819[0m  0.0740
      2       11.9589  0.0720
      3       11.9589  0.0750
      4       11.9585  0.0730
      5        [36m2.3981[0m  0.0690
      6        [36m1.3797[0m  0.0660
      7        [36m1.3410[0m  0.0660
      8        [36m1.3313[0m  0.0650
      9        1.3919  0.0740
     10        1.3869  0.0720
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.1509[0m  0.0760
      2       11.9568  0.0810
      3       11.9568  0.0810
      4       11.9568  0.0760
      5       11.9568  0.0820
      6        [36m6.1424[0m  0.0780
      7        [36m1.3865[0m  0.0750
      8        [36m1.3864[0m  0.0730
 

      3        [36m1.2907[0m  0.0730
      4        [36m1.2431[0m  0.0720
      5        [36m1.1976[0m  0.0740
      6        [36m1.1505[0m  0.0700
      7        [36m1.1107[0m  0.0670
      8        [36m1.0720[0m  0.0700
      9        [36m1.0154[0m  0.0810
     10        [36m0.9979[0m  0.0800
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.2315[0m  0.0700
      2        [36m1.3335[0m  0.0690
      3        [36m1.2686[0m  0.0750
      4        [36m1.2055[0m  0.0780
      5        [36m1.1430[0m  0.0740
      6        [36m1.0989[0m  0.0750
      7        [36m1.0438[0m  0.0760
      8        [36m1.0145[0m  0.0730
      9        [36m0.9913[0m  0.0730
     10        [36m0.9809[0m  0.0710
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.6120[0m  0.0810
      2        [36m1.3537[0m  0.0810
      3        [36m1.3336[0m  0.0760
      4        [36m1.3174[0m  0.0800
      5        [36m1.

      2       11.9568  0.0710
      3       11.9568  0.0750
      4       11.9568  0.0730
      5       11.9568  0.0740
      6       11.9568  0.0710
      7       11.9568  0.0690
      8       11.9568  0.0760
      9       11.9568  0.0700
     10       11.9568  0.0770
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.8411[0m  0.0670
      2        [36m1.3887[0m  0.0660
      3        [36m1.3865[0m  0.0700
      4        1.3866  0.0720
      5        [36m1.3864[0m  0.0670
      6        1.3864  0.0730
      7        1.3864  0.0720
      8        1.3864  0.0680
      9        1.3864  0.0660
     10        1.3864  0.0710
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.9883[0m  0.0750
      2        [36m1.3792[0m  0.0720
      3        1.3793  0.0720
      4        1.3860  0.0700
      5        [36m1.3774[0m  0.0680
      6        1.3824  0.0720
      7        [36m1.3495[0m  0.0690
      8        [36m1.2421[

      6        [36m1.3902[0m  0.0720
      7        1.4780  0.0680
      8        1.3908  0.0700
      9        [36m1.3878[0m  0.0680
     10        [36m1.3877[0m  0.0700
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8338[0m  0.0722
      2       [36m11.6027[0m  0.0869
      3        [36m4.2826[0m  0.0857
      4        [36m1.3885[0m  0.0781
      5        [36m1.3883[0m  0.0760
      6        [36m1.3875[0m  0.0710
      7        [36m1.3875[0m  0.0670
      8        1.3875  0.0666
      9        1.3875  0.0730
     10        1.3875  0.0750
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.6837[0m  0.0740
      2        [36m1.4736[0m  0.0750
      3        1.6192  0.0660
      4        1.4844  0.0740
      5        1.6334  0.0730
      6        [36m1.4492[0m  0.0700
      7       11.8917  0.0780
      8       11.9407  0.0750
      9       11.8617  0.0810
     10       11.9617  0.0760
  epoch    tr

      3        [36m1.4003[0m  0.0750
      4        [36m1.3984[0m  0.0670
      5        [36m1.3968[0m  0.0680
      6        [36m1.3953[0m  0.0810
      7        [36m1.3941[0m  0.0685
      8        [36m1.3930[0m  0.0670
      9        [36m1.3921[0m  0.0640
     10        [36m1.3913[0m  0.0630
     11        [36m1.3906[0m  0.0690
     12        [36m1.3900[0m  0.0670
     13        [36m1.3894[0m  0.0650
     14        [36m1.3890[0m  0.0700
     15        [36m1.3886[0m  0.0740
     16        [36m1.3883[0m  0.0680
     17        [36m1.3880[0m  0.0670
     18        [36m1.3878[0m  0.0680
     19        [36m1.3875[0m  0.0640
     20        [36m1.3874[0m  0.0650
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.9909[0m  0.0640
      2        [36m1.4054[0m  0.0670
      3        [36m1.4027[0m  0.0640
      4        [36m1.4003[0m  0.0650
      5        [36m1.3983[0m  0.0660
      6        [36m1.3965[0m  0.0670
    

      6        1.3863  0.0640
      7        1.3863  0.0670
      8        1.3863  0.0630
      9        1.3863  0.0631
     10        1.3863  0.0671
     11        1.3863  0.0681
     12        1.3863  0.0649
     13        1.3863  0.0670
     14        1.3863  0.0656
     15        1.3862  0.0710
     16        1.3862  0.0649
     17        1.3862  0.0710
     18        1.3862  0.0721
     19        1.3862  0.0881
     20        1.3862  0.0808
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.9187[0m  0.0710
      2        [36m1.3933[0m  0.0681
      3        [36m1.3870[0m  0.0721
      4        [36m1.3865[0m  0.0711
      5        [36m1.3865[0m  0.0718
      6        [36m1.3865[0m  0.0731
      7        [36m1.3865[0m  0.0670
      8        [36m1.3865[0m  0.0802
      9        [36m1.3865[0m  0.0667
     10        [36m1.3865[0m  0.0680
     11        [36m1.3865[0m  0.0670
     12        [36m1.3865[0m  0.0719
     13        [36m1.

      9        1.3864  0.0670
     10        1.3864  0.0700
     11        1.3864  0.0705
     12        1.3864  0.0681
     13        1.3864  0.0730
     14        1.3864  0.0704
     15        1.3864  0.0736
     16        1.3864  0.0889
     17        1.3864  0.0731
     18        1.3864  0.0728
     19        1.3864  0.0710
     20        1.3864  0.0701
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m12.0748[0m  0.0760
      2       [36m11.9568[0m  0.0740
      3       11.9568  0.0739
      4       11.9568  0.0720
      5       11.9568  0.0680
      6       11.9568  0.0720
      7       11.9568  0.0760
      8       11.9568  0.0790
      9       11.9568  0.0720
     10       11.9568  0.0670
     11       11.9568  0.0690
     12       11.9568  0.0690
     13       11.9568  0.0670
     14       11.9568  0.0740
     15       11.9568  0.0680
     16       11.9568  0.0710
     17       11.9568  0.0690
     18       11.9568  0.0670
     19       11.9568 

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4759[0m  0.0660
      2        2.9669  0.0650
      3        1.5942  0.0690
      4        1.7569  0.0680
      5        [36m1.3925[0m  0.0680
      6        [36m1.3878[0m  0.0740
      7        [36m1.3877[0m  0.0730
      8        [36m1.3877[0m  0.0640
      9        [36m1.3877[0m  0.0660
     10        [36m1.3877[0m  0.0660
     11        1.3877  0.0710
     12        1.3877  0.0660
     13        1.3877  0.0660
     14        1.3877  0.0720
     15        1.3877  0.0690
     16        1.3877  0.0670
     17        1.3877  0.0710
     18        1.3877  0.0690
     19        1.3877  0.0740
     20        1.3877  0.0670
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4185[0m  0.0760
      2        [36m1.3955[0m  0.0680
      3        [36m1.3880[0m  0.0680
      4        [36m1.3875[0m  0.0740
      5        1.3875  0.0650
      6        1.3875  0.0710
 

     11        [36m1.3864[0m  0.0700
     12        [36m1.3812[0m  0.0710
     13        [36m1.3682[0m  0.0650
     14        [36m1.3430[0m  0.0650
     15        [36m1.3123[0m  0.0750
     16        [36m1.2849[0m  0.0650
     17        [36m1.2522[0m  0.0840
     18        [36m1.2153[0m  0.0660
     19        [36m1.1816[0m  0.0730
     20        [36m1.1496[0m  0.0650
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.3909[0m  0.0670
      2        [36m1.3782[0m  0.0680
      3        [36m1.3464[0m  0.0740
      4        [36m1.3268[0m  0.0710
      5        [36m1.3089[0m  0.0680
      6        [36m1.2925[0m  0.0690
      7        [36m1.2730[0m  0.0710
      8        [36m1.2478[0m  0.0670
      9        [36m1.2224[0m  0.0740
     10        [36m1.2072[0m  0.0670
     11        [36m1.1912[0m  0.0690
     12        [36m1.1716[0m  0.0710
     13        [36m1.1543[0m  0.0680
     14        [36m1.1411[0m  0.0710
    

     12        1.3864  0.0740
     13        [36m1.3864[0m  0.0650
     14        [36m1.3864[0m  0.0710
     15        1.3864  0.0650
     16        1.3864  0.0680
     17        1.3864  0.0700
     18        1.3864  0.0720
     19        1.3864  0.0733
     20        1.3864  0.0710
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7746[0m  0.0680
      2        [36m1.3895[0m  0.0659
      3        [36m1.3867[0m  0.0661
      4        [36m1.3865[0m  0.0650
      5        [36m1.3864[0m  0.0680
      6        [36m1.3864[0m  0.0680
      7        1.3864  0.0730
      8        1.3864  0.0660
      9        1.3864  0.0650
     10        [36m1.3864[0m  0.0670
     11        [36m1.3864[0m  0.0654
     12        [36m1.3864[0m  0.0700
     13        [36m1.3864[0m  0.0740
     14        [36m1.3864[0m  0.0640
     15        [36m1.3864[0m  0.0670
     16        [36m1.3864[0m  0.0660
     17        [36m1.3864[0m  0.0690
     18        

     20        1.3864  0.0720
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.9341[0m  0.0669
      2        [36m1.3880[0m  0.0750
      3        [36m1.3865[0m  0.0710
      4        [36m1.3864[0m  0.0760
      5        [36m1.3864[0m  0.0750
      6        1.3864  0.0720
      7        1.3864  0.0740
      8        1.3864  0.0680
      9        1.3864  0.0720
     10        1.3864  0.0707
     11        1.3864  0.0720
     12        1.3864  0.0760
     13        1.3864  0.0720
     14        1.3864  0.0719
     15        1.3864  0.0763
     16        1.3864  0.0772
     17        1.3864  0.0750
     18        1.3864  0.0710
     19        1.3864  0.0740
     20        1.3864  0.0760
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6371[0m  0.0750
      2        [36m1.3907[0m  0.0770
      3        [36m1.3865[0m  0.0680
      4        [36m1.3864[0m  0.0710
      5        1.3864  0.0680
      6        1.38

     13        [36m1.3878[0m  0.0650
     14        [36m1.3878[0m  0.0700
     15        [36m1.3878[0m  0.0650
     16        [36m1.3878[0m  0.0700
     17        [36m1.3878[0m  0.0690
     18        [36m1.3878[0m  0.0700
     19        [36m1.3878[0m  0.0710
     20        1.3878  0.0650
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.1077[0m  0.0660
      2        [36m1.4542[0m  0.0700
      3        1.7490  0.0680
      4        1.8202  0.0730
      5        1.8458  0.0720
      6        9.1137  0.0700
      7        9.6954  0.0690
      8        [36m1.3899[0m  0.0670
      9       10.8684  0.0690
     10        3.7855  0.0680
     11        7.2772  0.0780
     12        6.1225  0.0720
     13        5.0186  0.0650
     14        9.6702  0.0670
     15        1.4260  0.0650
     16        8.8624  0.0710
     17       11.8399  0.0750
     18        5.4202  0.0670
     19        1.4671  0.0770
     20        1.3900  0.0760
  epoch   

      7        1.0282  0.0740
      8        [36m0.9774[0m  0.0910
      9        0.9781  0.0720
     10        [36m0.9701[0m  0.0690
     11        [36m0.9528[0m  0.0680
     12        0.9536  0.0700
     13        [36m0.9448[0m  0.0740
     14        [36m0.9394[0m  0.0720
     15        [36m0.9370[0m  0.0740
     16        [36m0.9338[0m  0.0660
     17        [36m0.9292[0m  0.0690
     18        0.9313  0.0740
     19        [36m0.9231[0m  0.0750
     20        0.9268  0.0710
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6621[0m  0.0800
      2        [36m1.3165[0m  0.0760
      3        [36m1.2978[0m  0.0760
      4        [36m1.2802[0m  0.0770
      5        [36m1.2620[0m  0.0770
      6        [36m1.2423[0m  0.0830
      7        [36m1.2220[0m  0.0790
      8        [36m1.2007[0m  0.0750
      9        [36m1.1794[0m  0.0750
     10        [36m1.1580[0m  0.0810
     11        [36m1.1357[0m  0.0770
     12   

      4       11.9589  0.0813
      5       11.9589  0.0690
      6       11.9589  0.0670
      7       11.9589  0.0680
      8       11.9589  0.0770
      9       11.9589  0.0730
     10       11.9589  0.0760
     11       11.9589  0.0720
     12       11.9589  0.0869
     13       11.9589  0.0760
     14       11.9589  0.0791
     15       11.9589  0.0790
     16       11.9589  0.0770
     17       11.9589  0.0800
     18       11.9589  0.0749
     19       11.9589  0.0800
     20       11.9589  0.0730
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9078[0m  0.0710
      2       11.9589  0.0760
      3       11.9589  0.0770
      4       11.9589  0.0790
      5       11.9589  0.0750
      6       11.9589  0.0770
      7       11.9589  0.0800
      8       11.9589  0.0873
      9       11.9589  0.0820
     10       11.9589  0.0770
     11       11.9589  0.0740
     12       11.9589  0.0780
     13       11.9589  0.0710
     14       11.9589  0.0750
 

     13        1.3864  0.0720
     14        1.3864  0.0690
     15        1.3864  0.0670
     16        1.3864  0.0660
     17        1.3864  0.0720
     18        1.3864  0.0690
     19        1.3864  0.0670
     20        1.3864  0.0690
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.1552[0m  0.0790
      2        [36m1.3060[0m  0.0710
      3        1.3822  0.0690
      4        1.3869  0.0730
      5        1.3864  0.0750
      6        1.3864  0.0690
      7        1.3864  0.0675
      8        1.3864  0.0740
      9        1.3864  0.0700
     10        1.3864  0.0660
     11        1.3864  0.0680
     12        1.3864  0.0770
     13        1.3864  0.0770
     14        1.3864  0.0700
     15        1.3864  0.0660
     16        1.3864  0.0720
     17        1.3864  0.0660
     18        1.3864  0.0710
     19        1.3864  0.0710
     20        1.3864  0.0710
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.

     13        [36m1.3884[0m  0.0810
     14        [36m1.3879[0m  0.0720
     15        [36m1.3877[0m  0.0760
     16        [36m1.3877[0m  0.0760
     17        1.3877  0.0770
     18        1.3877  0.0780
     19        1.3877  0.0790
     20        1.3877  0.0780
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8221[0m  0.0770
      2       11.9568  0.0690
      3       11.9568  0.0780
      4       11.9568  0.0750
      5       11.9568  0.0690
      6       11.9568  0.0760
      7       11.9568  0.0740
      8       11.9568  0.0710
      9       11.9568  0.0690
     10       [36m11.7376[0m  0.0670
     11       11.9568  0.0670
     12       11.9568  0.0690
     13       11.9568  0.0870
     14       11.9568  0.0810
     15       11.9568  0.0740
     16       11.9568  0.0780
     17        [36m9.0439[0m  0.0710
     18        [36m1.3875[0m  0.0720
     19        1.3879  0.0740
     20        1.3878  0.0760
  epoch    train_loss     du

     14        0.9492  0.0720
     15        [36m0.9306[0m  0.0780
     16        [36m0.9278[0m  0.0710
     17        [36m0.9234[0m  0.0690
     18        0.9271  0.0690
     19        [36m0.9177[0m  0.0720
     20        0.9208  0.0720
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.9144[0m  0.0720
      2        [36m1.3521[0m  0.0710
      3        [36m1.2998[0m  0.0730
      4        [36m1.2228[0m  0.0680
      5        [36m1.1456[0m  0.0710
      6        [36m1.0968[0m  0.0730
      7        [36m1.0224[0m  0.0760
      8        [36m0.9830[0m  0.0670
      9        [36m0.9633[0m  0.0681
     10        0.9641  0.0711
     11        [36m0.9585[0m  0.0701
     12        [36m0.9458[0m  0.0691
     13        [36m0.9415[0m  0.0721
     14        [36m0.9357[0m  0.0677
     15        [36m0.9344[0m  0.0656
     16        [36m0.9279[0m  0.0660
     17        0.9281  0.0780
     18        [36m0.9254[0m  0.0750
     19   

     13        [36m1.0189[0m  0.0790
     14        [36m1.0026[0m  0.0730
     15        [36m0.9771[0m  0.0720
     16        [36m0.9715[0m  0.0670
     17        [36m0.9658[0m  0.0751
     18        [36m0.9610[0m  0.0731
     19        [36m0.9563[0m  0.0936
     20        [36m0.9553[0m  0.0790
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9860[0m  0.0680
      2       [36m11.9568[0m  0.0780
      3       11.9568  0.0764
      4       11.9568  0.0786
      5       11.9568  0.0700
      6       11.9568  0.0770
      7       11.9568  0.0740
      8       11.9568  0.0940
      9       11.9568  0.0830
     10       11.9568  0.0980
     11       11.9568  0.0770
     12       11.9568  0.0760
     13       11.9568  0.0750
     14       11.9568  0.0820
     15       11.9568  0.0740
     16       11.9568  0.0780
     17       11.9568  0.0790
     18       11.9568  0.0820
     19       11.9568  0.0830
     20       11.9568  0.0740
  epoch   

      8        1.3864  0.0720
      9        1.3864  0.0720
     10        1.3864  0.0720
     11        1.3864  0.0760
     12        1.3864  0.0760
     13        1.3864  0.0720
     14        1.3864  0.0730
     15        1.3864  0.0771
     16        1.3864  0.0691
     17        1.3864  0.0701
     18        1.3864  0.0733
     19        1.3864  0.0759
     20        1.3864  0.0710
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8126[0m  0.0740
      2       11.9568  0.0755
      3       11.9568  0.0726
      4       [36m11.6530[0m  0.0700
      5       [36m11.6022[0m  0.0730
      6       11.9568  0.0700
      7       11.9568  0.0710
      8        [36m6.4550[0m  0.0740
      9        [36m1.3864[0m  0.0720
     10        1.3865  0.0680
     11        [36m1.3864[0m  0.0730
     12        1.3864  0.0720
     13        1.3864  0.0700
     14        1.3864  0.0700
     15        1.3864  0.0730
     16        1.3864  0.0740
     17        1

      4       11.9568  0.0750
      5       11.9568  0.0700
      6       11.9568  0.0740
      7       11.9454  0.0770
      8       11.9568  0.0933
      9       11.9568  0.0664
     10        [36m5.3559[0m  0.0710
     11        [36m1.3876[0m  0.0730
     12        1.3878  0.0684
     13        1.3877  0.0680
     14        1.3877  0.0670
     15        1.3877  0.0690
     16        1.3877  0.0730
     17        1.3877  0.0670
     18        1.3877  0.0670
     19        1.3877  0.0680
     20        1.3877  0.0700
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7170[0m  0.0750
      2       11.9568  0.0737
      3       11.9568  0.0700
      4       11.9568  0.0770
      5       11.9568  0.0700
      6       11.9568  0.0730
      7       11.9568  0.0770
      8       11.9568  0.0760
      9        [36m9.1619[0m  0.0740
     10        [36m1.3922[0m  0.0750
     11        [36m1.3871[0m  0.0720
     12        1.3878  0.0700
     13        1

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4666[0m  0.0630
      2        [36m1.4527[0m  0.0670
      3        [36m1.4404[0m  0.0650
      4        [36m1.4305[0m  0.0650
      5        [36m1.4226[0m  0.0640
      6        [36m1.4162[0m  0.0650
      7        [36m1.4110[0m  0.0640
      8        [36m1.4067[0m  0.0680
      9        [36m1.4032[0m  0.0730
     10        [36m1.4003[0m  0.0640
     11        [36m1.3979[0m  0.0640
     12        [36m1.3960[0m  0.0690
     13        [36m1.3944[0m  0.0680
     14        [36m1.3930[0m  0.0760
     15        [36m1.3919[0m  0.0740
     16        [36m1.3910[0m  0.0780
     17        [36m1.3902[0m  0.0740
     18        [36m1.3896[0m  0.0660
     19        [36m1.3890[0m  0.0670
     20        [36m1.3886[0m  0.0650
     21        [36m1.3882[0m  0.0730
     22        [36m1.3879[0m  0.0670
     23        [36m1.3877[0m  0.0710
     24        [36m1.3875[0m  0.0780
    

     27        [36m1.3868[0m  0.0808
     28        [36m1.3867[0m  0.0720
     29        [36m1.3867[0m  0.0660
     30        [36m1.3866[0m  0.0680
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7702[0m  0.0710
      2        [36m1.4132[0m  0.0710
      3        [36m1.4071[0m  0.0690
      4        [36m1.4023[0m  0.0720
      5        [36m1.3986[0m  0.0660
      6        [36m1.3958[0m  0.0650
      7        [36m1.3937[0m  0.0690
      8        [36m1.3921[0m  0.0710
      9        [36m1.3908[0m  0.0650
     10        [36m1.3899[0m  0.0680
     11        [36m1.3892[0m  0.0710
     12        [36m1.3886[0m  0.0640
     13        [36m1.3882[0m  0.0690
     14        [36m1.3878[0m  0.0650
     15        [36m1.3875[0m  0.0650
     16        [36m1.3873[0m  0.0820
     17        [36m1.3872[0m  0.0670
     18        [36m1.3870[0m  0.0710
     19        [36m1.3869[0m  0.0670
     20        [36m1.3868[0m  0.0640
    

     20        1.3864  0.0740
     21        1.3864  0.0690
     22        1.3864  0.0690
     23        1.3864  0.0660
     24        1.3864  0.0830
     25        1.3864  0.0670
     26        1.3864  0.0640
     27        1.3864  0.0690
     28        1.3864  0.0630
     29        1.3864  0.0690
     30        1.3864  0.0660
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6409[0m  0.0690
      2        [36m1.3897[0m  0.0660
      3        [36m1.3866[0m  0.0670
      4        [36m1.3863[0m  0.0750
      5        1.3863  0.0650
      6        1.3864  0.0640
      7        1.3864  0.0760
      8        1.3864  0.0670
      9        1.3864  0.0660
     10        1.3864  0.0660
     11        1.3864  0.0670
     12        1.3864  0.0640
     13        1.3864  0.0690
     14        1.3864  0.0670
     15        1.3864  0.0660
     16        1.3864  0.0650
     17        1.3864  0.0660
     18        1.3864  0.0710
     19        1.3864  0.0670
    

     20        [36m1.3864[0m  0.0630
     21        [36m1.3864[0m  0.0660
     22        [36m1.3864[0m  0.0630
     23        [36m1.3864[0m  0.0689
     24        [36m1.3864[0m  0.0690
     25        [36m1.3864[0m  0.0650
     26        [36m1.3864[0m  0.0650
     27        [36m1.3864[0m  0.0690
     28        [36m1.3864[0m  0.0643
     29        [36m1.3864[0m  0.0659
     30        [36m1.3864[0m  0.0720
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4350[0m  0.0690
      2        [36m1.3869[0m  0.0640
      3        [36m1.3864[0m  0.0690
      4        [36m1.3864[0m  0.0720
      5        [36m1.3864[0m  0.0650
      6        [36m1.3864[0m  0.0650
      7        1.3864  0.0660
      8        1.3864  0.0760
      9        1.3864  0.0680
     10        1.3864  0.0700
     11        1.3864  0.0700
     12        1.3864  0.0730
     13        1.3864  0.0720
     14        1.3864  0.0730
     15        1.3864  0.0700
     16

     15        [36m1.3876[0m  0.0640
     16        [36m1.3876[0m  0.0660
     17        [36m1.3876[0m  0.0680
     18        [36m1.3876[0m  0.0640
     19        [36m1.3876[0m  0.0940
     20        [36m1.3876[0m  0.0660
     21        [36m1.3876[0m  0.0691
     22        [36m1.3876[0m  0.0666
     23        [36m1.3876[0m  0.0640
     24        [36m1.3875[0m  0.0730
     25        [36m1.3875[0m  0.0654
     26        [36m1.3875[0m  0.0700
     27        [36m1.3875[0m  0.0690
     28        [36m1.3875[0m  0.0690
     29        [36m1.3875[0m  0.0740
     30        [36m1.3875[0m  0.0650
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.3915[0m  0.0660
      2        [36m1.3882[0m  0.0670
      3        1.3883  0.0640
      4        [36m1.3882[0m  0.0670
      5        [36m1.3881[0m  0.0690
      6        [36m1.3880[0m  0.0650
      7        [36m1.3880[0m  0.0670
      8        [36m1.3879[0m  0.0710
      9      

      5       11.9256  0.0879
      6        7.1632  0.0830
      7        4.3977  0.0760
      8        5.5802  0.0743
      9        5.8925  0.0690
     10       11.9061  0.0730
     11        8.1906  0.0740
     12        1.6233  0.0730
     13        [36m1.4166[0m  0.0720
     14       11.2685  0.0810
     15        7.0311  0.1020
     16        4.0479  0.0740
     17        7.5242  0.0822
     18        [36m1.3875[0m  0.0720
     19        1.3880  0.0770
     20        1.3879  0.0779
     21        1.3880  0.0770
     22        1.3880  0.0744
     23        1.3880  0.0700
     24        1.3880  0.0690
     25        1.3880  0.0720
     26        1.3880  0.0740
     27        1.3880  0.0730
     28        1.3880  0.0750
     29        1.3880  0.0720
     30        1.3880  0.0730
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m5.7445[0m  0.0740
      2        9.0124  0.0780
      3       11.8927  0.0810
      4       11.8238  0.0770
      5      

     24        [36m1.3866[0m  0.0720
     25        [36m1.3865[0m  0.0670
     26        [36m1.3865[0m  0.0750
     27        [36m1.3864[0m  0.0750
     28        [36m1.3864[0m  0.0680
     29        [36m1.3864[0m  0.0780
     30        [36m1.3864[0m  0.0740
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m3.0788[0m  0.0680
      2        [36m1.3730[0m  0.0660
      3        [36m1.3436[0m  0.0770
      4        [36m1.3163[0m  0.0750
      5        [36m1.2922[0m  0.0750
      6        [36m1.2699[0m  0.0790
      7        [36m1.2462[0m  0.0730
      8        [36m1.2188[0m  0.0709
      9        [36m1.1939[0m  0.0660
     10        [36m1.1712[0m  0.0700
     11        [36m1.1503[0m  0.0680
     12        [36m1.1303[0m  0.0650
     13        [36m1.1149[0m  0.0709
     14        [36m1.1001[0m  0.0760
     15        [36m1.0861[0m  0.0770
     16        [36m1.0561[0m  0.0770
     17        [36m1.0370[0m  0.0870
    

     18        [36m1.3881[0m  0.0730
     19        [36m1.3878[0m  0.0720
     20        [36m1.3875[0m  0.0710
     21        [36m1.3872[0m  0.0731
     22        [36m1.3870[0m  0.0711
     23        [36m1.3867[0m  0.0810
     24        [36m1.3855[0m  0.0790
     25        [36m1.3827[0m  0.0805
     26        [36m1.3713[0m  0.0694
     27        [36m1.3568[0m  0.0700
     28        [36m1.3381[0m  0.0747
     29        [36m1.3158[0m  0.0650
     30        [36m1.2933[0m  0.0640
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.5635[0m  0.0740
      2        [36m1.3953[0m  0.0780
      3        [36m1.3611[0m  0.0750
      4        [36m1.3361[0m  0.0680
      5        [36m1.3143[0m  0.0650
      6        [36m1.2907[0m  0.0720
      7        [36m1.2597[0m  0.0650
      8        [36m1.2325[0m  0.0710
      9        [36m1.2179[0m  0.0740
     10        [36m1.2027[0m  0.0780
     11        [36m1.1900[0m  0.0770
    

     18       11.9568  0.0681
     19       11.9568  0.0682
     20       11.9568  0.0701
     21       11.9568  0.0700
     22       11.9568  0.0680
     23       11.9568  0.0690
     24       11.9568  0.0680
     25       11.9568  0.0710
     26       11.9568  0.0700
     27       11.9568  0.0670
     28       11.9568  0.0720
     29       11.9568  0.0710
     30       11.9568  0.0770
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.0369[0m  0.0690
      2        [36m1.3872[0m  0.0726
      3        [36m1.3865[0m  0.0680
      4        [36m1.3864[0m  0.0667
      5        1.3864  0.0660
      6        1.3864  0.0670
      7        1.3864  0.0650
      8        1.3864  0.0660
      9        1.3864  0.0659
     10        1.3864  0.0640
     11        1.3864  0.0686
     12        1.3864  0.0710
     13        1.3864  0.0750
     14        1.3864  0.0830
     15        1.3864  0.0780
     16        1.3864  0.0750
     17        1.3864  0.0690
    

     19       11.9568  0.0700
     20       11.9568  0.0680
     21       11.9568  0.0680
     22       11.9568  0.0750
     23       11.9568  0.0678
     24       11.9568  0.0690
     25       11.9568  0.0660
     26       11.9568  0.0710
     27       11.9568  0.0710
     28       11.9568  0.0780
     29       11.9568  0.0690
     30       11.9568  0.0680
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.3614[0m  0.0725
      2        [36m1.3862[0m  0.0680
      3        [36m1.3688[0m  0.0700
      4        1.3875  0.0650
      5        1.3865  0.0640
      6        1.3864  0.0650
      7        1.3864  0.0660
      8        1.3864  0.0700
      9        1.3864  0.0750
     10        1.3864  0.0700
     11        1.3864  0.0650
     12        1.3864  0.0690
     13        1.3864  0.0650
     14        1.3864  0.0710
     15        1.3864  0.0670
     16        1.3864  0.0700
     17        1.3864  0.0670
     18        1.3864  0.0640
     19      

     26       11.9589  0.0750
     27       11.9589  0.0720
     28       11.9589  0.0690
     29       11.9589  0.0720
     30       11.9589  0.0750
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7626[0m  0.0770
      2       11.9568  0.0690
      3       11.9568  0.0690
      4       11.9568  0.0780
      5       11.9568  0.0730
      6       11.9568  0.0750
      7       11.9568  0.0760
      8       11.9568  0.0690
      9       11.9568  0.0680
     10       11.9568  0.0770
     11       11.9568  0.0740
     12       11.9568  0.0700
     13       11.9568  0.0770
     14       11.9568  0.0760
     15       11.9568  0.0730
     16       11.9568  0.0710
     17       11.9568  0.0750
     18       11.9568  0.0720
     19       11.9568  0.0750
     20       11.9568  0.0750
     21       11.9568  0.0720
     22       11.9568  0.0720
     23       11.9568  0.0690
     24       11.9568  0.0750
     25       11.9568  0.0730
     26       11.9568  0.0750
 

      2        8.6841  0.0730
      3        8.2442  0.0740
      4       12.0780  0.0730
      5        6.4149  0.0660
      6        [36m1.5648[0m  0.0690
      7        2.2224  0.0690
      8       11.1157  0.0720
      9        [36m1.3870[0m  0.0700
     10        1.3916  0.0690
     11        1.3875  0.0680
     12        1.3875  0.0690
     13        1.3876  0.0650
     14        1.3877  0.0730
     15        1.3877  0.0700
     16        1.3877  0.0720
     17        1.3877  0.0650
     18        1.3877  0.0710
     19        1.3877  0.0740
     20        1.3877  0.0700
     21        1.3877  0.0650
     22        1.3877  0.0680
     23        1.3877  0.0730
     24        1.3877  0.0690
     25        1.3877  0.0650
     26        1.3877  0.0710
     27        1.3877  0.0680
     28        1.3877  0.0700
     29        1.3877  0.0740
     30        1.3877  0.0660
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.6129[0m  0.0730
      2      

     19        [36m0.9072[0m  0.0740
     20        0.9079  0.0800
     21        [36m0.9047[0m  0.0760
     22        [36m0.9034[0m  0.0770
     23        [36m0.9028[0m  0.0770
     24        0.9036  0.0760
     25        0.9051  0.0748
     26        0.9073  0.0760
     27        0.9089  0.0750
     28        0.9189  0.0770
     29        0.9252  0.0750
     30        0.9184  0.0790
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m3.6250[0m  0.0760
      2        [36m1.3931[0m  0.0770
      3        [36m1.3879[0m  0.0770
      4        [36m1.3821[0m  0.0750
      5        [36m1.3753[0m  0.0730
      6        [36m1.3676[0m  0.0790
      7        [36m1.3564[0m  0.0750
      8        [36m1.3459[0m  0.0790
      9        [36m1.3368[0m  0.0770
     10        [36m1.3271[0m  0.0730
     11        [36m1.3167[0m  0.0740
     12        [36m1.3046[0m  0.0760
     13        [36m1.2879[0m  0.0750
     14        [36m1.2674[0m  0.076

     16        [36m0.9479[0m  0.0710
     17        [36m0.9461[0m  0.0700
     18        [36m0.9445[0m  0.0740
     19        [36m0.9434[0m  0.0780
     20        [36m0.9422[0m  0.0670
     21        [36m0.9409[0m  0.0740
     22        [36m0.9399[0m  0.0680
     23        [36m0.9391[0m  0.0670
     24        [36m0.9379[0m  0.0670
     25        [36m0.9373[0m  0.0660
     26        [36m0.9371[0m  0.0680
     27        [36m0.9361[0m  0.0700
     28        [36m0.9352[0m  0.0660
     29        [36m0.9350[0m  0.0750
     30        [36m0.9349[0m  0.0690
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m3.1332[0m  0.0680
      2        [36m1.3919[0m  0.0740
      3        [36m1.3904[0m  0.0660
      4        [36m1.3896[0m  0.0710
      5        [36m1.3889[0m  0.0670
      6        [36m1.3884[0m  0.0680
      7        [36m1.3879[0m  0.0660
      8        [36m1.3876[0m  0.0750
      9        [36m1.3873[0m  0.0750
    

     28        1.3864  0.0770
     29        1.3864  0.0790
     30        1.3864  0.0680
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8252[0m  0.0670
      2       11.9568  0.0720
      3       11.9568  0.0720
      4       11.9568  0.0750
      5       11.9568  0.0760
      6       11.9568  0.0680
      7       11.9568  0.0700
      8       11.9568  0.0700
      9       11.9568  0.0790
     10       11.9568  0.0750
     11       11.9568  0.0760
     12       11.9568  0.0760
     13       11.9568  0.0770
     14       11.9568  0.0730
     15       11.9568  0.0690
     16       11.9568  0.0730
     17       11.9568  0.0682
     18       11.9568  0.0690
     19       11.9568  0.0690
     20       11.9568  0.0690
     21       11.9568  0.0740
     22       11.9568  0.0720
     23       11.9568  0.0760
     24       11.9568  0.0740
     25       11.9568  0.0720
     26       11.9568  0.0720
     27       11.9568  0.0690
     28       11.9568  0.0800
 

      5        [36m1.3864[0m  0.0660
      6        [36m1.3864[0m  0.0650
      7        [36m1.3864[0m  0.0740
      8        [36m1.3864[0m  0.0650
      9        1.3864  0.0680
     10        1.3864  0.0700
     11        1.3864  0.0730
     12        1.3864  0.0730
     13        1.3864  0.0690
     14        1.3864  0.0700
     15        1.3864  0.0680
     16        1.3864  0.0676
     17        1.3864  0.0716
     18        1.3864  0.0650
     19        1.3864  0.0690
     20        1.3864  0.0740
     21        1.3864  0.0710
     22        1.3864  0.0660
     23        1.3864  0.0720
     24        1.3864  0.0750
     25        1.3864  0.0680
     26        1.3864  0.0710
     27        1.3864  0.0720
     28        1.3864  0.0690
     29        1.3864  0.0720
     30        1.3864  0.0720
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6801[0m  0.0670
      2        [36m1.3869[0m  0.0680
      3        [36m1.3864[0m  0.0670
      4

     16       11.9568  0.0690
     17       11.9568  0.0710
     18       11.9568  0.0700
     19       11.9568  0.0680
     20       11.9568  0.0800
     21       11.9568  0.0690
     22       11.9568  0.0700
     23       11.9568  0.0750
     24       11.9568  0.0690
     25       11.9568  0.0720
     26       11.9568  0.0720
     27       11.9568  0.0740
     28       11.9568  0.0740
     29       11.9568  0.0760
     30       11.9568  0.0690
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7913[0m  0.0710
      2       11.9547  0.0740
      3       11.9547  0.0710
      4       11.9547  0.0700
      5       11.9547  0.0720
      6       11.9547  0.0750
      7       11.9547  0.0710
      8       11.9547  0.0730
      9        [36m5.8506[0m  0.0750
     10        [36m1.3892[0m  0.0700
     11        [36m1.3881[0m  0.0720
     12        [36m1.3880[0m  0.0740
     13        1.3880  0.0700
     14        1.3880  0.0660
     15        1.3880  0.

     23       11.6643  0.0710
     24        7.2574  0.0670
     25        7.9587  0.0770
     26       11.4847  0.0690
     27        1.3879  0.0700
     28        1.3909  0.0660
     29        1.3882  0.0680
     30        1.3873  0.0740
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8496[0m  0.0690
      2        [36m1.7663[0m  0.0750
      3        [36m1.4345[0m  0.0700
      4        [36m1.3965[0m  0.0670
      5        [36m1.3935[0m  0.0710
      6        [36m1.3902[0m  0.0710
      7        [36m1.3885[0m  0.0760
      8        [36m1.3877[0m  0.0730
      9        1.3877  0.0700
     10        1.3877  0.0660
     11        1.3877  0.0680
     12        1.3877  0.0750
     13        1.3877  0.0650
     14        1.3877  0.0670
     15        1.3877  0.0650
     16        1.3877  0.0710
     17        1.3877  0.0650
     18        1.3877  0.0690
     19        1.3877  0.0750
     20        1.3877  0.0770
     21        1.3877  0.069

     30        [36m0.9074[0m  0.0760
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.9713[0m  0.0710
      2        [36m1.3142[0m  0.0680
      3        [36m1.2778[0m  0.0710
      4        [36m1.2453[0m  0.0730
      5        [36m1.2028[0m  0.0740
      6        [36m1.1503[0m  0.0710
      7        [36m1.0921[0m  0.0720
      8        [36m1.0767[0m  0.0700
      9        [36m1.0296[0m  0.0670
     10        [36m0.9756[0m  0.0740
     11        [36m0.9708[0m  0.0750
     12        [36m0.9570[0m  0.0710
     13        [36m0.9356[0m  0.0720
     14        [36m0.9255[0m  0.0720
     15        [36m0.9206[0m  0.0700
     16        [36m0.9205[0m  0.0710
     17        [36m0.9170[0m  0.0740
     18        [36m0.9128[0m  0.0690
     19        0.9162  0.0690
     20        [36m0.9119[0m  0.0720
     21        [36m0.9090[0m  0.0710
     22        [36m0.9085[0m  0.0750
     23        [36m0.9066[0m  0.0680
     24      

     25        [36m0.9437[0m  0.0700
     26        0.9443  0.0740
     27        [36m0.9437[0m  0.0740
     28        [36m0.9435[0m  0.0750
     29        [36m0.9433[0m  0.0900
     30        [36m0.9427[0m  0.0680
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m7.4523[0m  0.0680
      2        [36m1.3255[0m  0.0670
      3        [36m1.2193[0m  0.0750
      4        [36m1.1392[0m  0.0730
      5        [36m1.0734[0m  0.0670
      6        [36m1.0515[0m  0.0690
      7        [36m1.0308[0m  0.0670
      8        [36m1.0006[0m  0.0670
      9        [36m0.9791[0m  0.0730
     10        0.9864  0.0700
     11        [36m0.9729[0m  0.0710
     12        [36m0.9689[0m  0.0670
     13        [36m0.9658[0m  0.0790
     14        [36m0.9603[0m  0.0670
     15        [36m0.9594[0m  0.0690
     16        [36m0.9554[0m  0.0740
     17        [36m0.9532[0m  0.0710
     18        [36m0.9484[0m  0.0750
     19        [36m0.

     16       11.9568  0.0790
     17       11.9568  0.0760
     18       11.9568  0.0780
     19       11.9568  0.0750
     20       11.9568  0.0730
     21       11.9568  0.0780
     22       11.9568  0.0820
     23       11.9568  0.0740
     24       11.9568  0.0750
     25       11.9568  0.0710
     26       11.9568  0.0750
     27       11.9568  0.0740
     28       11.9568  0.0700
     29       11.9568  0.0730
     30       11.9568  0.0790
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.0029[0m  0.0660
      2        [36m1.3875[0m  0.0720
      3        [36m1.3864[0m  0.0710
      4        [36m1.3864[0m  0.0700
      5        1.3864  0.0690
      6        1.3864  0.0720
      7        1.3864  0.0740
      8        1.3864  0.0670
      9        1.3864  0.0750
     10        1.3864  0.0670
     11        1.3864  0.0740
     12        1.3864  0.0770
     13        1.3864  0.0660
     14        1.3864  0.0750
     15        1.3864  0.0686
    

     21        1.3863  0.0720
     22        1.3864  0.0710
     23        1.3864  0.0690
     24        1.3864  0.0747
     25        1.3864  0.0750
     26        1.3864  0.0750
     27        1.3864  0.0710
     28        1.3864  0.0770
     29        1.3864  0.0750
     30        1.3864  0.0730
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.9365[0m  0.0780
      2        [36m1.3867[0m  0.0740
      3        [36m1.3864[0m  0.0740
      4        1.3864  0.0750
      5        1.3864  0.0720
      6        1.3864  0.0750
      7        1.3864  0.0680
      8        1.3864  0.0700
      9        1.3864  0.0670
     10        1.3864  0.0690
     11        1.3864  0.0720
     12        1.3864  0.0750
     13        1.3864  0.0720
     14        1.3864  0.0780
     15        1.3864  0.0740
     16        1.3864  0.0730
     17        1.3864  0.0700
     18        1.3864  0.0730
     19        1.3864  0.0740
     20        1.3864  0.0790
     21      

  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.6422[0m  0.0740
      2       11.9547  0.0760
      3       11.9547  0.0800
      4       11.9547  0.0700
      5       11.9547  0.0720
      6       11.9547  0.0750
      7       11.9547  0.0700
      8        [36m5.4886[0m  0.0720
      9        [36m1.3874[0m  0.0760
     10        [36m1.3871[0m  0.0680
     11        1.3876  0.0720
     12        1.3877  0.0750
     13        1.3877  0.0670
     14        1.3877  0.0680
     15        1.3877  0.0710
     16        1.3876  0.0700
     17        1.3876  0.0710
     18        1.3876  0.0780
     19        1.3876  0.0710
     20        1.3876  0.0700
     21        1.3876  0.0700
     22        1.3876  0.0740
     23        1.3876  0.0760
     24        1.3876  0.0670
     25        1.3876  0.0780
     26        1.3876  0.0870
     27        1.3876  0.0730
     28        1.3876  0.0760
     29        1.3876  0.0710
     30        1.3876  0.0700
  ep

      2       [36m11.3439[0m  0.0730
      3       [36m11.2528[0m  0.0870
      4        [36m6.2742[0m  0.0700
      5        7.8809  0.0700
      6        [36m1.4006[0m  0.0670
      7        1.5800  0.0680
      8        1.6092  0.0680
      9        1.4163  0.0710
     10        [36m1.3966[0m  0.0680
     11        [36m1.3882[0m  0.0720
     12        [36m1.3878[0m  0.0780
     13        [36m1.3876[0m  0.0680
     14        1.3878  0.0760
     15        1.3878  0.0710
     16        1.3878  0.0720
     17        1.3878  0.0780
     18        1.3878  0.0790
     19        1.3878  0.0660
     20        1.3878  0.0670
     21        1.3878  0.0670
     22        1.3878  0.0670
     23        1.3878  0.0720
     24        1.3878  0.0660
     25        1.3878  0.0720
     26        1.3878  0.0740
     27        1.3878  0.0740
     28        1.3878  0.0660
     29        1.3878  0.0670
     30        1.3878  0.0700
  epoch    train_loss     dur
-------  ------------  -----

     20        [36m1.3867[0m  0.0660
     21        [36m1.3867[0m  0.0650
     22        [36m1.3866[0m  0.0630
     23        [36m1.3866[0m  0.0670
     24        [36m1.3866[0m  0.0700
     25        [36m1.3865[0m  0.0700
     26        [36m1.3865[0m  0.0750
     27        [36m1.3865[0m  0.0760
     28        [36m1.3865[0m  0.0700
     29        [36m1.3864[0m  0.0720
     30        [36m1.3864[0m  0.0670
     31        [36m1.3864[0m  0.0670
     32        [36m1.3864[0m  0.0710
     33        [36m1.3864[0m  0.0650
     34        [36m1.3864[0m  0.0650
     35        [36m1.3864[0m  0.0640
     36        [36m1.3864[0m  0.0690
     37        [36m1.3863[0m  0.0770
     38        [36m1.3863[0m  0.0680
     39        [36m1.3863[0m  0.0650
     40        [36m1.3863[0m  0.0640
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5874[0m  0.0760
      2        [36m1.4168[0m  0.0650
      3        [36m1.4124[0m  0.0690
    

     23        [36m1.3868[0m  0.0730
     24        [36m1.3867[0m  0.0730
     25        [36m1.3867[0m  0.0630
     26        [36m1.3866[0m  0.0650
     27        [36m1.3866[0m  0.0820
     28        [36m1.3865[0m  0.0670
     29        [36m1.3865[0m  0.0640
     30        [36m1.3865[0m  0.0640
     31        [36m1.3865[0m  0.0640
     32        [36m1.3864[0m  0.0740
     33        [36m1.3864[0m  0.0720
     34        [36m1.3864[0m  0.0650
     35        [36m1.3864[0m  0.0690
     36        [36m1.3864[0m  0.0680
     37        [36m1.3864[0m  0.0640
     38        [36m1.3864[0m  0.0630
     39        [36m1.3864[0m  0.0660
     40        [36m1.3864[0m  0.0670
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.0169[0m  0.0730
      2        [36m1.3867[0m  0.0630
      3        [36m1.3866[0m  0.0640
      4        [36m1.3864[0m  0.0640
      5        [36m1.3864[0m  0.0640
      6        [36m1.3863[0m  0.0710
    

     37        [36m1.0762[0m  0.0650
     38        [36m1.0746[0m  0.0640
     39        [36m1.0744[0m  0.0730
     40        [36m1.0720[0m  0.0640
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5622[0m  0.0690
      2        [36m1.3878[0m  0.0810
      3        [36m1.3864[0m  0.0720
      4        [36m1.3863[0m  0.0700
      5        1.3864  0.0680
      6        1.3864  0.0680
      7        1.3864  0.0630
      8        1.3864  0.0670
      9        1.3864  0.0660
     10        1.3864  0.0650
     11        1.3864  0.0680
     12        1.3864  0.0730
     13        1.3864  0.0660
     14        1.3864  0.0640
     15        1.3864  0.0670
     16        1.3864  0.0670
     17        1.3864  0.0770
     18        1.3864  0.0660
     19        1.3864  0.0630
     20        1.3864  0.0710
     21        1.3864  0.0630
     22        1.3864  0.0640
     23        1.3864  0.0630
     24        1.3864  0.0660
     25        1.3864  0.073

     40        1.3864  0.0660
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.0802[0m  0.0620
      2        [36m1.3870[0m  0.0630
      3        [36m1.3864[0m  0.0660
      4        [36m1.3862[0m  0.0650
      5        [36m1.3836[0m  0.0700
      6        [36m1.3575[0m  0.0660
      7        [36m1.2740[0m  0.0805
      8        1.3813  0.0690
      9        1.3913  0.0650
     10        1.3866  0.0690
     11        1.3864  0.0690
     12        1.3864  0.0660
     13        1.3864  0.0660
     14        1.3864  0.0730
     15        1.3864  0.0730
     16        1.3864  0.0730
     17        1.3864  0.0660
     18        1.3864  0.0630
     19        1.3864  0.0650
     20        1.3864  0.0700
     21        1.3864  0.0780
     22        1.3864  0.0680
     23        1.3864  0.0640
     24        1.3864  0.0710
     25        1.3864  0.0680
     26        1.3864  0.0680
     27        1.3864  0.0640
     28        1.3864  0.0680
     29

     34        1.3864  0.0760
     35        1.3864  0.0700
     36        1.3864  0.0710
     37        1.3864  0.0710
     38        1.3864  0.0730
     39        1.3864  0.0780
     40        1.3864  0.0720
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6473[0m  0.0710
      2        [36m1.3881[0m  0.0760
      3        [36m1.3864[0m  0.0810
      4        [36m1.3864[0m  0.0780
      5        [36m1.3864[0m  0.0680
      6        [36m1.3864[0m  0.0670
      7        1.3864  0.0730
      8        1.3864  0.0660
      9        1.3864  0.0640
     10        1.3864  0.0700
     11        1.3864  0.0660
     12        1.3864  0.0650
     13        1.3864  0.0670
     14        1.3864  0.0700
     15        1.3864  0.0740
     16        1.3864  0.0640
     17        1.3864  0.0760
     18        1.3864  0.0740
     19        1.3864  0.0650
     20        1.3864  0.0640
     21        1.3864  0.0650
     22        1.3864  0.0700
     23        1

     38        1.3875  0.0700
     39        1.3875  0.0680
     40        1.3875  0.0640
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.3916[0m  0.0740
      2        [36m1.3880[0m  0.0720
      3        [36m1.3878[0m  0.0640
      4        [36m1.3877[0m  0.0830
      5        1.3877  0.0670
      6        1.3877  0.0680
      7        1.3877  0.0680
      8        1.3877  0.0710
      9        1.3877  0.0660
     10        1.3877  0.0690
     11        1.3877  0.0660
     12        1.3877  0.0730
     13        1.3877  0.0720
     14        1.3877  0.0660
     15        1.3877  0.0640
     16        1.3877  0.0690
     17        1.3877  0.0670
     18        1.3877  0.0670
     19        1.3877  0.0820
     20        1.3877  0.0650
     21        1.3877  0.0660
     22        1.3877  0.0660
     23        1.3877  0.0680
     24        1.3877  0.0640
     25        1.3877  0.0690
     26        1.3877  0.0670
     27        1.3877  0.0640
    

     40        1.3877  0.0630
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4095[0m  0.0630
      2        [36m1.3890[0m  0.0700
      3        [36m1.3888[0m  0.0680
      4        [36m1.3882[0m  0.0640
      5        1.3882  0.0720
      6        [36m1.3879[0m  0.0650
      7        [36m1.3878[0m  0.0690
      8        [36m1.3878[0m  0.0650
      9        [36m1.3878[0m  0.0740
     10        [36m1.3878[0m  0.0790
     11        [36m1.3878[0m  0.0640
     12        [36m1.3878[0m  0.0700
     13        [36m1.3878[0m  0.0670
     14        [36m1.3878[0m  0.0700
     15        [36m1.3878[0m  0.0650
     16        [36m1.3878[0m  0.0640
     17        [36m1.3878[0m  0.0720
     18        1.3878  0.0640
     19        1.3878  0.0650
     20        1.3878  0.0640
     21        1.3878  0.0670
     22        1.3878  0.0640
     23        1.3878  0.0700
     24        1.3878  0.0790
     25        1.3878  0.0690
     26        1

      7        [36m1.3916[0m  0.0710
      8        [36m1.3909[0m  0.0690
      9        [36m1.3902[0m  0.0730
     10        [36m1.3896[0m  0.0760
     11        [36m1.3892[0m  0.0650
     12        [36m1.3887[0m  0.0680
     13        [36m1.3883[0m  0.0770
     14        [36m1.3880[0m  0.0720
     15        [36m1.3877[0m  0.0680
     16        [36m1.3875[0m  0.0640
     17        [36m1.3873[0m  0.0680
     18        [36m1.3871[0m  0.0670
     19        [36m1.3870[0m  0.0720
     20        [36m1.3868[0m  0.0640
     21        [36m1.3868[0m  0.0650
     22        [36m1.3867[0m  0.0650
     23        [36m1.3866[0m  0.0690
     24        [36m1.3866[0m  0.0690
     25        [36m1.3865[0m  0.0650
     26        [36m1.3865[0m  0.0680
     27        [36m1.3864[0m  0.0670
     28        [36m1.3864[0m  0.0810
     29        [36m1.3864[0m  0.0650
     30        [36m1.3864[0m  0.0660
     31        [36m1.3863[0m  0.0720
     32        [36m1.386

     17        [36m1.3246[0m  0.0670
     18        [36m1.3170[0m  0.0690
     19        [36m1.3055[0m  0.0650
     20        [36m1.2912[0m  0.0720
     21        [36m1.2737[0m  0.0650
     22        [36m1.2514[0m  0.0640
     23        [36m1.2229[0m  0.0640
     24        [36m1.1913[0m  0.0780
     25        [36m1.1636[0m  0.0730
     26        [36m1.1433[0m  0.0730
     27        [36m1.1243[0m  0.0690
     28        [36m1.1088[0m  0.0640
     29        [36m1.0952[0m  0.0700
     30        [36m1.0851[0m  0.0650
     31        [36m1.0772[0m  0.0690
     32        [36m1.0698[0m  0.0700
     33        [36m1.0658[0m  0.0700
     34        [36m1.0625[0m  0.0760
     35        [36m1.0600[0m  0.0660
     36        [36m1.0560[0m  0.0650
     37        [36m1.0508[0m  0.0660
     38        [36m1.0399[0m  0.0780
     39        1.0447  0.0720
     40        1.0424  0.0710
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.

     26        [36m1.1055[0m  0.0670
     27        [36m1.1014[0m  0.0690
     28        [36m1.0927[0m  0.0680
     29        [36m1.0878[0m  0.0660
     30        [36m1.0851[0m  0.0680
     31        [36m1.0814[0m  0.0680
     32        [36m1.0756[0m  0.0660
     33        [36m1.0714[0m  0.0650
     34        [36m1.0686[0m  0.0730
     35        [36m1.0659[0m  0.0760
     36        [36m1.0634[0m  0.0710
     37        [36m1.0615[0m  0.0650
     38        [36m1.0580[0m  0.0640
     39        [36m1.0539[0m  0.0680
     40        1.0540  0.0660
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.8974[0m  0.0640
      2        [36m1.3850[0m  0.0670
      3        [36m1.3696[0m  0.0650
      4        [36m1.3549[0m  0.0680
      5        [36m1.3394[0m  0.0680
      6        [36m1.3228[0m  0.0660
      7        [36m1.3039[0m  0.0710
      8        [36m1.2809[0m  0.0680
      9        [36m1.2535[0m  0.0650
     10      

     37        1.3864  0.0650
     38        1.3864  0.0650
     39        1.3864  0.0680
     40        1.3864  0.0700
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5212[0m  0.0640
      2        [36m1.3912[0m  0.0690
      3        [36m1.3871[0m  0.0700
      4        [36m1.3865[0m  0.0680
      5        [36m1.3864[0m  0.0690
      6        [36m1.3864[0m  0.0770
      7        [36m1.3864[0m  0.0690
      8        [36m1.3864[0m  0.0690
      9        [36m1.3864[0m  0.0740
     10        [36m1.3864[0m  0.0650
     11        1.3864  0.0830
     12        1.3864  0.0710
     13        [36m1.3864[0m  0.0660
     14        1.3864  0.0720
     15        [36m1.3864[0m  0.0760
     16        1.3864  0.0660
     17        [36m1.3864[0m  0.0680
     18        1.3864  0.0690
     19        1.3864  0.0660
     20        1.3864  0.0800
     21        1.3864  0.0670
     22        1.3864  0.0660
     23        1.3864  0.0640
     24      

      2        [36m1.3877[0m  0.0720
      3        [36m1.3866[0m  0.0650
      4        [36m1.3865[0m  0.0740
      5        [36m1.3864[0m  0.0650
      6        [36m1.3864[0m  0.0680
      7        [36m1.3864[0m  0.0650
      8        [36m1.3864[0m  0.0660
      9        [36m1.3864[0m  0.0670
     10        [36m1.3864[0m  0.0680
     11        [36m1.3864[0m  0.0680
     12        [36m1.3864[0m  0.0710
     13        [36m1.3864[0m  0.0650
     14        [36m1.3864[0m  0.0650
     15        [36m1.3864[0m  0.0710
     16        [36m1.3864[0m  0.0730
     17        [36m1.3864[0m  0.0660
     18        [36m1.3864[0m  0.0770
     19        [36m1.3864[0m  0.0640
     20        [36m1.3864[0m  0.0730
     21        [36m1.3864[0m  0.0670
     22        [36m1.3864[0m  0.0700
     23        [36m1.3864[0m  0.0650
     24        [36m1.3864[0m  0.0640
     25        [36m1.3864[0m  0.0660
     26        [36m1.3864[0m  0.0670
     27        [36m1.386

      2        [36m1.3873[0m  0.0690
      3        [36m1.3864[0m  0.0670
      4        [36m1.3864[0m  0.0650
      5        [36m1.3864[0m  0.0820
      6        1.3864  0.0690
      7        1.3864  0.0660
      8        1.3864  0.0660
      9        1.3864  0.0640
     10        1.3864  0.0740
     11        1.3864  0.0700
     12        1.3864  0.0690
     13        1.3864  0.0650
     14        1.3864  0.0680
     15        1.3864  0.0640
     16        1.3864  0.0660
     17        1.3864  0.0660
     18        1.3864  0.0700
     19        1.3864  0.0700
     20        1.3864  0.0720
     21        1.3864  0.0690
     22        1.3864  0.0660
     23        1.3864  0.0710
     24        1.3864  0.0680
     25        1.3864  0.0670
     26        1.3864  0.0730
     27        1.3864  0.0640
     28        1.3864  0.0740
     29        1.3864  0.0680
     30        1.3864  0.0710
     31        1.3864  0.0660
     32        1.3864  0.0790
     33        1.3864  0.0740
    

     19       11.9568  0.0690
     20       11.9568  0.0700
     21       11.9568  0.0700
     22       11.9568  0.0890
     23       11.9568  0.0740
     24       11.9568  0.0680
     25       11.9568  0.0690
     26       11.9568  0.0720
     27       11.9568  0.0720
     28       11.9568  0.0680
     29       11.9568  0.0670
     30       11.9568  0.0870
     31       11.9568  0.0790
     32       11.9568  0.0750
     33       11.9568  0.0700
     34       11.9568  0.0700
     35       11.9568  0.0670
     36       11.9568  0.0670
     37       11.9568  0.0670
     38       11.9568  0.0730
     39       11.9568  0.0860
     40       11.9568  0.0780
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5316[0m  0.0740
      2        [36m1.3891[0m  0.0810
      3        [36m1.3881[0m  0.0830
      4        [36m1.3880[0m  0.0780
      5        1.3880  0.0680
      6        1.3880  0.0710
      7        1.3880  0.0710
      8        1.3880  0.0690
    

     32        1.3880  0.0690
     33        1.3880  0.0660
     34        1.3880  0.0670
     35        1.3880  0.0710
     36        1.3880  0.0710
     37        1.3880  0.0650
     38        1.3880  0.0690
     39        1.3880  0.0690
     40        1.3880  0.0790
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.6394[0m  0.0680
      2        [36m1.3922[0m  0.0670
      3        1.4295  0.0660
      4        1.4419  0.0650
      5        5.8369  0.0670
      6       10.0373  0.0670
      7        [36m1.3905[0m  0.0650
      8        3.2979  0.0680
      9        3.3496  0.0690
     10        1.9393  0.0640
     11        6.1677  0.0660
     12        1.4069  0.0700
     13        1.5275  0.0650
     14       11.1830  0.0810
     15        5.9449  0.0720
     16       11.9292  0.0690
     17        4.2036  0.0650
     18        5.8386  0.0650
     19        7.7683  0.0680
     20        1.7821  0.0710
     21        [36m1.3875[0m  0.0720
    

     28        [36m0.9093[0m  0.0690
     29        [36m0.9080[0m  0.0660
     30        [36m0.9060[0m  0.0700
     31        [36m0.9049[0m  0.0710
     32        [36m0.9024[0m  0.0650
     33        [36m0.9013[0m  0.0740
     34        [36m0.8976[0m  0.0720
     35        0.8985  0.0690
     36        0.9000  0.0660
     37        0.8992  0.0650
     38        [36m0.8952[0m  0.0720
     39        0.9031  0.0870
     40        [36m0.8948[0m  0.0690
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.0420[0m  0.0680
      2        [36m1.3728[0m  0.0710
      3        [36m1.3562[0m  0.0760
      4        [36m1.3296[0m  0.0660
      5        [36m1.3126[0m  0.0660
      6        [36m1.2973[0m  0.0680
      7        [36m1.2879[0m  0.0650
      8        [36m1.2765[0m  0.0660
      9        [36m1.2535[0m  0.0670
     10        [36m1.2448[0m  0.0670
     11        [36m1.2366[0m  0.0680
     12        [36m1.2265[0m  0.0680
 

     36        [36m0.9142[0m  0.0770
     37        [36m0.9136[0m  0.0730
     38        [36m0.9131[0m  0.0700
     39        [36m0.9128[0m  0.0730
     40        [36m0.9119[0m  0.0690
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4913[0m  0.0760
      2        [36m1.2916[0m  0.0670
      3        [36m1.2427[0m  0.0650
      4        [36m1.1616[0m  0.0660
      5        [36m1.0690[0m  0.0690
      6        [36m1.0374[0m  0.0720
      7        [36m0.9938[0m  0.0820
      8        [36m0.9811[0m  0.0730
      9        [36m0.9644[0m  0.0700
     10        [36m0.9559[0m  0.0690
     11        [36m0.9536[0m  0.0740
     12        0.9736  0.0670
     13        0.9688  0.0720
     14        [36m0.9391[0m  0.0700
     15        0.9441  0.0710
     16        [36m0.9289[0m  0.0680
     17        0.9340  0.0700
     18        [36m0.9247[0m  0.0700
     19        [36m0.9246[0m  0.0660
     20        [36m0.9200[0m  0.0780
 

      6        [36m1.3350[0m  0.0730
      7        [36m1.3182[0m  0.0740
      8        [36m1.2989[0m  0.0770
      9        [36m1.2777[0m  0.0730
     10        [36m1.2531[0m  0.0750
     11        [36m1.2297[0m  0.0690
     12        [36m1.2058[0m  0.0710
     13        [36m1.1848[0m  0.0920
     14        [36m1.1682[0m  0.0870
     15        [36m1.1543[0m  0.0820
     16        [36m1.1422[0m  0.0722
     17        [36m1.1325[0m  0.0730
     18        [36m1.1236[0m  0.0680
     19        [36m1.1165[0m  0.0720
     20        [36m1.1095[0m  0.0700
     21        [36m1.1040[0m  0.0680
     22        [36m1.1006[0m  0.0730
     23        [36m1.0943[0m  0.0670
     24        [36m1.0902[0m  0.0670
     25        [36m1.0854[0m  0.0710
     26        [36m1.0829[0m  0.0660
     27        [36m1.0794[0m  0.0660
     28        [36m1.0751[0m  0.0780
     29        [36m1.0727[0m  0.0700
     30        [36m1.0702[0m  0.0690
     31        [36m1.067

     31       11.9589  0.0750
     32       11.9589  0.0720
     33       11.9589  0.0760
     34       11.9589  0.0850
     35       11.9589  0.0830
     36       11.9589  0.0690
     37       11.9589  0.0730
     38       11.9589  0.0690
     39       11.9589  0.0710
     40       11.9589  0.0690
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7814[0m  0.0650
      2        [36m1.3832[0m  0.0700
      3        1.3873  0.0750
      4        1.3863  0.0650
      5        1.3875  0.0710
      6        1.3872  0.0760
      7        1.3864  0.0720
      8        1.3864  0.0800
      9        1.3864  0.0650
     10        1.3864  0.0670
     11        1.3864  0.0650
     12        1.3864  0.0680
     13        1.3864  0.0660
     14        1.3864  0.0700
     15        1.3864  0.0720
     16        1.3864  0.0670
     17        1.3864  0.0700
     18        1.3864  0.0690
     19        1.3864  0.0650
     20        1.3864  0.0680
     21        1.3864 

      5       11.9568  0.0750
      6       11.9568  0.0680
      7       11.9568  0.0750
      8       11.9568  0.0680
      9       11.9568  0.0740
     10       11.9568  0.0710
     11       11.9568  0.0790
     12       11.9568  0.0750
     13       11.9568  0.0680
     14       11.9568  0.0730
     15       11.9568  0.0720
     16       11.9568  0.0700
     17       11.9568  0.0690
     18       11.9568  0.0860
     19       11.9568  0.0680
     20       11.9568  0.0680
     21       11.9568  0.0770
     22       11.9568  0.0690
     23       11.9568  0.0760
     24       11.9568  0.0680
     25       11.9568  0.0660
     26       11.9568  0.0660
     27       11.9568  0.0710
     28       11.9568  0.0690
     29       11.9568  0.0750
     30       11.9568  0.0720
     31       11.9568  0.0790
     32       11.9567  0.0680
     33        [36m5.7859[0m  0.0670
     34        [36m1.3872[0m  0.0660
     35        [36m1.3865[0m  0.0660
     36        [36m1.3864[0m  0.0680
    

     18       11.9568  0.0760
     19       11.9568  0.0710
     20       11.9568  0.0680
     21       11.9568  0.0680
     22       11.9568  0.0680
     23       11.9568  0.0710
     24       11.9568  0.0740
     25       11.9568  0.0700
     26       11.9568  0.0760
     27       11.9568  0.0700
     28       11.9568  0.0850
     29       11.9568  0.0810
     30       11.9568  0.0740
     31       11.9568  0.0720
     32       11.9568  0.0720
     33       11.9568  0.0680
     34       11.9568  0.0720
     35       11.9568  0.0750
     36       11.9568  0.0680
     37       11.9568  0.0760
     38       11.9568  0.0710
     39       11.9568  0.0750
     40       11.9568  0.0680
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8789[0m  0.0770
      2       11.9547  0.0730
      3       11.9547  0.0720
      4       11.9547  0.0710
      5       11.9547  0.0680
      6       11.9547  0.0750
      7       11.9547  0.0700
      8       11.9547  0.0680
 

     36        1.3876  0.0720
     37        1.3876  0.0710
     38        1.3876  0.0680
     39        1.3876  0.0680
     40        1.3876  0.0770
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.6716[0m  0.0760
      2       11.9547  0.0710
      3       11.9547  0.0690
      4       11.9547  0.0770
      5       11.9547  0.0810
      6       11.9547  0.0710
      7       11.9547  0.0710
      8       11.7803  0.0690
      9       11.9568  0.0680
     10       11.9568  0.0720
     11       11.9568  0.0720
     12       11.9568  0.0700
     13       11.9568  0.0730
     14        [36m9.6528[0m  0.0660
     15        [36m1.3877[0m  0.0660
     16        [36m1.3877[0m  0.0710
     17        [36m1.3875[0m  0.0660
     18        [36m1.3875[0m  0.0790
     19        1.3875  0.0730
     20        1.3875  0.0650
     21        1.3875  0.0660
     22        1.3875  0.0650
     23        1.3875  0.0690
     24        1.3875  0.0720
     25        1

      5       11.9302  0.0730
      6       10.7503  0.0700
      7        [36m1.4757[0m  0.0680
      8        [36m1.4749[0m  0.0710
      9        [36m1.4007[0m  0.0680
     10        1.4438  0.0650
     11        [36m1.4006[0m  0.0650
     12        [36m1.3887[0m  0.0730
     13        1.4971  0.0670
     14        3.2980  0.0710
     15        4.2099  0.0810
     16        [36m1.3873[0m  0.0740
     17        1.3879  0.0660
     18        1.3883  0.0710
     19        1.3878  0.0700
     20        1.3877  0.0670
     21        1.3877  0.0710
     22        1.3877  0.0690
     23        1.3877  0.0700
     24        1.3877  0.0740
     25        1.3877  0.0730
     26        1.3877  0.0650
     27        1.3877  0.0740
     28        1.3877  0.0660
     29        1.3877  0.0890
     30        1.3877  0.0660
     31        1.3877  0.0710
     32        1.3877  0.0680
     33        1.3877  0.0660
     34        1.3877  0.0680
     35        1.3877  0.0710
     36        1

     31        [36m0.9236[0m  0.0750
     32        [36m0.9213[0m  0.0660
     33        [36m0.9165[0m  0.0760
     34        [36m0.9132[0m  0.0670
     35        [36m0.9099[0m  0.0660
     36        [36m0.9083[0m  0.0800
     37        [36m0.9071[0m  0.0680
     38        [36m0.9049[0m  0.0730
     39        [36m0.9016[0m  0.0670
     40        [36m0.8988[0m  0.0730
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.0455[0m  0.0670
      2        [36m1.1220[0m  0.0680
      3        [36m1.0146[0m  0.0670
      4        [36m1.0034[0m  0.0680
      5        [36m0.9889[0m  0.0690
      6        [36m0.9778[0m  0.0670
      7        [36m0.9730[0m  0.0670
      8        [36m0.9523[0m  0.0670
      9        [36m0.9427[0m  0.0660
     10        [36m0.9394[0m  0.0790
     11        [36m0.9358[0m  0.0750
     12        [36m0.9334[0m  0.0720
     13        [36m0.9309[0m  0.0680
     14        [36m0.9289[0m  0.0680
    

     40        [36m0.8935[0m  0.0700
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.3747[0m  0.0680
      2        [36m1.3925[0m  0.0740
      3        [36m1.3894[0m  0.0840
      4        [36m1.3880[0m  0.0720
      5        [36m1.3869[0m  0.0740
      6        [36m1.3852[0m  0.0720
      7        [36m1.3811[0m  0.0670
      8        [36m1.3710[0m  0.0720
      9        [36m1.3639[0m  0.0750
     10        [36m1.3593[0m  0.0660
     11        [36m1.3539[0m  0.0670
     12        [36m1.3390[0m  0.0700
     13        [36m1.2649[0m  0.0680
     14        [36m1.1616[0m  0.0710
     15        [36m1.0787[0m  0.0680
     16        [36m1.0543[0m  0.0710
     17        [36m1.0121[0m  0.0820
     18        [36m1.0059[0m  0.0680
     19        [36m0.9905[0m  0.0690
     20        [36m0.9846[0m  0.0710
     21        [36m0.9665[0m  0.0700
     22        [36m0.9564[0m  0.0680
     23        [36m0.9525[0m  0.0700
    

     15        [36m0.9495[0m  0.0660
     16        0.9510  0.0740
     17        [36m0.9457[0m  0.0700
     18        [36m0.9447[0m  0.0660
     19        [36m0.9441[0m  0.0680
     20        [36m0.9434[0m  0.0780
     21        [36m0.9422[0m  0.0680
     22        [36m0.9410[0m  0.0690
     23        [36m0.9407[0m  0.0680
     24        [36m0.9401[0m  0.0710
     25        [36m0.9388[0m  0.0660
     26        0.9391  0.0790
     27        [36m0.9383[0m  0.0730
     28        [36m0.9377[0m  0.0740
     29        [36m0.9376[0m  0.0680
     30        0.9381  0.0670
     31        0.9376  0.0680
     32        [36m0.9373[0m  0.0660
     33        0.9374  0.0670
     34        0.9376  0.0700
     35        [36m0.9373[0m  0.0680
     36        0.9376  0.0670
     37        0.9377  0.0670
     38        [36m0.9373[0m  0.0670
     39        0.9377  0.0790
     40        0.9377  0.0680
  epoch    train_loss     dur
-------  ------------  ------
      1       [

     15       11.9589  0.0740
     16       11.9589  0.0750
     17       11.9589  0.0690
     18       11.9589  0.0670
     19       11.9589  0.0710
     20       11.9589  0.0670
     21       11.9589  0.0680
     22       11.9588  0.0680
     23       11.9540  0.0720
     24        [36m2.3936[0m  0.0740
     25        [36m1.3863[0m  0.0670
     26        1.3864  0.0830
     27        1.3865  0.0750
     28        1.3865  0.0790
     29        1.3865  0.0660
     30        1.3864  0.0660
     31        1.3864  0.0670
     32        1.3864  0.0710
     33        1.3864  0.0730
     34        1.3864  0.0660
     35        1.3864  0.0670
     36        1.3864  0.0740
     37        1.3864  0.0670
     38        1.3864  0.0670
     39        1.3864  0.0660
     40        1.3864  0.0800
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8173[0m  0.0730
      2       11.9568  0.0730
      3       11.9568  0.0720
      4       11.9568  0.0710
      5      

     28        1.3864  0.0700
     29        1.3864  0.0720
     30        1.3864  0.0670
     31        1.3864  0.0770
     32        1.3864  0.0800
     33        1.3864  0.0740
     34        1.3864  0.0740
     35        1.3864  0.0660
     36        1.3864  0.0790
     37        1.3864  0.0700
     38        1.3864  0.0680
     39        1.3864  0.0740
     40        1.3864  0.0670
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.6920[0m  0.0710
      2       11.9547  0.0760
      3       11.9547  0.0740
      4       11.9547  0.0720
      5        [36m5.0877[0m  0.0790
      6        [36m1.3775[0m  0.0700
      7        [36m1.3383[0m  0.0680
      8        [36m1.2994[0m  0.0660
      9        1.3739  0.0700
     10        1.3893  0.0670
     11        1.3866  0.0750
     12        1.3864  0.0660
     13        1.3864  0.0820
     14        1.3864  0.0710
     15        1.3864  0.0660
     16        1.3864  0.0700
     17        1.3864  0.

      2       11.9568  0.0730
      3       11.9568  0.0690
      4       11.9568  0.0700
      5       11.9568  0.0680
      6       11.9568  0.0750
      7       11.9568  0.0700
      8       11.9568  0.0820
      9       11.9568  0.0780
     10       11.9568  0.0690
     11       11.9568  0.0730
     12       11.9568  0.0780
     13       11.9568  0.0730
     14       11.9568  0.0740
     15       11.9568  0.0750
     16       11.9568  0.0700
     17       11.9568  0.0740
     18       11.9568  0.0750
     19       11.9568  0.0720
     20       11.9568  0.0730
     21       11.9568  0.0830
     22       11.9568  0.0710
     23       11.9568  0.0720
     24       11.9568  0.0700
     25       11.9568  0.0750
     26       11.9568  0.0710
     27       11.9568  0.0730
     28       11.9568  0.0740
     29       11.9568  0.0750
     30       11.9568  0.0770
     31       11.9568  0.0730
     32       11.9568  0.0700
     33       11.9568  0.0690
     34       11.9568  0.0700
     35   

     15        1.3878  0.0670
     16        1.3878  0.0680
     17        1.3878  0.0660
     18        1.3878  0.0700
     19        1.3878  0.0680
     20        1.3878  0.0670
     21        1.3878  0.0730
     22        1.3878  0.0670
     23        1.3878  0.0710
     24        1.3878  0.0690
     25        1.3878  0.0820
     26        1.3878  0.0750
     27        1.3878  0.0700
     28        1.3878  0.0710
     29        1.3878  0.0700
     30        1.3878  0.0700
     31        1.3878  0.0760
     32        1.3878  0.0670
     33        1.3878  0.0720
     34        1.3878  0.0670
     35        1.3878  0.0660
     36        1.3878  0.0660
     37        1.3878  0.0660
     38        1.3878  0.0660
     39        1.3878  0.0670
     40        1.3878  0.0910
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7548[0m  0.0730
      2       [36m10.7722[0m  0.0730
      3       11.8475  0.0720
      4       11.8442  0.0710
      5       11.9233 

     19        [36m1.3872[0m  0.0660
     20        [36m1.3870[0m  0.0630
     21        [36m1.3869[0m  0.0670
     22        [36m1.3868[0m  0.0680
     23        [36m1.3867[0m  0.0630
     24        [36m1.3866[0m  0.0710
     25        [36m1.3865[0m  0.0650
     26        [36m1.3865[0m  0.0680
     27        [36m1.3864[0m  0.0770
     28        [36m1.3864[0m  0.0690
     29        [36m1.3863[0m  0.0710
     30        [36m1.3863[0m  0.0670
     31        [36m1.3863[0m  0.0640
     32        [36m1.3863[0m  0.0630
     33        [36m1.3863[0m  0.0780
     34        [36m1.3862[0m  0.0680
     35        [36m1.3862[0m  0.0650
     36        [36m1.3862[0m  0.0640
     37        [36m1.3862[0m  0.0680
     38        [36m1.3862[0m  0.0670
     39        [36m1.3862[0m  0.0720
     40        [36m1.3862[0m  0.0700
     41        [36m1.3862[0m  0.0670
     42        [36m1.3862[0m  0.0660
     43        [36m1.3862[0m  0.0690
     44        [36m1.386

     30        [36m1.0221[0m  0.0670
     31        [36m1.0178[0m  0.0730
     32        1.0267  0.0650
     33        [36m1.0177[0m  0.0800
     34        [36m1.0162[0m  0.0690
     35        [36m1.0028[0m  0.0670
     36        1.0042  0.0630
     37        1.0090  0.0690
     38        1.0100  0.0690
     39        [36m0.9969[0m  0.0680
     40        1.0012  0.0680
     41        [36m0.9943[0m  0.0630
     42        0.9955  0.0660
     43        0.9985  0.0640
     44        [36m0.9846[0m  0.0720
     45        0.9913  0.0630
     46        [36m0.9824[0m  0.0650
     47        0.9851  0.0770
     48        1.0021  0.0680
     49        [36m0.9668[0m  0.0820
     50        0.9724  0.0640
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5293[0m  0.0650
      2        [36m1.4210[0m  0.0670
      3        [36m1.4164[0m  0.0680
      4        [36m1.4124[0m  0.0650
      5        [36m1.4088[0m  0.0630
      6        [36m1.405

     36        [36m1.3863[0m  0.0670
     37        [36m1.3863[0m  0.0670
     38        [36m1.3863[0m  0.0810
     39        [36m1.3863[0m  0.0720
     40        [36m1.3863[0m  0.0640
     41        [36m1.3863[0m  0.0670
     42        [36m1.3863[0m  0.0640
     43        [36m1.3863[0m  0.0720
     44        [36m1.3863[0m  0.0630
     45        [36m1.3863[0m  0.0670
     46        [36m1.3863[0m  0.0640
     47        [36m1.3863[0m  0.0800
     48        1.3863  0.0660
     49        [36m1.3863[0m  0.0710
     50        1.3863  0.0660
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7155[0m  0.0650
      2        [36m1.3933[0m  0.0780
      3        [36m1.3922[0m  0.0700
      4        [36m1.3913[0m  0.0660
      5        [36m1.3905[0m  0.0670
      6        [36m1.3898[0m  0.0660
      7        [36m1.3893[0m  0.0640
      8        [36m1.3888[0m  0.0680
      9        [36m1.3884[0m  0.0670
     10        [36m1.

     44        [36m1.3066[0m  0.0760
     45        [36m1.2890[0m  0.0660
     46        [36m1.2686[0m  0.0710
     47        [36m1.2574[0m  0.0680
     48        [36m1.2452[0m  0.0800
     49        [36m1.2341[0m  0.0660
     50        [36m1.2169[0m  0.0660
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4214[0m  0.0680
      2        [36m1.3910[0m  0.0720
      3        [36m1.3897[0m  0.0650
      4        [36m1.3647[0m  0.0630
      5        [36m1.3195[0m  0.0680
      6        [36m1.2763[0m  0.0670
      7        [36m1.2380[0m  0.0690
      8        [36m1.2062[0m  0.0740
      9        [36m1.1811[0m  0.0660
     10        [36m1.1599[0m  0.0630
     11        [36m1.1443[0m  0.0640
     12        [36m1.1312[0m  0.0810
     13        [36m1.1210[0m  0.0700
     14        [36m1.1136[0m  0.0680
     15        [36m1.1068[0m  0.0700
     16        [36m1.1006[0m  0.0650
     17        [36m1.0955[0m  0.0690
    

     23        1.3864  0.0630
     24        1.3864  0.0630
     25        1.3864  0.0780
     26        1.3864  0.0630
     27        1.3864  0.0640
     28        1.3864  0.0680
     29        1.3864  0.0650
     30        1.3864  0.0670
     31        1.3864  0.0690
     32        1.3864  0.0640
     33        1.3864  0.0640
     34        1.3864  0.0660
     35        1.3864  0.0630
     36        1.3864  0.0690
     37        1.3864  0.0640
     38        1.3864  0.0700
     39        1.3864  0.0770
     40        1.3864  0.0640
     41        1.3864  0.0630
     42        1.3864  0.0630
     43        1.3864  0.0630
     44        1.3864  0.0710
     45        1.3864  0.0690
     46        1.3864  0.0630
     47        1.3864  0.0650
     48        1.3864  0.0690
     49        1.3864  0.0640
     50        1.3864  0.0700
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8611[0m  0.0690
      2       11.9568  0.0730
      3       11.9568  0.0710
 

      7       11.9568  0.0750
      8       11.9568  0.0660
      9       11.9568  0.0660
     10       11.9568  0.0650
     11       11.9568  0.0680
     12       11.9568  0.0670
     13       11.9568  0.0650
     14       11.9568  0.0660
     15       11.9568  0.0650
     16       11.9568  0.0720
     17       11.9568  0.0650
     18       11.9568  0.0650
     19       11.9568  0.0650
     20       11.9568  0.0680
     21       11.9568  0.0640
     22       11.9568  0.0650
     23       11.9568  0.0670
     24       11.9568  0.0640
     25       11.9568  0.0630
     26       11.9568  0.0630
     27       11.9568  0.0630
     28       11.9568  0.0660
     29       11.9568  0.0700
     30       11.9568  0.0700
     31       11.9568  0.0670
     32       11.9568  0.0630
     33       11.9568  0.0700
     34       11.9567  0.0630
     35        [36m3.0207[0m  0.0620
     36        [36m1.3874[0m  0.0640
     37        [36m1.3866[0m  0.0670
     38        [36m1.3864[0m  0.0630
    

     44        1.3864  0.0650
     45        1.3864  0.0640
     46        1.3864  0.0660
     47        1.3864  0.0750
     48        1.3864  0.0650
     49        1.3864  0.0670
     50        1.3864  0.0620
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5793[0m  0.0620
      2        [36m1.3866[0m  0.0680
      3        [36m1.3865[0m  0.0660
      4        [36m1.3864[0m  0.0690
      5        [36m1.3864[0m  0.0620
      6        [36m1.3864[0m  0.0750
      7        [36m1.3864[0m  0.0630
      8        1.3864  0.0620
      9        1.3864  0.0630
     10        1.3864  0.0660
     11        1.3864  0.0640
     12        1.3864  0.0630
     13        1.3864  0.0630
     14        1.3864  0.0680
     15        1.3864  0.0630
     16        1.3864  0.0620
     17        1.3864  0.0680
     18        1.3864  0.0630
     19        1.3864  0.0620
     20        1.3864  0.0750
     21        1.3864  0.0670
     22        1.3864  0.0620
     23

     42        [36m1.3876[0m  0.0660
     43        [36m1.3876[0m  0.0640
     44        [36m1.3876[0m  0.0620
     45        [36m1.3876[0m  0.0620
     46        [36m1.3876[0m  0.0680
     47        [36m1.3876[0m  0.0620
     48        [36m1.3876[0m  0.0660
     49        [36m1.3876[0m  0.0620
     50        [36m1.3876[0m  0.0630
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8275[0m  0.0710
      2       11.9589  0.0680
      3       11.9589  0.0650
      4       11.9589  0.0650
      5       11.9589  0.0650
      6       11.9589  0.0650
      7       11.9589  0.0700
      8       11.9589  0.0660
      9       11.9589  0.0650
     10       11.9589  0.0640
     11       11.9589  0.0660
     12       11.9589  0.0650
     13       11.9589  0.0650
     14       11.9589  0.0720
     15       11.9589  0.0720
     16       11.9589  0.0670
     17       11.9589  0.0660
     18       11.9589  0.0680
     19       11.9589  0.0700
     20   

     24        1.3876  0.0610
     25        1.3876  0.0620
     26        1.3876  0.0630
     27        1.3876  0.0620
     28        1.3876  0.0630
     29        1.3876  0.0630
     30        1.3876  0.0630
     31        1.3876  0.0660
     32        1.3876  0.0670
     33        1.3876  0.0660
     34        1.3876  0.0630
     35        1.3876  0.0620
     36        1.3876  0.0630
     37        1.3876  0.0620
     38        1.3876  0.0690
     39        1.3876  0.0630
     40        1.3876  0.0630
     41        1.3876  0.0630
     42        1.3876  0.0660
     43        1.3876  0.0630
     44        1.3876  0.0670
     45        1.3876  0.0630
     46        1.3876  0.0700
     47        1.3876  0.0620
     48        1.3876  0.0630
     49        1.3876  0.0620
     50        1.3876  0.0620
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7037[0m  0.0670
      2       11.9568  0.0670
      3       11.9568  0.0700
      4       11.9568  0.0700
 

     29        1.3877  0.0620
     30        1.3877  0.0620
     31        1.3877  0.0710
     32        1.3877  0.0660
     33        1.3877  0.0630
     34        1.3877  0.0620
     35        1.3877  0.0650
     36        1.3877  0.0630
     37        1.3877  0.0630
     38        1.3877  0.0630
     39        1.3877  0.0620
     40        1.3877  0.0620
     41        1.3877  0.0690
     42        1.3877  0.0620
     43        1.3877  0.0670
     44        1.3877  0.0620
     45        1.3877  0.0660
     46        1.3877  0.0620
     47        1.3877  0.0620
     48        1.3877  0.0660
     49        1.3877  0.0630
     50        1.3877  0.0630
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m9.5094[0m  0.0680
      2        [36m1.6466[0m  0.0650
      3        1.9328  0.0620
      4        [36m1.3916[0m  0.0680
      5        7.6436  0.0670
      6       11.9615  0.0650
      7       11.4448  0.0650
      8        7.5317  0.0640
      9      

     17        [36m1.3300[0m  0.0660
     18        [36m1.3194[0m  0.0630
     19        [36m1.3071[0m  0.0630
     20        [36m1.2931[0m  0.0650
     21        [36m1.2754[0m  0.0660
     22        [36m1.2574[0m  0.0650
     23        [36m1.2404[0m  0.0640
     24        [36m1.2229[0m  0.0690
     25        [36m1.2087[0m  0.0730
     26        [36m1.1969[0m  0.0670
     27        [36m1.1840[0m  0.0680
     28        [36m1.1722[0m  0.0630
     29        [36m1.1592[0m  0.0630
     30        [36m1.1411[0m  0.0720
     31        [36m1.1167[0m  0.0700
     32        [36m1.0990[0m  0.0670
     33        [36m1.0735[0m  0.0660
     34        [36m1.0133[0m  0.0640
     35        [36m0.9711[0m  0.0630
     36        0.9745  0.0700
     37        0.9770  0.0640
     38        [36m0.9621[0m  0.0630
     39        [36m0.9597[0m  0.0640
     40        0.9603  0.0640
     41        0.9682  0.0630
     42        0.9834  0.0630
     43        0.9702  0.0660
 

     29        [36m0.9214[0m  0.0670
     30        0.9223  0.0640
     31        0.9220  0.0640
     32        [36m0.9213[0m  0.0660
     33        [36m0.9194[0m  0.0670
     34        [36m0.9171[0m  0.0640
     35        [36m0.9162[0m  0.0640
     36        [36m0.9152[0m  0.0640
     37        [36m0.9140[0m  0.0630
     38        [36m0.9131[0m  0.0700
     39        [36m0.9121[0m  0.0630
     40        [36m0.9116[0m  0.0660
     41        [36m0.9115[0m  0.0680
     42        [36m0.9108[0m  0.0660
     43        0.9109  0.0630
     44        [36m0.9108[0m  0.0640
     45        [36m0.9098[0m  0.0640
     46        [36m0.9097[0m  0.0630
     47        [36m0.9094[0m  0.0680
     48        0.9098  0.0670
     49        0.9101  0.0670
     50        0.9115  0.0710
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4695[0m  0.0620
      2        [36m1.3961[0m  0.0670
      3        [36m1.3578[0m  0.0720
      4        [36

     45        [36m0.9886[0m  0.0640
     46        [36m0.9839[0m  0.0680
     47        [36m0.9839[0m  0.0640
     48        [36m0.9810[0m  0.0640
     49        [36m0.9801[0m  0.0680
     50        0.9804  0.0630
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m3.2029[0m  0.0630
      2        [36m1.3878[0m  0.0730
      3        [36m1.3872[0m  0.0630
      4        [36m1.3868[0m  0.0630
      5        [36m1.3862[0m  0.0630
      6        [36m1.3848[0m  0.0640
      7        [36m1.3755[0m  0.0640
      8        [36m1.3518[0m  0.0630
      9        [36m1.3289[0m  0.0630
     10        [36m1.3088[0m  0.0630
     11        [36m1.2855[0m  0.0640
     12        [36m1.2610[0m  0.0640
     13        [36m1.2353[0m  0.0650
     14        [36m1.2100[0m  0.0630
     15        [36m1.1894[0m  0.0660
     16        [36m1.1721[0m  0.0660
     17        [36m1.1595[0m  0.0680
     18        [36m1.1507[0m  0.0640
     19      

      3        [36m1.3531[0m  0.0660
      4        [36m1.3413[0m  0.0650
      5        [36m1.3298[0m  0.0630
      6        [36m1.3166[0m  0.0680
      7        [36m1.3003[0m  0.0630
      8        [36m1.2821[0m  0.0630
      9        [36m1.2565[0m  0.0630
     10        [36m1.2277[0m  0.0740
     11        [36m1.1997[0m  0.0630
     12        [36m1.1753[0m  0.0710
     13        [36m1.1560[0m  0.0700
     14        [36m1.1424[0m  0.0710
     15        [36m1.1319[0m  0.0640
     16        [36m1.1247[0m  0.0630
     17        [36m1.1187[0m  0.0640
     18        [36m1.1161[0m  0.0670
     19        [36m1.1094[0m  0.0640
     20        [36m1.1054[0m  0.0650
     21        [36m1.0991[0m  0.0640
     22        [36m1.0958[0m  0.0670
     23        [36m1.0913[0m  0.0720
     24        [36m1.0894[0m  0.0650
     25        [36m1.0864[0m  0.0640
     26        [36m1.0836[0m  0.0670
     27        [36m1.0811[0m  0.0680
     28        [36m1.079

     49       11.9568  0.0690
     50       11.9568  0.0730
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5185[0m  0.0650
      2        [36m1.3879[0m  0.0630
      3        [36m1.3847[0m  0.0720
      4        [36m1.3790[0m  0.0700
      5        1.3866  0.0650
      6        1.3864  0.0630
      7        1.3864  0.0630
      8        1.3863  0.0660
      9        1.3863  0.0650
     10        1.3863  0.0710
     11        1.3863  0.0670
     12        1.3863  0.0650
     13        1.3863  0.0640
     14        1.3863  0.0630
     15        1.3863  0.0640
     16        1.3863  0.0640
     17        1.3863  0.0640
     18        1.3863  0.0710
     19        1.3863  0.0640
     20        1.3863  0.0640
     21        1.3863  0.0630
     22        1.3863  0.0660
     23        1.3863  0.0630
     24        1.3863  0.0680
     25        1.3863  0.0640
     26        1.3863  0.0630
     27        1.3863  0.0640
     28        1.3863  0.0660
    

     48        1.3864  0.0670
     49        1.3864  0.0620
     50        1.3864  0.0630
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7293[0m  0.0660
      2        [36m1.3887[0m  0.0670
      3        [36m1.3868[0m  0.0640
      4        [36m1.3865[0m  0.0680
      5        [36m1.3864[0m  0.0660
      6        [36m1.3864[0m  0.0630
      7        [36m1.3864[0m  0.0670
      8        [36m1.3864[0m  0.0640
      9        [36m1.3864[0m  0.0740
     10        [36m1.3864[0m  0.0640
     11        [36m1.3864[0m  0.0680
     12        [36m1.3864[0m  0.0670
     13        1.3864  0.0670
     14        1.3864  0.0670
     15        [36m1.3864[0m  0.0690
     16        [36m1.3864[0m  0.0710
     17        1.3864  0.0700
     18        1.3864  0.0630
     19        1.3864  0.0640
     20        1.3864  0.0641
     21        1.3864  0.0630
     22        1.3864  0.0630
     23        1.3864  0.0640
     24        1.3864  0.0720
    

     46        1.3864  0.0630
     47        1.3864  0.0640
     48        1.3864  0.0675
     49        1.3864  0.0630
     50        1.3864  0.0630
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.4969[0m  0.0710
      2       11.9568  0.0670
      3       11.9568  0.0660
      4       11.9568  0.0630
      5        [36m7.0775[0m  0.0640
      6        [36m1.3871[0m  0.0640
      7        [36m1.3862[0m  0.0690
      8        [36m1.3858[0m  0.0670
      9        [36m1.3766[0m  0.0640
     10        [36m1.3186[0m  0.0640
     11        1.3990  0.0660
     12        1.3873  0.0740
     13        1.3864  0.0710
     14        1.3864  0.0700
     15        1.3864  0.0700
     16        1.3864  0.0630
     17        1.3864  0.0650
     18        1.3864  0.0630
     19        1.3864  0.0630
     20        1.3864  0.0630
     21        1.3864  0.0640
     22        1.3864  0.0640
     23        1.3864  0.0640
     24        1.3864  0.0650
     25

      2       11.9568  0.0680
      3       11.9568  0.0680
      4       11.9568  0.0740
      5       11.9568  0.0700
      6       11.9568  0.0690
      7       11.9568  0.0660
      8       11.9568  0.0670
      9       11.9568  0.0690
     10       11.9568  0.0660
     11       11.9568  0.0680
     12       11.9568  0.0670
     13       11.9568  0.0700
     14       11.9568  0.0690
     15       11.9568  0.0680
     16       11.9568  0.0660
     17       11.9568  0.0650
     18       11.9568  0.0680
     19       11.9568  0.0670
     20       11.9568  0.0670
     21       11.9568  0.0690
     22       11.9568  0.0730
     23       11.9568  0.0650
     24       11.9568  0.0740
     25       11.9568  0.0680
     26       11.9568  0.0670
     27       11.9568  0.0700
     28       11.9568  0.0720
     29       11.9568  0.0700
     30       11.9568  0.0680
     31       11.9568  0.0700
     32       11.9568  0.0720
     33       11.9568  0.0660
     34       11.9568  0.0760
     35   

      2       11.9568  0.0690
      3       11.9568  0.0670
      4       11.9568  0.0670
      5       11.9568  0.0670
      6       11.9568  0.0690
      7       11.9568  0.0660
      8       11.9568  0.0650
      9        [36m2.4767[0m  0.0720
     10        [36m1.3876[0m  0.0640
     11        1.3879  0.0640
     12        1.3878  0.0700
     13        1.3878  0.0670
     14        1.3878  0.0670
     15        1.3878  0.0670
     16        1.3878  0.0630
     17        1.3878  0.0670
     18        1.3878  0.0710
     19        1.3878  0.0660
     20        1.3878  0.0670
     21        1.3878  0.0690
     22        1.3878  0.0640
     23        1.3878  0.0640
     24        1.3878  0.0700
     25        1.3878  0.0650
     26        1.3878  0.0660
     27        1.3878  0.0630
     28        1.3878  0.0640
     29        1.3878  0.0630
     30        1.3878  0.0630
     31        1.3878  0.0670
     32        1.3878  0.0630
     33        1.3878  0.0640
     34        1.3878 

      6        1.5719  0.0640
      7        4.2616  0.0680
      8       11.8866  0.0660
      9       10.1336  0.0690
     10        9.5034  0.0670
     11       11.3057  0.0750
     12        9.6138  0.0690
     13        [36m1.3881[0m  0.0690
     14        1.4108  0.0630
     15        1.3884  0.0730
     16        1.3882  0.0700
     17        [36m1.3877[0m  0.0640
     18        1.3884  0.0670
     19        [36m1.3877[0m  0.0640
     20        1.3878  0.0630
     21        1.3878  0.0630
     22        1.3878  0.0640
     23        1.3878  0.0650
     24        1.3878  0.0630
     25        1.3878  0.0630
     26        1.3878  0.0650
     27        1.3878  0.0630
     28        1.3878  0.0630
     29        1.3878  0.0640
     30        1.3878  0.0670
     31        1.3878  0.0630
     32        1.3878  0.0700
     33        1.3878  0.0630
     34        1.3878  0.0640
     35        1.3878  0.0640
     36        1.3878  0.0630
     37        1.3878  0.0630
     38      

     25        [36m0.8729[0m  0.0680
     26        [36m0.8722[0m  0.0640
     27        [36m0.8679[0m  0.0640
     28        0.8691  0.0730
     29        0.8705  0.0640
     30        0.8705  0.0670
     31        0.8706  0.0720
     32        0.8706  0.0650
     33        0.8699  0.0690
     34        [36m0.8677[0m  0.0640
     35        [36m0.8652[0m  0.0680
     36        [36m0.8635[0m  0.0670
     37        0.8660  0.0650
     38        0.8699  0.0650
     39        0.8651  0.0710
     40        0.8676  0.0660
     41        0.8663  0.0640
     42        [36m0.8625[0m  0.0640
     43        [36m0.8594[0m  0.0660
     44        [36m0.8526[0m  0.0640
     45        0.8567  0.0640
     46        0.8542  0.0680
     47        [36m0.8494[0m  0.0670
     48        [36m0.8467[0m  0.0650
     49        0.8500  0.0700
     50        0.8467  0.0710
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6443[0m  0.0690
      2        [36m1.

     42        0.9921  0.0640
     43        [36m0.9908[0m  0.0690
     44        [36m0.9876[0m  0.0640
     45        [36m0.9807[0m  0.0650
     46        [36m0.9772[0m  0.0630
     47        [36m0.9755[0m  0.0640
     48        0.9803  0.0740
     49        0.9856  0.0780
     50        [36m0.9749[0m  0.0640
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.0996[0m  0.0640
      2        [36m1.2887[0m  0.0640
      3        [36m1.2120[0m  0.0640
      4        [36m1.0969[0m  0.0660
      5        [36m1.0204[0m  0.0650
      6        [36m0.9820[0m  0.0690
      7        [36m0.9745[0m  0.0640
      8        [36m0.9546[0m  0.0650
      9        [36m0.9479[0m  0.0650
     10        [36m0.9424[0m  0.0710
     11        [36m0.9368[0m  0.0650
     12        [36m0.9351[0m  0.0640
     13        0.9382  0.0650
     14        0.9452  0.0660
     15        0.9399  0.0670
     16        0.9429  0.0640
     17        0.9737  0.064

     16        [36m0.9664[0m  0.0640
     17        [36m0.9593[0m  0.0640
     18        [36m0.9563[0m  0.0650
     19        [36m0.9562[0m  0.0640
     20        [36m0.9519[0m  0.0710
     21        [36m0.9487[0m  0.0650
     22        [36m0.9480[0m  0.0640
     23        [36m0.9474[0m  0.0640
     24        [36m0.9456[0m  0.0650
     25        [36m0.9440[0m  0.0650
     26        0.9452  0.0650
     27        [36m0.9438[0m  0.0640
     28        [36m0.9418[0m  0.0670
     29        [36m0.9416[0m  0.0680
     30        0.9419  0.0700
     31        [36m0.9409[0m  0.0640
     32        [36m0.9406[0m  0.0640
     33        0.9421  0.0640
     34        0.9410  0.0640
     35        [36m0.9399[0m  0.0650
     36        0.9407  0.0640
     37        0.9401  0.0650
     38        0.9402  0.0670
     39        0.9402  0.0640
     40        0.9404  0.0680
     41        0.9400  0.0640
     42        [36m0.9398[0m  0.0640
     43        [36m0.9392[0m  0.064

     50       11.9568  0.0660
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m10.9464[0m  0.0660
      2       11.9568  0.0710
      3       11.9568  0.0670
      4       11.9568  0.0660
      5       11.9568  0.0710
      6       11.9568  0.0660
      7       11.9568  0.0670
      8       11.9568  0.0660
      9       11.9568  0.0670
     10       11.9568  0.0660
     11       11.9568  0.0710
     12       11.9568  0.0670
     13       11.9568  0.0680
     14       11.9568  0.0700
     15       11.9568  0.0730
     16       11.9568  0.0700
     17       11.9568  0.0690
     18       11.9568  0.0690
     19       11.9568  0.0700
     20       11.9568  0.0730
     21       11.9568  0.0670
     22       11.9568  0.0670
     23       11.9568  0.0730
     24       11.9568  0.0660
     25       11.9568  0.0670
     26       11.9568  0.0700
     27       11.9568  0.0700
     28       11.9568  0.0660
     29       11.9568  0.0660
     30       11.9568  0.0670
 

      6        [36m1.3864[0m  0.0680
      7        [36m1.3864[0m  0.0640
      8        [36m1.3864[0m  0.0640
      9        [36m1.3864[0m  0.0710
     10        [36m1.3864[0m  0.0740
     11        [36m1.3864[0m  0.0670
     12        [36m1.3864[0m  0.0630
     13        [36m1.3864[0m  0.0640
     14        [36m1.3864[0m  0.0640
     15        [36m1.3864[0m  0.0730
     16        [36m1.3863[0m  0.0640
     17        [36m1.3863[0m  0.0690
     18        [36m1.3863[0m  0.0660
     19        1.3863  0.0650
     20        1.3863  0.0670
     21        [36m1.3863[0m  0.0650
     22        [36m1.3863[0m  0.0700
     23        [36m1.3859[0m  0.0650
     24        [36m1.3809[0m  0.0670
     25        [36m1.3558[0m  0.0640
     26        [36m1.2871[0m  0.0640
     27        1.3880  0.0640
     28        1.3903  0.0650
     29        1.3866  0.0650
     30        1.3864  0.0700
     31        1.3864  0.0640
     32        1.3864  0.0657
     33        1.38

      2       11.9568  0.0680
      3       11.9568  0.0660
      4       11.9567  0.0640
      5        [36m2.5110[0m  0.0710
      6        [36m1.3865[0m  0.0680
      7        [36m1.3864[0m  0.0660
      8        [36m1.3864[0m  0.0640
      9        [36m1.3864[0m  0.0630
     10        1.3864  0.0710
     11        1.3864  0.0650
     12        1.3864  0.0670
     13        1.3864  0.0640
     14        1.3864  0.0700
     15        1.3864  0.0640
     16        1.3864  0.0680
     17        1.3864  0.0760
     18        1.3864  0.0710
     19        1.3864  0.0680
     20        1.3864  0.0710
     21        1.3864  0.0640
     22        1.3864  0.0630
     23        1.3864  0.0640
     24        1.3864  0.0690
     25        1.3864  0.0680
     26        1.3864  0.0680
     27        1.3864  0.0670
     28        1.3864  0.0640
     29        1.3864  0.0640
     30        1.3864  0.0640
     31        1.3864  0.0640
     32        1.3864  0.0720
     33        1.3864  0.

     11       11.9568  0.0670
     12       11.9568  0.0670
     13       11.9568  0.0700
     14       11.9568  0.0730
     15       11.9568  0.0670
     16       11.9568  0.0730
     17       11.9568  0.0660
     18       11.9568  0.0670
     19       11.9568  0.0710
     20       11.9568  0.0670
     21       11.9568  0.0670
     22       11.9568  0.0740
     23       11.9568  0.0710
     24       11.9568  0.0700
     25       11.9568  0.0670
     26       11.9568  0.0740
     27       11.9568  0.0670
     28       11.9568  0.0670
     29       11.9568  0.0700
     30       11.9568  0.0680
     31       11.9568  0.0700
     32       11.9568  0.0700
     33       11.9568  0.0670
     34       11.9568  0.0670
     35       11.9568  0.0730
     36       11.9568  0.0660
     37       11.9568  0.0680
     38       11.9568  0.0670
     39       11.9568  0.0670
     40       11.9568  0.0740
     41       11.9568  0.0670
     42       11.9568  0.0680
     43       11.9568  0.0670
     44   

     21        1.3875  0.0630
     22        1.3875  0.0640
     23        1.3875  0.0670
     24        1.3875  0.0630
     25        1.3875  0.0680
     26        1.3875  0.0640
     27        1.3875  0.0720
     28        1.3875  0.0680
     29        1.3875  0.0640
     30        1.3875  0.0650
     31        1.3875  0.0640
     32        1.3875  0.0650
     33        1.3875  0.0670
     34        1.3875  0.0640
     35        1.3875  0.0670
     36        1.3875  0.0640
     37        1.3875  0.0720
     38        1.3875  0.0650
     39        1.3875  0.0680
     40        1.3875  0.0670
     41        1.3875  0.0700
     42        1.3875  0.0640
     43        1.3875  0.0650
     44        1.3875  0.0630
     45        1.3875  0.0640
     46        1.3875  0.0640
     47        1.3875  0.0650
     48        1.3875  0.0680
     49        1.3875  0.0640
     50        1.3875  0.0630
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.6855[0m  0.0650
 

     21        1.3889  0.0700
     22        1.3876  0.0710
     23        1.3874  0.0760
     24        1.3875  0.0750
     25        1.3875  0.0750
     26        1.3875  0.0700
     27        1.3875  0.0820
     28        1.3875  0.0770
     29        1.3875  0.0680
     30        1.3875  0.0680
     31        1.3875  0.0740
     32        1.3875  0.0820
     33        1.3875  0.0700
     34        1.3875  0.0670
     35        1.3875  0.0710
     36        1.3875  0.0720
     37        1.3875  0.0810
     38        1.3875  0.0750
     39        1.3875  0.0750
     40        1.3875  0.0660
     41        1.3875  0.0690
     42        1.3875  0.0840
     43        1.3875  0.0690
     44        1.3875  0.0740
     45        1.3875  0.0690
     46        1.3875  0.0680
     47        1.3875  0.0720
     48        1.3875  0.0730
     49        1.3875  0.0730
     50        1.3875  0.0860
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7731[0m  0.0710
 

     10        [36m0.9396[0m  0.0760
     11        0.9470  0.0730
     12        [36m0.9312[0m  0.0700
     13        [36m0.9285[0m  0.0750
     14        0.9294  0.0670
     15        [36m0.9227[0m  0.0670
     16        [36m0.9185[0m  0.0770
     17        [36m0.9179[0m  0.0660
     18        0.9198  0.0660
     19        0.9208  0.0690
     20        0.9233  0.0770
     21        0.9218  0.0750
     22        [36m0.9146[0m  0.0740
     23        [36m0.9080[0m  0.0670
     24        [36m0.9079[0m  0.0740
     25        [36m0.9046[0m  0.0690
     26        [36m0.9020[0m  0.0690
     27        [36m0.9009[0m  0.0750
     28        [36m0.8994[0m  0.0760
     29        [36m0.8973[0m  0.0720
     30        [36m0.8957[0m  0.0690
     31        [36m0.8948[0m  0.0710
     32        [36m0.8928[0m  0.0760
     33        [36m0.8917[0m  0.0660
     34        [36m0.8913[0m  0.0900
     35        [36m0.8885[0m  0.0690
     36        [36m0.8884[0m  0.0700
 

     27        [36m1.0290[0m  0.0710
     28        [36m1.0248[0m  0.0660
     29        [36m1.0229[0m  0.0720
     30        [36m1.0187[0m  0.0670
     31        [36m1.0164[0m  0.0670
     32        [36m1.0116[0m  0.0670
     33        [36m1.0067[0m  0.0700
     34        [36m1.0043[0m  0.0770
     35        [36m0.9986[0m  0.0690
     36        0.9992  0.0800
     37        1.0003  0.0720
     38        [36m0.9966[0m  0.0670
     39        [36m0.9960[0m  0.0660
     40        [36m0.9942[0m  0.0880
     41        [36m0.9910[0m  0.0680
     42        [36m0.9891[0m  0.0730
     43        [36m0.9868[0m  0.0780
     44        [36m0.9845[0m  0.0660
     45        0.9859  0.0720
     46        0.9854  0.0670
     47        [36m0.9800[0m  0.0710
     48        [36m0.9734[0m  0.0740
     49        [36m0.9687[0m  0.0700
     50        [36m0.9674[0m  0.0670
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m10.9070[0m  0.0690
 

     43        [36m0.9280[0m  0.0690
     44        0.9294  0.0710
     45        0.9282  0.0790
     46        0.9293  0.0700
     47        0.9285  0.0750
     48        0.9282  0.0740
     49        0.9285  0.0670
     50        0.9284  0.0660
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.9775[0m  0.0690
      2        [36m1.3229[0m  0.0730
      3        [36m1.2864[0m  0.0700
      4        [36m1.2509[0m  0.0670
      5        [36m1.2174[0m  0.0730
      6        [36m1.1750[0m  0.0710
      7        [36m1.0923[0m  0.0710
      8        [36m1.0399[0m  0.0730
      9        [36m1.0223[0m  0.0770
     10        [36m0.9876[0m  0.0740
     11        [36m0.9825[0m  0.0720
     12        [36m0.9748[0m  0.0710
     13        [36m0.9668[0m  0.0740
     14        [36m0.9589[0m  0.0740
     15        [36m0.9529[0m  0.0740
     16        [36m0.9512[0m  0.0700
     17        [36m0.9472[0m  0.0660
     18        [36m0.9409[

     12        [36m1.3864[0m  0.0820
     13        [36m1.3864[0m  0.0730
     14        [36m1.3864[0m  0.0830
     15        1.3864  0.0700
     16        1.3864  0.0730
     17        1.3864  0.0770
     18        1.3864  0.1080
     19        1.3864  0.0810
     20        1.3864  0.0760
     21        1.3864  0.0760
     22        1.3864  0.1010
     23        1.3864  0.0820
     24        1.3864  0.0770
     25        1.3864  0.0740
     26        1.3864  0.0720
     27        1.3864  0.0820
     28        1.3864  0.0790
     29        1.3864  0.0790
     30        1.3864  0.0710
     31        1.3864  0.0710
     32        1.3864  0.0760
     33        1.3864  0.0810
     34        1.3864  0.0970
     35        1.3864  0.0780
     36        1.3864  0.0740
     37        1.3864  0.0860
     38        1.3864  0.0680
     39        1.3864  0.0680
     40        1.3864  0.0700
     41        1.3864  0.0760
     42        1.3864  0.0790
     43        1.3864  0.0760
     44      

     12       11.9589  0.0690
     13       11.9589  0.0720
     14       11.9589  0.0700
     15       11.9589  0.0790
     16       11.9589  0.0740
     17       11.9589  0.0760
     18       11.9589  0.0760
     19       11.9589  0.0770
     20       11.9589  0.0830
     21       11.9589  0.0700
     22       11.9589  0.0730
     23       11.9589  0.0700
     24       11.9589  0.0710
     25       11.9589  0.0700
     26       11.9589  0.0740
     27       11.9589  0.0710
     28       11.9589  0.0710
     29       11.9589  0.0750
     30       11.9589  0.0740
     31       11.9589  0.0690
     32       11.9589  0.0780
     33       11.9589  0.0790
     34       11.9589  0.0740
     35       11.9589  0.0700
     36       11.9589  0.0760
     37       11.9589  0.0690
     38       11.9589  0.0920
     39       11.9589  0.0830
     40       11.9589  0.0790
     41       11.9589  0.0800
     42       11.9589  0.0730
     43       11.9589  0.0730
     44       11.9589  0.0740
     45   

     16        [36m1.3864[0m  0.0730
     17        1.3864  0.0720
     18        [36m1.3864[0m  0.0730
     19        1.3864  0.0660
     20        [36m1.3864[0m  0.0710
     21        1.3864  0.0750
     22        1.3864  0.0970
     23        1.3864  0.0880
     24        1.3864  0.0820
     25        [36m1.3864[0m  0.0790
     26        1.3864  0.0810
     27        1.3864  0.0770
     28        1.3864  0.0700
     29        1.3864  0.0700
     30        1.3864  0.0750
     31        1.3864  0.0730
     32        1.3864  0.0800
     33        1.3864  0.0780
     34        1.3864  0.0760
     35        1.3864  0.0720
     36        1.3864  0.0800
     37        1.3864  0.0750
     38        1.3864  0.0740
     39        1.3864  0.0790
     40        1.3864  0.0770
     41        1.3864  0.0710
     42        1.3864  0.0730
     43        1.3864  0.0770
     44        1.3864  0.0780
     45        1.3864  0.0740
     46        1.3864  0.0780
     47        1.3864  0.0700
    

     18       11.9568  0.0720
     19       11.9568  0.0730
     20       11.9568  0.0690
     21       11.9568  0.0730
     22       11.9568  0.0710
     23       11.9568  0.0710
     24       11.9568  0.0710
     25       11.9568  0.0790
     26       11.9568  0.0740
     27       11.9568  0.0890
     28       11.9568  0.0720
     29       11.9568  0.0750
     30       11.9568  0.0740
     31       11.9568  0.0690
     32       11.9568  0.0720
     33       11.9568  0.0760
     34       11.9568  0.0710
     35       11.9568  0.0770
     36       11.9568  0.0750
     37       11.9568  0.0730
     38       11.9568  0.0730
     39       11.9568  0.0900
     40       11.9568  0.0780
     41       11.9568  0.0780
     42       11.9568  0.0830
     43       11.9568  0.0830
     44       11.9568  0.0710
     45       11.9568  0.0740
     46       11.9568  0.0760
     47       11.9568  0.0820
     48       11.9568  0.0780
     49       11.9568  0.0690
     50       11.9568  0.0750
  epoch   

     15        1.3880  0.0740
     16        1.3880  0.0700
     17        1.3880  0.0680
     18        1.3880  0.0690
     19        1.3880  0.0750
     20        1.3880  0.0700
     21        1.3880  0.0670
     22        1.3880  0.0790
     23        1.3880  0.0750
     24        1.3880  0.0730
     25        1.3880  0.0760
     26        1.3880  0.0670
     27        1.3880  0.0680
     28        1.3880  0.0720
     29        1.3880  0.0790
     30        1.3880  0.0690
     31        1.3880  0.0670
     32        1.3880  0.0660
     33        1.3880  0.0730
     34        1.3880  0.0670
     35        1.3880  0.0910
     36        1.3880  0.0820
     37        1.3880  0.0760
     38        1.3880  0.0740
     39        1.3880  0.0730
     40        1.3880  0.0730
     41        1.3880  0.0700
     42        1.3880  0.0680
     43        1.3880  0.0860
     44        1.3880  0.0760
     45        1.3880  0.0670
     46        1.3880  0.0700
     47        1.3880  0.0670
     48   

     19        [36m1.3889[0m  0.0710
     20        [36m1.3883[0m  0.0660
     21        [36m1.3880[0m  0.0720
     22        1.3880  0.0740
     23        1.3880  0.0710
     24        1.3880  0.0700
     25        1.3880  0.0700
     26        1.3880  0.0720
     27        1.3880  0.0730
     28        1.3880  0.0840
     29        1.3880  0.0730
     30        1.3880  0.0690
     31        1.3880  0.0690
     32        1.3880  0.0670
     33        1.3880  0.0750
     34        1.3880  0.0720
     35        1.3880  0.0740
     36        1.3880  0.0720
     37        1.3880  0.0680
     38        1.3880  0.0740
     39        1.3880  0.0680
     40        1.3880  0.0660
     41        1.3880  0.0870
     42        1.3880  0.0760
     43        1.3880  0.0790
     44        1.3880  0.0800
     45        1.3880  0.0780
     46        1.3880  0.0770
     47        1.3880  0.0730
     48        1.3880  0.0700
     49        1.3880  0.0770
     50        1.3880  0.0750
  epoch    tr

In [12]:
from skorch.callbacks import EarlyStopping

In [13]:
net_final = NeuralNetClassifier(
    MLP_network,
    optimizer=torch.optim.SGD,
    optimizer__momentum=0.9, # momentum set to commonly used value to save CPU time
    batch_size=128, 
    max_epochs=50, 
    module__hidden_dim=20,
    optimizer__lr=0.001,
    optimizer__weight_decay=0.01
)

In [14]:
net_final.fit(X_train, y_train)

  epoch    train_loss    valid_acc    valid_loss     dur
-------  ------------  -----------  ------------  ------
      1        [36m2.2165[0m       [32m0.2768[0m        [35m1.3603[0m  0.1090
      2        [36m1.3335[0m       [32m0.3797[0m        [35m1.3036[0m  0.1050
      3        [36m1.2100[0m       [32m0.4912[0m        [35m1.1024[0m  0.1160
      4        [36m1.0894[0m       [32m0.5499[0m        [35m0.9972[0m  0.1160
      5        [36m0.9912[0m       [32m0.5717[0m        [35m0.9339[0m  0.1180
      6        [36m0.9732[0m       0.5595        [35m0.9309[0m  0.1100
      7        [36m0.9538[0m       [32m0.5840[0m        [35m0.9117[0m  0.1130
      8        [36m0.9421[0m       [32m0.5915[0m        [35m0.8982[0m  0.1040
      9        [36m0.9337[0m       [32m0.5947[0m        [35m0.8940[0m  0.1090
     10        [36m0.9290[0m       [32m0.5963[0m        [35m0.8908[0m  0.1050
     11        [36m0.9269[0m       0.5877        [35

<class 'skorch.classifier.NeuralNetClassifier'>[initialized](
  module_=MLP_network(
    (hidden1): Linear(in_features=11, out_features=20, bias=True)
    (hidden2): Linear(in_features=20, out_features=20, bias=True)
    (output): Linear(in_features=20, out_features=4, bias=True)
  ),
)

In [15]:
net_final.score(X_test, y_test)

0.606769537083126