In [1]:
import pandas as pd
from sklearn.model_selection import train_test_split, StratifiedKFold
import numpy as np
import matplotlib.pyplot as plt
import torch
import torch.nn as nn
import torch.nn.functional as F

# Stratified Train Test Split

In [2]:
# Importing pre-processed dataset
body_performance_df = pd.read_csv('processed_body_performance.csv')

In [3]:
output_dim = body_performance_df['class'].nunique()

In [4]:
# Acquiring target values and attributes
y = body_performance_df['class'].values
y = np.longlong(y)
X = body_performance_df.drop(columns=['class']).values
X = np.float32(X)
input_dim = X.shape[1] # NN input dimension = number of attributes

In [5]:
# Performing stratified train test split where test set is 30% of dataset
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42, shuffle=True, stratify=y)

# Stratified K-fold Validation Split

In [6]:
# Defining a stratified 5-fold object to be used for cross-validation
# strat_k_fold = StratifiedKFold(n_splits=5, random_state=42, shuffle=True)

# Multi-Layered Perceptron (MLP)

In [7]:
class MLP_network(nn.Module):
    def __init__(self, input_dim=input_dim, hidden_dim=10, output_dim=output_dim):
        super(MLP_network, self).__init__()
        self.hidden1 = nn.Linear(input_dim, hidden_dim, bias=True)
        self.hidden2 = nn.Linear(hidden_dim, hidden_dim, bias=True)
        self.output = nn.Linear(hidden_dim, output_dim, bias=True)

    def forward(self, X):
        X = F.relu(self.hidden1(X))
        X = F.relu(self.hidden2(X))
        X = F.softmax(self.output(X), dim=-1) # sigmoid activation function is applied in loss function
        return X

In [8]:
class MLP_network(nn.Module):
    def __init__(self, input_dim=input_dim, hidden_dim=10, output_dim=output_dim, extra_hidden_layers=0):
        super().__init__()
        layers = []
        layers.append(nn.Linear(input_dim, hidden_dim, bias=True))
        layers.append(nn.ReLU())
        for i in range(extra_hidden_layers):
            layers.append(nn.Linear(hidden_dim, hidden_dim, bias=True))
            layers.append(nn.ReLU())
        layers.append(nn.Linear(hidden_dim, output_dim, bias=True))
        self.output = nn.Sequential(*layers)

    def forward(self, X):
        return F.softmax(self.output(X), dim=-1)

# Hyperparameter Tuning with Optuna

In [8]:
from skorch.classifier import NeuralNetClassifier
from skorch.callbacks import EarlyStopping
import optuna
from optuna.integration import SkorchPruningCallback
from sklearn.metrics import accuracy_score

In [9]:
#early_stopping = EarlyStopping(monitor='valid_acc', patience=10)

In [10]:
def objective(trial):
    
    hidden_dim = trial.suggest_int('hidden_dim', 4, input_dim*2)
    #extra_hidden_layers = trial.suggest_int('extra_hidden_layers', 0, 5)
    batch_size = trial.suggest_categorical('batch_size', [64, 128, 256, 512])
    learning_rate = trial.suggest_float('learning_rate', 0.0001, 0.1)
    weight_decay = trial.suggest_float('weight_decay', 0.0001, 0.1)
    smote_ratio = trial.suggest_float('smote_ratio', 0.6, 1.)
    max_epochs = trial.suggest_int('max_epochs', 50, 200, 10)

    
    torch.manual_seed(0)
    net = NeuralNetClassifier(
        MLP_network(),
        module__hidden_dim=hidden_dim,
        train_split=None,
        #module__extra_hidden_layers=extra_hidden_layers,
        optimizer=torch.optim.SGD,
        optimizer__momentum=0.9, # momentum set to commonly used value to save CPU time
        optimizer__lr=learning_rate,
        optimizer__weight_decay=weight_decay,
        max_epochs=max_epochs,
        batch_size=batch_size,
        callbacks=[SkorchPruningCallback(trial, 'valid_acc')],
    )
    
    
    net.fit(X_train, y_train)
    y_pred = net.predict(X_test)
    return accuracy_score(y_test, y_pred)

In [None]:
pruner = optuna.pruners.MedianPruner(n_warmup_steps=30)
study = optuna.study.create_study(direction="maximize", pruner=pruner)
study.optimize(objective, n_trials=300)

[32m[I 2022-04-30 11:35:41,247][0m A new study created in memory with name: no-name-53ac1560-e486-4e34-bab6-c40010097ec9[0m


  epoch    train_loss    valid_acc    valid_loss     dur
-------  ------------  -----------  ------------  ------
      1       [36m11.6588[0m       [32m0.2501[0m       [35m11.9547[0m  0.0900
      2       11.9568       0.2501       11.9547  0.0920
      3       11.9172       0.2501       11.9547  0.0860
      4        [36m8.9789[0m       0.2501        [35m1.3869[0m  0.0910
      5        [36m1.3868[0m       0.2496        [35m1.3863[0m  0.0890
      6        [36m1.3866[0m       0.2496        1.3864  0.0870
      7        1.3866       0.2496        1.3863  0.0900
      8        1.3866       0.2496        1.3863  0.0930
      9        1.3866       0.2496        1.3863  0.0870
     10        1.3866       0.2496        1.3863  0.0880
     11        1.3866       0.2496        1.3863  0.0860
     12        1.3866       0.2496        1.3863  0.0880
     13        1.3866       0.2496        1.3863  0.0970
     14        1.3866       0.2496        1.3863  0.0870
     15        1

[32m[I 2022-04-30 11:35:54,123][0m Trial 0 finished with value: 0.2501244400199104 and parameters: {'hidden_dim': 15, 'batch_size': 256, 'learning_rate': 0.026977383114897155, 'weight_decay': 0.058610552540905636, 'smote_ratio': 0.6027945619856522, 'max_epochs': 140}. Best is trial 0 with value: 0.2501244400199104.[0m


  epoch    train_loss    valid_acc    valid_loss     dur
-------  ------------  -----------  ------------  ------
      1        [36m6.0197[0m       [32m0.2496[0m        [35m1.3888[0m  0.1550
      2        [36m1.3895[0m       0.2496        [35m1.3866[0m  0.1510
      3        [36m1.3890[0m       0.2496        1.3866  0.1430
      4        1.3890       0.2496        1.3866  0.1460
      5        1.3890       0.2496        1.3866  0.1515
      6        1.3890       0.2496        1.3866  0.1570
      7        1.3890       0.2496        1.3866  0.1520
      8        1.3890       0.2496        1.3866  0.1550
      9        1.3890       0.2496        1.3866  0.1440
     10        1.3890       0.2496        1.3866  0.1520
     11        1.3890       0.2496        1.3866  0.1470
     12        1.3890       0.2496        1.3866  0.1540
     13        1.3890       0.2496        1.3866  0.1530
     14        1.3890       0.2496        1.3866  0.1595
     15        1.3890       0.2496

[32m[I 2022-04-30 11:36:02,818][0m Trial 1 finished with value: 0.2501244400199104 and parameters: {'hidden_dim': 16, 'batch_size': 64, 'learning_rate': 0.08664193966304405, 'weight_decay': 0.06930987898608797, 'smote_ratio': 0.7458973739748833, 'max_epochs': 130}. Best is trial 0 with value: 0.2501244400199104.[0m


  epoch    train_loss    valid_acc    valid_loss     dur
-------  ------------  -----------  ------------  ------
      1       [36m11.6936[0m       [32m0.2501[0m       [35m11.9547[0m  0.0870
      2       11.9568       0.2501       11.9547  0.0800
      3       11.9568       0.2501       11.9547  0.0820
      4       11.9568       0.2501       11.9547  0.0830
      5       11.9568       0.2501       11.9547  0.0820
      6       11.9568       0.2501       11.9547  0.0830
      7       11.9568       0.2501       11.9547  0.0820
      8       11.9568       0.2501       11.9547  0.0780
      9       11.9568       0.2501       11.9547  0.0870
     10       11.9568       0.2501       11.9547  0.0780
     11       11.9568       0.2501       11.9547  0.0813
     12       11.9568       0.2501       11.9547  0.0800
     13       11.9568       0.2501       11.9547  0.0830
     14       11.9568       0.2501       11.9547  0.0820
     15       11.9568       0.2501       11.9547  0.0790
    

[32m[I 2022-04-30 11:36:04,238][0m Trial 2 finished with value: 0.2498755599800896 and parameters: {'hidden_dim': 11, 'batch_size': 512, 'learning_rate': 0.09808813713267503, 'weight_decay': 0.007681778528494296, 'smote_ratio': 0.7754074765385539, 'max_epochs': 140}. Best is trial 0 with value: 0.2501244400199104.[0m


  epoch    train_loss    valid_acc    valid_loss     dur
-------  ------------  -----------  ------------  ------
      1       [36m11.6209[0m       [32m0.2496[0m       [35m11.9632[0m  0.0820
      2       11.9547       0.2496       11.9632  0.0810
      3       11.9742       [32m0.2501[0m       [35m11.9547[0m  0.0809
      4       [36m11.2228[0m       0.2501       11.9547  0.0780
      5       11.9525       0.2501       11.9547  0.0783
      6       11.9589       0.2501       [35m11.9546[0m  0.0810
      7        [36m3.5966[0m       0.2501        [35m1.3926[0m  0.0751
      8        [36m1.3946[0m       0.2304        [35m1.3873[0m  0.0822
      9        [36m1.3871[0m       0.2496        [35m1.3865[0m  0.0760
     10        [36m1.3867[0m       0.2501        1.3898  0.0800
     11        1.4908       0.2501        1.4095  0.0810
     12        1.3952       0.2501        1.3884  0.0790
     13        1.3884       0.2501        [35m1.3863[0m  0.0740
     14   

[32m[I 2022-04-30 11:36:09,895][0m Trial 3 finished with value: 0.2501244400199104 and parameters: {'hidden_dim': 14, 'batch_size': 512, 'learning_rate': 0.09159185943162457, 'weight_decay': 0.06292361583240942, 'smote_ratio': 0.721248756496714, 'max_epochs': 70}. Best is trial 0 with value: 0.2501244400199104.[0m


  epoch    train_loss    valid_acc    valid_loss     dur
-------  ------------  -----------  ------------  ------
      1       [36m11.5004[0m       [32m0.2501[0m       [35m11.9547[0m  0.0920


[32m[I 2022-04-30 11:36:10,134][0m Trial 4 finished with value: 0.2501244400199104 and parameters: {'hidden_dim': 13, 'batch_size': 256, 'learning_rate': 0.0438168347712547, 'weight_decay': 0.07422939373671196, 'smote_ratio': 0.6906991494390793, 'max_epochs': 110}. Best is trial 0 with value: 0.2501244400199104.[0m


  epoch    train_loss    valid_acc    valid_loss     dur
-------  ------------  -----------  ------------  ------
      1       [36m11.8604[0m       [32m0.2501[0m       [35m11.9547[0m  0.0830
      2       11.9568       0.2501       11.9547  0.0830
      3       11.9568       0.2501       11.9547  0.0830
      4        [36m6.3555[0m       0.2496        [35m1.4339[0m  0.0760
      5        [36m1.3930[0m       0.2501        [35m1.3864[0m  0.0770
      6        [36m1.3863[0m       0.2496        1.3864  0.0800
      7        1.3866       0.2496        [35m1.3863[0m  0.0830
      8        1.3866       [32m0.2555[0m        [35m1.3829[0m  0.0840
      9        [36m1.3736[0m       0.2501        1.3954  0.0870
     10        1.3915       0.2496        1.3871  0.0790
     11        1.3878       0.2501        1.3866  0.0830
     12        1.3864       0.2501        1.3865  0.0850
     13        1.3866       0.2496        1.3863  0.0810
     14        1.3866       0.2496   

In [None]:
fig = optuna.visualization.plot_intermediate_values(study)
fig.show()

# Hyperparameter Grid Search

In [9]:
from skorch.classifier import NeuralNetClassifier
from sklearn.model_selection import GridSearchCV

In [10]:
torch.manual_seed(0)

net = NeuralNetClassifier(
    MLP_network,
    train_split=None,
    optimizer=torch.optim.SGD,
    optimizer__momentum=0.9 # momentum set to commonly used value to save CPU time
)

In [11]:
parameters = {
    'max_epochs': [10, 20, 30, 40, 50],
    'batch_size': [64, 128, 256], # batch-sizes are powers of 2
    'optimizer__lr': [0.001, 0.01, 0.1], # common values for learning rate
    'optimizer__weight_decay': [0.001, 0.01, 0.1], # common values for weight-decay factor
    'module__hidden_dim': [5, 10, 15, 20] # range of values less than twice the input dimension
}
gs = GridSearchCV(net, parameters, refit=False, cv=5, scoring='accuracy')
gs.fit(X_train, y_train)
print('Best-performing parameters:', gs.best_params_)
print('5-fold CV score:', gs.best_score_)

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.9336[0m  0.1260
      2        [36m1.4029[0m  0.1150
      3        [36m1.3951[0m  0.1160
      4        [36m1.3909[0m  0.1210
      5        [36m1.3888[0m  0.1170
      6        [36m1.3876[0m  0.1140
      7        [36m1.3870[0m  0.1170
      8        [36m1.3867[0m  0.1210
      9        [36m1.3866[0m  0.1240
     10        [36m1.3865[0m  0.1240
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6422[0m  0.1200
      2        [36m1.3916[0m  0.1260
      3        [36m1.3882[0m  0.1190
      4        [36m1.3870[0m  0.1260
      5        [36m1.3866[0m  0.1223
      6        [36m1.3865[0m  0.1250
      7        [36m1.3864[0m  0.1195
      8        [36m1.3864[0m  0.1155
      9        [36m1.3864[0m  0.1200
     10        [36m1.3864[0m  0.1180
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.9784[0m  0.1160
 

      6       11.9568  0.1300
      7       11.9568  0.1190
      8       11.9568  0.1230
      9       11.9568  0.1280
     10       11.9568  0.1240
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4684[0m  0.1170
      2        [36m1.3870[0m  0.1210
      3        [36m1.3870[0m  0.1250
      4        [36m1.3870[0m  0.1220
      5        [36m1.3870[0m  0.1220
      6        [36m1.3870[0m  0.1200
      7        [36m1.3870[0m  0.1210
      8        [36m1.3870[0m  0.1160
      9        [36m1.3870[0m  0.1220
     10        [36m1.3870[0m  0.1230
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4059[0m  0.1160
      2        [36m1.3869[0m  0.1240
      3        1.3869  0.1180
      4        1.3869  0.1200
      5        1.3869  0.1170
      6        1.3869  0.1260
      7        1.3869  0.1160
      8        1.3869  0.1240
      9        1.3869  0.1170
     10        1.3869  0.1200
  epoch    train_loss 

      6        1.3920  0.1200
      7        1.3920  0.1230
      8        1.3920  0.1180
      9        1.3920  0.1240
     10        1.3920  0.1170
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.3978[0m  0.1240
      2        [36m1.3895[0m  0.1190
      3        [36m1.3894[0m  0.1240
      4        [36m1.3894[0m  0.1210
      5        1.3894  0.1315
      6        1.3894  0.1240
      7        1.3894  0.1170
      8        1.3894  0.1230
      9        [36m1.3894[0m  0.1270
     10        1.3894  0.1190
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m4.6504[0m  0.1290
      2        [36m1.4148[0m  0.1240
      3        [36m1.3910[0m  0.1200
      4        1.3913  0.1240
      5        1.3913  0.1240
      6        1.3913  0.1200
      7        1.3913  0.1250
      8        1.3913  0.1180
      9        1.3913  0.1200
     10        1.3913  0.1200
  epoch    train_loss     dur
-------  ------------  -----

      8        [36m1.1433[0m  0.1460
      9        [36m1.1384[0m  0.1270
     10        [36m1.1325[0m  0.1300
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4584[0m  0.1280
      2        [36m1.3787[0m  0.1250
      3        [36m1.3706[0m  0.1270
      4        [36m1.3571[0m  0.1170
      5        [36m1.1746[0m  0.1240
      6        [36m1.0437[0m  0.1250
      7        [36m1.0246[0m  0.1260
      8        [36m1.0004[0m  0.1240
      9        [36m0.9817[0m  0.1210
     10        [36m0.9706[0m  0.1270
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.3976[0m  0.1270
      2        [36m1.3868[0m  0.1310
      3        1.3869  0.1250
      4        1.3869  0.1170
      5        1.3869  0.1360
      6        1.3869  0.1330
      7        1.3869  0.1230
      8        1.3869  0.1200
      9        1.3869  0.1310
     10        1.3869  0.1210
  epoch    train_loss     dur
-------  ------------  --

      5       11.9568  0.1310
      6       11.9568  0.1300
      7       11.9568  0.1200
      8       11.9568  0.1330
      9       11.9568  0.1300
     10       11.9568  0.1320
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9072[0m  0.1280
      2        [36m5.7438[0m  0.1290
      3        [36m1.3899[0m  0.1210
      4        1.3900  0.1200
      5        1.3900  0.1240
      6        1.3900  0.1250
      7        1.3900  0.1190
      8        1.3900  0.1230
      9        1.3900  0.1150
     10        1.3900  0.1210
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9382[0m  0.1190
      2       11.9568  0.1240
      3        [36m9.3312[0m  0.1190
      4        [36m1.3920[0m  0.1350
      5        [36m1.3913[0m  0.1300
      6        [36m1.3913[0m  0.1180
      7        1.3913  0.1200
      8        1.3913  0.1220
      9        1.3913  0.1240
     10        1.3913  0.1240
  epoch    train_loss     du

      2        [36m1.0389[0m  0.1280
      3        [36m0.9888[0m  0.1200
      4        [36m0.9750[0m  0.1190
      5        [36m0.9651[0m  0.1210
      6        0.9710  0.1210
      7        [36m0.9515[0m  0.1220
      8        [36m0.9359[0m  0.1160
      9        [36m0.9317[0m  0.1230
     10        [36m0.9273[0m  0.1190
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.8054[0m  0.1150
      2        [36m1.2627[0m  0.1270
      3        [36m1.1049[0m  0.1190
      4        [36m1.0535[0m  0.1190
      5        [36m1.0195[0m  0.1280
      6        [36m0.9960[0m  0.1200
      7        0.9974  0.1200
      8        [36m0.9842[0m  0.1240
      9        [36m0.9830[0m  0.1250
     10        0.9859  0.1200
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4539[0m  0.1280
      2        [36m1.1255[0m  0.1340
      3        [36m1.0867[0m  0.1290
      4        [36m1.0528[0m  0.1320
      5   

      5        1.3868  0.1270
      6        1.3868  0.1220
      7        1.3868  0.1190
      8        1.3868  0.1229
      9        1.3868  0.1250
     10        1.3868  0.1220
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9272[0m  0.1360
      2       11.9568  0.1319
      3       11.9568  0.1380
      4       11.9568  0.1322
      5       11.9568  0.1310
      6       11.9568  0.1279
      7       11.9568  0.1310
      8       11.9568  0.1270
      9       11.9568  0.1300
     10       11.9568  0.1310
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8967[0m  0.1400
      2       11.9547  0.1252
      3       11.9547  0.1360
      4       11.9547  0.1342
      5       11.9547  0.1361
      6       11.9547  0.1320
      7       11.9547  0.1308
      8       11.9547  0.1280
      9       11.9547  0.1260
     10       11.9547  0.1530
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.

      2        [36m1.1112[0m  0.1240
      3        [36m1.0452[0m  0.1270
      4        [36m0.9979[0m  0.1220
      5        [36m0.9715[0m  0.1210
      6        [36m0.9556[0m  0.1270
      7        [36m0.9494[0m  0.1320
      8        [36m0.9422[0m  0.1340
      9        [36m0.9360[0m  0.1210
     10        [36m0.9297[0m  0.1180
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.6284[0m  0.1240
      2        [36m1.2636[0m  0.1240
      3        [36m1.1148[0m  0.1240
      4        [36m1.1113[0m  0.1280
      5        [36m1.0042[0m  0.1290
      6        [36m0.9991[0m  0.1170
      7        [36m0.9889[0m  0.1170
      8        [36m0.9719[0m  0.1200
      9        [36m0.9508[0m  0.1160
     10        [36m0.9445[0m  0.1300
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4230[0m  0.1220
      2        [36m1.0832[0m  0.1230
      3        [36m1.0205[0m  0.1250
      4        [36m0.

      2        [36m1.3867[0m  0.1240
      3        1.3868  0.1280
      4        1.3868  0.1260
      5        1.3868  0.1230
      6        1.3868  0.1230
      7        1.3868  0.1180
      8        1.3868  0.1170
      9        1.3868  0.1250
     10        1.3868  0.1310
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7379[0m  0.1270
      2        [36m1.3868[0m  0.1210
      3        [36m1.3868[0m  0.1240
      4        1.3868  0.1230
      5        1.3868  0.1250
      6        1.3868  0.1270
      7        1.3868  0.1210
      8        1.3868  0.1250
      9        1.3868  0.1200
     10        1.3868  0.1210
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8933[0m  0.1210
      2        [36m9.5577[0m  0.1240
      3        [36m1.3867[0m  0.1290
      4        1.3868  0.1190
      5        1.3868  0.1190
      6        1.3868  0.1240
      7        1.3868  0.1190
      8        1.3868  0.1230
      9

     13        [36m1.0402[0m  0.1162
     14        [36m1.0397[0m  0.1182
     15        [36m1.0276[0m  0.1132
     16        [36m1.0195[0m  0.1150
     17        [36m1.0195[0m  0.1230
     18        [36m1.0142[0m  0.1220
     19        [36m1.0088[0m  0.1230
     20        [36m1.0013[0m  0.1160
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.8387[0m  0.1210
      2        [36m1.3931[0m  0.1170
      3        [36m1.3892[0m  0.1145
      4        [36m1.3876[0m  0.1190
      5        [36m1.3869[0m  0.1206
      6        [36m1.3866[0m  0.1200
      7        [36m1.3865[0m  0.1190
      8        [36m1.3864[0m  0.1140
      9        [36m1.3864[0m  0.1160
     10        [36m1.3864[0m  0.1160
     11        [36m1.3864[0m  0.1190
     12        [36m1.3863[0m  0.1170
     13        [36m1.3863[0m  0.1160
     14        [36m1.3863[0m  0.1220
     15        1.3863  0.1220
     16        1.3864  0.1130
     17        [36m1.

     15        [36m1.3864[0m  0.1190
     16        [36m1.3864[0m  0.1200
     17        [36m1.3864[0m  0.1160
     18        [36m1.3864[0m  0.1200
     19        [36m1.3864[0m  0.1285
     20        [36m1.3864[0m  0.1200
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.3909[0m  0.1190
      2        [36m1.3886[0m  0.1210
      3        [36m1.3873[0m  0.1170
      4        [36m1.3867[0m  0.1360
      5        [36m1.3865[0m  0.1210
      6        [36m1.3864[0m  0.1240
      7        [36m1.3863[0m  0.1190
      8        [36m1.3857[0m  0.1190
      9        [36m1.3742[0m  0.1160
     10        [36m1.3390[0m  0.1190
     11        [36m1.2752[0m  0.1150
     12        [36m1.1859[0m  0.1170
     13        [36m1.1402[0m  0.1230
     14        [36m1.1147[0m  0.1260
     15        [36m1.0969[0m  0.1170
     16        [36m1.0826[0m  0.1160
     17        [36m1.0650[0m  0.1210
     18        [36m1.0540[0m  0.1180
    

      3        [36m1.3869[0m  0.1180
      4        [36m1.3869[0m  0.1240
      5        [36m1.3869[0m  0.1240
      6        [36m1.3869[0m  0.1200
      7        [36m1.3869[0m  0.1160
      8        [36m1.3869[0m  0.1230
      9        [36m1.3869[0m  0.1220
     10        [36m1.3868[0m  0.1170
     11        [36m1.3868[0m  0.1220
     12        [36m1.3868[0m  0.1135
     13        [36m1.3868[0m  0.1150
     14        [36m1.3868[0m  0.1170
     15        [36m1.3868[0m  0.1180
     16        [36m1.3868[0m  0.1290
     17        [36m1.3868[0m  0.1250
     18        [36m1.3868[0m  0.1160
     19        [36m1.3868[0m  0.1270
     20        [36m1.3868[0m  0.1190
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4047[0m  0.1160
      2        [36m1.3869[0m  0.1170
      3        [36m1.3868[0m  0.1200
      4        [36m1.3868[0m  0.1170
      5        [36m1.3868[0m  0.1270
      6        [36m1.3868[0m  0.1380
    

     18        1.3911  0.1260
     19        1.3911  0.1230
     20        1.3911  0.1140
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.3931[0m  0.1240
      2        [36m1.3911[0m  0.1210
      3        1.3911  0.1200
      4        1.3911  0.1200
      5        1.3911  0.1220
      6        1.3911  0.1270
      7        1.3911  0.1220
      8        1.3911  0.1260
      9        1.3911  0.1170
     10        1.3911  0.1150
     11        1.3911  0.1160
     12        1.3911  0.1230
     13        1.3911  0.1170
     14        1.3911  0.1220
     15        1.3911  0.1210
     16        1.3911  0.1240
     17        1.3911  0.1170
     18        1.3911  0.1180
     19        1.3911  0.1190
     20        1.3911  0.1180
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7958[0m  0.1290
      2       11.9568  0.1270
      3       11.9568  0.1270
      4       11.9568  0.1220
      5       11.9568  0.1180
      6      

     12        1.3905  0.1240
     13        1.3905  0.1210
     14        1.3905  0.1279
     15        1.3905  0.1200
     16        1.3905  0.1180
     17        1.3905  0.1260
     18        1.3905  0.1230
     19        1.3905  0.1160
     20        1.3905  0.1190
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4129[0m  0.1290
      2        [36m1.2768[0m  0.1310
      3        [36m1.1366[0m  0.1210
      4        [36m1.0632[0m  0.1170
      5        [36m1.0244[0m  0.1220
      6        [36m0.9987[0m  0.1210
      7        [36m0.9798[0m  0.1220
      8        [36m0.9687[0m  0.1270
      9        [36m0.9600[0m  0.1220
     10        [36m0.9563[0m  0.1240
     11        [36m0.9550[0m  0.1210
     12        0.9580  0.1210
     13        [36m0.9520[0m  0.1220
     14        [36m0.9398[0m  0.1230
     15        [36m0.9361[0m  0.1210
     16        [36m0.9349[0m  0.1150
     17        [36m0.9252[0m  0.1210
     18        

     17        [36m0.9150[0m  0.1270
     18        0.9153  0.1190
     19        0.9151  0.1260
     20        [36m0.9145[0m  0.1230
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4676[0m  0.1250
      2        [36m1.3291[0m  0.1240
      3        [36m1.2445[0m  0.1320
      4        [36m1.1668[0m  0.1300
      5        [36m1.1285[0m  0.1200
      6        [36m1.1036[0m  0.1340
      7        [36m1.0911[0m  0.1228
      8        [36m1.0847[0m  0.1231
      9        [36m1.0729[0m  0.1280
     10        [36m1.0704[0m  0.1270
     11        [36m1.0652[0m  0.1260
     12        [36m1.0589[0m  0.1320
     13        1.0599  0.1260
     14        1.0598  0.1260
     15        [36m1.0570[0m  0.1270
     16        [36m1.0569[0m  0.1230
     17        [36m1.0558[0m  0.1240
     18        1.0567  0.1236
     19        [36m1.0544[0m  0.1170
     20        [36m1.0514[0m  0.1340
  epoch    train_loss     dur
-------  ----------

     18        1.3869  0.1360
     19        1.3869  0.1220
     20        1.3869  0.1140
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6623[0m  0.1190
      2        [36m1.3868[0m  0.1210
      3        1.3868  0.1170
      4        1.3868  0.1200
      5        1.3868  0.1250
      6        1.3868  0.1200
      7        1.3868  0.1200
      8        1.3868  0.1230
      9        1.3868  0.1250
     10        1.3868  0.1270
     11        1.3868  0.1230
     12        1.3868  0.1180
     13        1.3868  0.1160
     14        1.3868  0.1220
     15        1.3868  0.1190
     16        1.3868  0.1330
     17        1.3868  0.1190
     18        1.3868  0.1270
     19        1.3868  0.1160
     20        1.3868  0.1200
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5471[0m  0.1250
      2        [36m1.3868[0m  0.1245
      3        [36m1.3868[0m  0.1250
      4        1.3868  0.1210
      5        1.3868  0.

      8        1.3911  0.1340
      9        1.3911  0.1310
     10        1.3911  0.1240
     11        1.3911  0.1250
     12        1.3911  0.1250
     13        1.3911  0.1280
     14        1.3911  0.1320
     15        1.3911  0.1290
     16        1.3911  0.1510
     17        1.3911  0.1250
     18        1.3911  0.1350
     19        1.3911  0.1250
     20        1.3911  0.1255
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8901[0m  0.1343
      2       11.9568  0.1295
      3       11.9568  0.1210
      4       11.9568  0.1310
      5       11.9568  0.1280
      6       11.9568  0.1230
      7       11.9568  0.1270
      8       11.9568  0.1320
      9       11.9568  0.1260
     10       11.9568  0.1280
     11       11.9568  0.1290
     12        [36m9.3937[0m  0.1370
     13        [36m1.3913[0m  0.1250
     14        [36m1.3911[0m  0.1190
     15        [36m1.3911[0m  0.1280
     16        1.3911  0.1230
     17        1.3911  0.

      4        [36m1.3928[0m  0.1220
      5        [36m1.3905[0m  0.1200
      6        1.3905  0.1244
      7        1.3905  0.1180
      8        1.3905  0.1170
      9        1.3905  0.1170
     10        1.3905  0.1260
     11        1.3905  0.1210
     12        1.3905  0.1240
     13        1.3905  0.1240
     14        1.3905  0.1190
     15        1.3905  0.1240
     16        1.3905  0.1210
     17        1.3905  0.1270
     18        1.3905  0.1190
     19        1.3905  0.1410
     20        1.3905  0.1270
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.3835[0m  0.1240
      2        [36m1.1666[0m  0.1280
      3        [36m1.0655[0m  0.1170
      4        [36m1.0155[0m  0.1230
      5        [36m0.9858[0m  0.1240
      6        [36m0.9713[0m  0.1180
      7        [36m0.9630[0m  0.1250
      8        [36m0.9468[0m  0.1320
      9        [36m0.9421[0m  0.1220
     10        [36m0.9384[0m  0.1280
     11        [36m0.

     11        [36m0.9415[0m  0.1180
     12        [36m0.9383[0m  0.1160
     13        [36m0.9353[0m  0.1180
     14        [36m0.9282[0m  0.1270
     15        0.9287  0.1210
     16        [36m0.9254[0m  0.1200
     17        [36m0.9234[0m  0.1190
     18        [36m0.9227[0m  0.1200
     19        0.9233  0.1230
     20        [36m0.9216[0m  0.1160
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5335[0m  0.1190
      2        [36m1.1097[0m  0.1190
      3        [36m1.0368[0m  0.1220
      4        [36m1.0179[0m  0.1220
      5        [36m0.9887[0m  0.1220
      6        0.9890  0.1220
      7        [36m0.9792[0m  0.1190
      8        [36m0.9760[0m  0.1290
      9        0.9768  0.1240
     10        0.9763  0.1390
     11        [36m0.9734[0m  0.1380
     12        0.9740  0.1310
     13        [36m0.9726[0m  0.1340
     14        [36m0.9721[0m  0.1250
     15        0.9726  0.1370
     16        [36m0.9708[

      7       11.9547  0.1240
      8       11.9547  0.1250
      9        [36m7.9345[0m  0.1240
     10        [36m1.3871[0m  0.1260
     11        [36m1.3869[0m  0.1280
     12        [36m1.3869[0m  0.1250
     13        [36m1.3869[0m  0.1190
     14        [36m1.3869[0m  0.1230
     15        [36m1.3869[0m  0.1230
     16        [36m1.3869[0m  0.1200
     17        [36m1.3869[0m  0.1200
     18        [36m1.3869[0m  0.1230
     19        [36m1.3869[0m  0.1340
     20        [36m1.3869[0m  0.1250
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4552[0m  0.1220
      2        [36m1.3868[0m  0.1200
      3        1.3868  0.1290
      4        1.3868  0.1240
      5        1.3868  0.1240
      6        1.3868  0.1240
      7        1.3868  0.1300
      8        1.3868  0.1210
      9        1.3868  0.1250
     10        1.3868  0.1250
     11        1.3868  0.1310
     12        1.3868  0.1255
     13        1.3868  0.1250
    

     17       11.9589  0.1250
     18       11.9589  0.1270
     19       11.9589  0.1210
     20       11.9589  0.1245
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9457[0m  0.1300
      2       11.9589  0.1290
      3       11.9589  0.1230
      4       11.9589  0.1280
      5       11.9589  0.1280
      6       11.9589  0.1250
      7       11.9589  0.1220
      8       11.9589  0.1230
      9       11.9589  0.1330
     10       11.9589  0.1210
     11       11.9589  0.1300
     12       11.9589  0.1280
     13       11.9589  0.1230
     14       11.9589  0.1180
     15       11.9589  0.1220
     16       11.9589  0.1260
     17       11.9589  0.1310
     18        [36m3.2264[0m  0.1240
     19        [36m1.3911[0m  0.1220
     20        [36m1.3911[0m  0.1270
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9137[0m  0.1180
      2       11.9568  0.1200
      3       11.9568  0.1320
      4       11.9568  0.

     12        [36m1.3904[0m  0.1200
     13        [36m1.3903[0m  0.1180
     14        1.3903  0.1250
     15        1.3903  0.1220
     16        1.3903  0.1240
     17        1.3903  0.1230
     18        1.3903  0.1200
     19        1.3903  0.1250
     20        1.3903  0.1270
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m8.5331[0m  0.1240
      2        [36m5.8817[0m  0.1250
      3        [36m4.2459[0m  0.1230
      4        [36m4.0763[0m  0.1200
      5        4.2840  0.1160
      6        [36m1.4855[0m  0.1270
      7        8.6028  0.1200
      8        5.0969  0.1260
      9        [36m1.3918[0m  0.1260
     10        [36m1.3905[0m  0.1190
     11        [36m1.3905[0m  0.1190
     12        1.3905  0.1230
     13        1.3905  0.1200
     14        1.3905  0.1220
     15        1.3905  0.1230
     16        1.3905  0.1270
     17        1.3905  0.1260
     18        1.3905  0.1210
     19        1.3905  0.1240
     20   

      2        [36m1.2262[0m  0.1300
      3        [36m1.0627[0m  0.1180
      4        [36m1.0234[0m  0.1230
      5        [36m0.9751[0m  0.1330
      6        0.9847  0.1240
      7        [36m0.9708[0m  0.1290
      8        [36m0.9581[0m  0.1190
      9        [36m0.9464[0m  0.1190
     10        [36m0.9394[0m  0.1260
     11        [36m0.9351[0m  0.1270
     12        [36m0.9310[0m  0.1180
     13        [36m0.9232[0m  0.1340
     14        [36m0.9210[0m  0.1190
     15        [36m0.9161[0m  0.1200
     16        [36m0.9155[0m  0.1200
     17        [36m0.9154[0m  0.1220
     18        [36m0.9143[0m  0.1300
     19        0.9377  0.1220
     20        0.9274  0.1180
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5153[0m  0.1150
      2        [36m1.0982[0m  0.1170
      3        [36m1.0406[0m  0.1260
      4        [36m1.0298[0m  0.1170
      5        [36m1.0001[0m  0.1190
      6        [36m0.9924[0m 

      5       11.9568  0.1240
      6       11.9568  0.1290
      7       11.9568  0.1230
      8       11.9568  0.1220
      9        [36m7.3927[0m  0.1260
     10        [36m1.3858[0m  0.1170
     11        1.3868  0.1150
     12        1.3869  0.1170
     13        1.3869  0.1190
     14        1.3869  0.1210
     15        1.3869  0.1300
     16        1.3869  0.1320
     17        1.3869  0.1190
     18        1.3869  0.1220
     19        1.3869  0.1290
     20        1.3869  0.1220
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8366[0m  0.1250
      2       11.9547  0.1210
      3       11.9547  0.1210
      4       11.9547  0.1210
      5       11.9547  0.1210
      6       11.9547  0.1250
      7       11.9546  0.1270
      8        [36m1.8042[0m  0.1180
      9        [36m1.3871[0m  0.1160
     10        [36m1.3870[0m  0.1160
     11        [36m1.3870[0m  0.1200
     12        [36m1.3870[0m  0.1290
     13        [36m1.3869[

     19       11.9589  0.1250
     20       11.9589  0.1280
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9280[0m  0.1260
      2       11.9547  0.1250
      3       11.9547  0.1190
      4       11.9547  0.1320
      5       11.9547  0.1280
      6       11.9547  0.1370
      7       11.9547  0.1230
      8       11.9547  0.1230
      9       11.9547  0.1200
     10       11.9547  0.1210
     11       11.9547  0.1230
     12       11.9547  0.1290
     13       11.9547  0.1220
     14       11.9547  0.1210
     15       11.9547  0.1320
     16       11.9547  0.1320
     17       11.9547  0.1240
     18       11.9547  0.1280
     19       11.9547  0.1230
     20       11.9547  0.1240
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4166[0m  0.1240
      2        [36m1.3912[0m  0.1150
      3        [36m1.3911[0m  0.1200
      4        [36m1.3911[0m  0.1230
      5        [36m1.3911[0m  0.1270
      6        1

     11        1.3903  0.1190
     12        1.3903  0.1210
     13        1.3903  0.1190
     14        1.3903  0.1230
     15        [36m1.3903[0m  0.1220
     16        1.3903  0.1310
     17        1.3903  0.1220
     18        1.3903  0.1210
     19        1.3903  0.1280
     20        1.3903  0.1290
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.4304[0m  0.1220
      2       [36m11.2316[0m  0.1200
      3        [36m5.7304[0m  0.1250
      4        [36m1.4761[0m  0.1280
      5        3.3817  0.1190
      6        2.3714  0.1190
      7        [36m1.3918[0m  0.1200
      8        [36m1.3910[0m  0.1260
      9        [36m1.3905[0m  0.1250
     10        1.3905  0.1270
     11        1.3905  0.1170
     12        1.3905  0.1190
     13        1.3905  0.1220
     14        1.3905  0.1160
     15        1.3905  0.1310
     16        1.3905  0.1210
     17        1.3905  0.1160
     18        1.3905  0.1190
     19        1.3905  0.120

      8        [36m1.3869[0m  0.1170
      9        [36m1.3867[0m  0.1280
     10        [36m1.3865[0m  0.1180
     11        [36m1.3865[0m  0.1190
     12        [36m1.3864[0m  0.1200
     13        [36m1.3864[0m  0.1150
     14        [36m1.3864[0m  0.1210
     15        [36m1.3864[0m  0.1140
     16        [36m1.3864[0m  0.1160
     17        [36m1.3864[0m  0.1200
     18        [36m1.3864[0m  0.1170
     19        [36m1.3864[0m  0.1190
     20        [36m1.3864[0m  0.1120
     21        [36m1.3864[0m  0.1140
     22        [36m1.3864[0m  0.1160
     23        [36m1.3864[0m  0.1130
     24        [36m1.3864[0m  0.1160
     25        [36m1.3864[0m  0.1210
     26        [36m1.3864[0m  0.1240
     27        [36m1.3864[0m  0.1150
     28        [36m1.3864[0m  0.1130
     29        [36m1.3864[0m  0.1240
     30        [36m1.3864[0m  0.1300
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5760[0m  0.1190
    

     10        [36m0.9897[0m  0.1190
     11        [36m0.9848[0m  0.1190
     12        [36m0.9807[0m  0.1180
     13        [36m0.9805[0m  0.1160
     14        [36m0.9768[0m  0.1170
     15        0.9772  0.1170
     16        [36m0.9732[0m  0.1230
     17        0.9749  0.1180
     18        [36m0.9712[0m  0.1200
     19        0.9712  0.1230
     20        [36m0.9705[0m  0.1270
     21        [36m0.9685[0m  0.1190
     22        0.9699  0.1190
     23        0.9689  0.1180
     24        [36m0.9674[0m  0.1190
     25        0.9675  0.1240
     26        0.9688  0.1180
     27        0.9691  0.1280
     28        [36m0.9657[0m  0.1220
     29        0.9675  0.1210
     30        0.9687  0.1170
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.4329[0m  0.1260
      2        [36m1.3931[0m  0.1290
      3        [36m1.3891[0m  0.1210
      4        [36m1.3875[0m  0.1180
      5        [36m1.3868[0m  0.1190
      6        

     17        [36m1.3869[0m  0.1160
     18        [36m1.3869[0m  0.1130
     19        [36m1.3869[0m  0.1190
     20        [36m1.3869[0m  0.1210
     21        [36m1.3869[0m  0.1160
     22        [36m1.3869[0m  0.1190
     23        1.3869  0.1240
     24        1.3869  0.1160
     25        1.3869  0.1190
     26        1.3869  0.1190
     27        1.3869  0.1200
     28        1.3869  0.1170
     29        1.3869  0.1160
     30        1.3869  0.1180
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5717[0m  0.1190
      2        [36m1.3869[0m  0.1190
      3        [36m1.3868[0m  0.1270
      4        [36m1.3868[0m  0.1220
      5        1.3868  0.1260
      6        1.3868  0.1210
      7        1.3868  0.1190
      8        1.3868  0.1150
      9        1.3868  0.1180
     10        [36m1.3868[0m  0.1200
     11        1.3868  0.1130
     12        1.3868  0.1130
     13        1.3868  0.1200
     14        1.3868  0.1210
 

     13        1.3869  0.1160
     14        1.3869  0.1250
     15        1.3869  0.1260
     16        1.3869  0.1130
     17        1.3869  0.1190
     18        1.3869  0.1160
     19        1.3869  0.1270
     20        1.3869  0.1270
     21        1.3869  0.1160
     22        1.3869  0.1190
     23        1.3869  0.1160
     24        1.3869  0.1160
     25        1.3869  0.1200
     26        1.3869  0.1250
     27        1.3869  0.1140
     28        1.3869  0.1160
     29        1.3869  0.1160
     30        1.3869  0.1210
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m10.9928[0m  0.1220
      2        [36m1.3873[0m  0.1170
      3        [36m1.3868[0m  0.1210
      4        1.3868  0.1240
      5        1.3868  0.1180
      6        1.3868  0.1160
      7        1.3868  0.1250
      8        1.3868  0.1190
      9        1.3868  0.1230
     10        1.3868  0.1150
     11        1.3868  0.1140
     12        1.3868  0.1210
     13      

     24        1.3913  0.1130
     25        1.3913  0.1180
     26        1.3913  0.1120
     27        1.3913  0.1170
     28        1.3913  0.1160
     29        1.3913  0.1190
     30        1.3913  0.1150
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7502[0m  0.1140
      2       11.9547  0.1240
      3       11.8380  0.1180
      4        [36m1.3915[0m  0.1140
      5        [36m1.3910[0m  0.1160
      6        [36m1.3910[0m  0.1210
      7        [36m1.3910[0m  0.1170
      8        [36m1.3910[0m  0.1170
      9        1.3910  0.1200
     10        1.3910  0.1210
     11        1.3910  0.1210
     12        1.3910  0.1230
     13        1.3910  0.1240
     14        1.3910  0.1141
     15        1.3910  0.1230
     16        1.3910  0.1140
     17        [36m1.3910[0m  0.1230
     18        [36m1.3910[0m  0.1160
     19        1.3910  0.1190
     20        1.3910  0.1240
     21        1.3910  0.1170
     22        1.3910  0.136

     29        1.3905  0.1220
     30        1.3905  0.1160
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4825[0m  0.1180
      2        [36m1.3960[0m  0.1180
      3        [36m1.3914[0m  0.1220
      4        [36m1.3890[0m  0.1150
      5        [36m1.3877[0m  0.1200
      6        [36m1.3871[0m  0.1190
      7        [36m1.3867[0m  0.1230
      8        [36m1.3865[0m  0.1180
      9        [36m1.3864[0m  0.1220
     10        [36m1.3864[0m  0.1200
     11        [36m1.3864[0m  0.1210
     12        [36m1.3864[0m  0.1270
     13        [36m1.3864[0m  0.1180
     14        1.3864  0.1180
     15        1.3864  0.1170
     16        1.3864  0.1210
     17        1.3864  0.1220
     18        1.3864  0.1160
     19        1.3864  0.1200
     20        1.3864  0.1140
     21        1.3864  0.1190
     22        1.3864  0.1240
     23        1.3864  0.1160
     24        1.3864  0.1170
     25        1.3864  0.1190
     26      

      2        [36m1.3890[0m  0.1190
      3        [36m1.3859[0m  0.1250
      4        [36m1.3832[0m  0.1340
      5        [36m1.3790[0m  0.1170
      6        [36m1.3659[0m  0.1140
      7        [36m1.3288[0m  0.1170
      8        [36m1.2359[0m  0.1220
      9        [36m1.1469[0m  0.1160
     10        [36m1.1008[0m  0.1170
     11        [36m1.0797[0m  0.1320
     12        [36m1.0557[0m  0.1240
     13        [36m1.0392[0m  0.1260
     14        [36m1.0233[0m  0.1160
     15        [36m1.0184[0m  0.1240
     16        1.0292  0.1170
     17        [36m1.0059[0m  0.1220
     18        1.0077  0.1270
     19        1.0127  0.1220
     20        1.0559  0.1230
     21        [36m0.9891[0m  0.1230
     22        1.0079  0.1220
     23        0.9903  0.1160
     24        1.0059  0.1180
     25        [36m0.9872[0m  0.1160
     26        [36m0.9636[0m  0.1150
     27        0.9757  0.1210
     28        0.9662  0.1260
     29        [36m0.9620[

     10        1.0071  0.1180
     11        [36m0.9842[0m  0.1200
     12        [36m0.9687[0m  0.1190
     13        0.9698  0.1200
     14        0.9694  0.1210
     15        0.9691  0.1210
     16        [36m0.9682[0m  0.1150
     17        0.9682  0.1170
     18        0.9682  0.1270
     19        [36m0.9674[0m  0.1320
     20        [36m0.9666[0m  0.1180
     21        0.9682  0.1210
     22        0.9671  0.1150
     23        0.9667  0.1200
     24        [36m0.9639[0m  0.1200
     25        0.9653  0.1240
     26        0.9673  0.1200
     27        [36m0.9630[0m  0.1200
     28        0.9635  0.1230
     29        0.9642  0.1230
     30        0.9652  0.1200
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4984[0m  0.1170
      2        [36m1.3867[0m  0.1160
      3        [36m1.3866[0m  0.1240
      4        [36m1.3866[0m  0.1170
      5        [36m1.3865[0m  0.1170
      6        [36m1.3865[0m  0.1190
      7      

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5044[0m  0.1140
      2        [36m1.3868[0m  0.1230
      3        1.3868  0.1190
      4        1.3868  0.1220
      5        1.3868  0.1250
      6        1.3868  0.1170
      7        1.3868  0.1260
      8        1.3868  0.1140
      9        1.3868  0.1270
     10        1.3868  0.1190
     11        1.3868  0.1190
     12        1.3868  0.1160
     13        1.3868  0.1150
     14        1.3868  0.1220
     15        1.3868  0.1190
     16        1.3868  0.1170
     17        1.3868  0.1180
     18        1.3868  0.1230
     19        1.3868  0.1310
     20        1.3868  0.1210
     21        1.3868  0.1270
     22        1.3868  0.1150
     23        1.3868  0.1240
     24        1.3868  0.1150
     25        1.3868  0.1180
     26        1.3868  0.1140
     27        1.3868  0.1310
     28        1.3868  0.1210
     29        1.3868  0.1220
     30        1.3868  0.1200
  epoch    train_loss 

     28        1.3868  0.1170
     29        1.3868  0.1180
     30        1.3868  0.1260
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9473[0m  0.1190
      2       11.9568  0.1240
      3       11.9568  0.1190
      4       11.9568  0.1180
      5       11.9568  0.1200
      6       11.9568  0.1230
      7       11.9568  0.1230
      8       11.9568  0.1180
      9       11.9568  0.1240
     10       11.9568  0.1200
     11       11.9568  0.1210
     12       11.9568  0.1180
     13       11.9568  0.1170
     14       11.9568  0.1210
     15       11.9568  0.1170
     16       11.9568  0.1230
     17       11.9568  0.1280
     18       11.9568  0.1290
     19       11.9568  0.1210
     20       11.9568  0.1210
     21       11.9568  0.1230
     22       11.9568  0.1220
     23       11.9568  0.1240
     24       11.9568  0.1230
     25       11.9568  0.1220
     26       11.9568  0.1170
     27       11.9568  0.1220
     28       11.9568  0.1280
 

      5        1.3910  0.1270
      6        1.3910  0.1210
      7        1.3910  0.1210
      8        1.3910  0.1210
      9        1.3910  0.1290
     10        1.3910  0.1180
     11        1.3910  0.1220
     12        1.3910  0.1150
     13        1.3910  0.1180
     14        1.3910  0.1210
     15        1.3910  0.1220
     16        1.3910  0.1220
     17        1.3910  0.1200
     18        1.3910  0.1200
     19        1.3910  0.1180
     20        1.3910  0.1200
     21        1.3910  0.1200
     22        1.3910  0.1140
     23        1.3910  0.1260
     24        1.3910  0.1210
     25        1.3910  0.1210
     26        1.3910  0.1140
     27        1.3910  0.1140
     28        1.3910  0.1260
     29        1.3910  0.1140
     30        1.3910  0.1210
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4591[0m  0.1270
      2        [36m1.3920[0m  0.1200
      3        [36m1.3920[0m  0.1200
      4        [36m1.3920[0m  0.1150
    

      6        [36m1.2052[0m  0.1190
      7        [36m1.1207[0m  0.1200
      8        [36m1.0846[0m  0.1260
      9        [36m1.0652[0m  0.1200
     10        [36m1.0453[0m  0.1340
     11        [36m1.0240[0m  0.1230
     12        [36m1.0072[0m  0.1220
     13        [36m0.9958[0m  0.1160
     14        1.0130  0.1213
     15        [36m0.9931[0m  0.1270
     16        [36m0.9916[0m  0.1260
     17        0.9947  0.1240
     18        [36m0.9912[0m  0.1200
     19        [36m0.9720[0m  0.1180
     20        0.9748  0.1160
     21        0.9843  0.1210
     22        0.9731  0.1240
     23        [36m0.9646[0m  0.1250
     24        [36m0.9519[0m  0.1290
     25        0.9572  0.1190
     26        [36m0.9489[0m  0.1180
     27        0.9507  0.1240
     28        0.9703  0.1250
     29        0.9683  0.1200
     30        0.9550  0.1160
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5976[0m  0.1230
      2        

      8        0.9372  0.1220
      9        0.9366  0.1260
     10        [36m0.9332[0m  0.1180
     11        [36m0.9238[0m  0.1230
     12        0.9242  0.1220
     13        0.9257  0.1250
     14        [36m0.9196[0m  0.1220
     15        [36m0.9186[0m  0.1250
     16        [36m0.9174[0m  0.1170
     17        [36m0.9113[0m  0.1190
     18        [36m0.9106[0m  0.1220
     19        [36m0.9062[0m  0.1260
     20        [36m0.9059[0m  0.1220
     21        [36m0.9051[0m  0.1280
     22        [36m0.9019[0m  0.1300
     23        0.9022  0.1230
     24        0.9054  0.1270
     25        0.9049  0.1200
     26        0.9052  0.1150
     27        0.9049  0.1190
     28        0.9032  0.1220
     29        0.9023  0.1280
     30        [36m0.9013[0m  0.1200
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6192[0m  0.1200
      2        [36m1.3317[0m  0.1200
      3        [36m1.2797[0m  0.1180
      4        [36m1.198

     28       11.9589  0.1250
     29       11.9589  0.1240
     30       11.9589  0.1230
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5534[0m  0.1180
      2        [36m1.3868[0m  0.1330
      3        1.3868  0.1230
      4        1.3868  0.1170
      5        1.3868  0.1210
      6        1.3868  0.1210
      7        1.3868  0.1180
      8        1.3868  0.1250
      9        1.3868  0.1220
     10        1.3868  0.1260
     11        1.3868  0.1220
     12        1.3868  0.1310
     13        1.3868  0.1140
     14        1.3868  0.1190
     15        1.3868  0.1230
     16        1.3868  0.1250
     17        1.3868  0.1200
     18        1.3868  0.1300
     19        1.3868  0.1230
     20        1.3868  0.1150
     21        1.3868  0.1190
     22        1.3868  0.1200
     23        1.3868  0.1330
     24        1.3868  0.1240
     25        1.3868  0.1190
     26        1.3868  0.1170
     27        1.3868  0.1220
     28        1.3868 

     28        1.3869  0.1250
     29        1.3869  0.1180
     30        1.3869  0.1220
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5392[0m  0.1210
      2        [36m1.3869[0m  0.1220
      3        1.3869  0.1180
      4        1.3869  0.1220
      5        1.3869  0.1190
      6        1.3869  0.1210
      7        1.3869  0.1340
      8        1.3869  0.1240
      9        1.3869  0.1170
     10        1.3869  0.1160
     11        1.3869  0.1240
     12        1.3869  0.1220
     13        1.3869  0.1220
     14        1.3869  0.1160
     15        1.3869  0.1250
     16        1.3869  0.1150
     17        1.3869  0.1230
     18        1.3869  0.1330
     19        1.3869  0.1180
     20        1.3869  0.1210
     21        1.3869  0.1200
     22        1.3869  0.1150
     23        1.3869  0.1220
     24        1.3869  0.1240
     25        1.3869  0.1270
     26        1.3869  0.1200
     27        1.3869  0.1220
     28        1.3869 

      6       11.9547  0.1270
      7       11.9547  0.1280
      8       11.9547  0.1250
      9       11.9547  0.1240
     10       11.9547  0.1240
     11       11.9547  0.1340
     12       11.9547  0.1290
     13       11.9547  0.1190
     14       11.9547  0.1170
     15       11.9547  0.1240
     16       11.9547  0.1190
     17       11.9547  0.1190
     18       11.9547  0.1230
     19       11.9547  0.1260
     20       11.9547  0.1270
     21       11.9547  0.1220
     22       11.9547  0.1280
     23       11.9547  0.1250
     24       11.9547  0.1330
     25       11.9547  0.1230
     26       11.9547  0.1180
     27       11.9547  0.1220
     28       11.9547  0.1210
     29       11.9547  0.1290
     30       11.9547  0.1270
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9534[0m  0.1220
      2       11.9568  0.1240
      3       11.9568  0.1280
      4       11.9568  0.1270
      5       11.9568  0.1440
      6       11.9568  0.1340
 

     11        1.3894  0.1220
     12        1.3894  0.1210
     13        1.3894  0.1230
     14        1.3894  0.1220
     15        1.3894  0.1240
     16        1.3894  0.1290
     17        1.3894  0.1280
     18        1.3894  0.1150
     19        1.3894  0.1240
     20        1.3894  0.1280
     21        1.3894  0.1300
     22        1.3894  0.1200
     23        1.3894  0.1210
     24        1.3894  0.1330
     25        1.3894  0.1140
     26        1.3894  0.1210
     27        1.3894  0.1210
     28        1.3894  0.1330
     29        1.3894  0.1210
     30        1.3894  0.1160
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.6378[0m  0.1260
      2        [36m6.1813[0m  0.1200
      3        [36m1.4329[0m  0.1180
      4        [36m1.3934[0m  0.1140
      5        [36m1.3912[0m  0.1180
      6        1.3913  0.1280
      7        1.3913  0.1140
      8        1.3913  0.1180
      9        1.3913  0.1150
     10        1.3913  0.

      5        [36m0.9440[0m  0.1340
      6        [36m0.9350[0m  0.1190
      7        [36m0.9292[0m  0.1210
      8        0.9298  0.1190
      9        [36m0.9233[0m  0.1300
     10        [36m0.9201[0m  0.1190
     11        0.9201  0.1200
     12        [36m0.9140[0m  0.1180
     13        [36m0.9106[0m  0.1190
     14        [36m0.9046[0m  0.1330
     15        [36m0.8988[0m  0.1190
     16        [36m0.8962[0m  0.1210
     17        [36m0.8949[0m  0.1180
     18        [36m0.8923[0m  0.1210
     19        [36m0.8918[0m  0.1160
     20        0.8920  0.1190
     21        0.8918  0.1150
     22        [36m0.8892[0m  0.1190
     23        [36m0.8878[0m  0.1280
     24        [36m0.8876[0m  0.1280
     25        [36m0.8811[0m  0.1250
     26        0.8830  0.1150
     27        [36m0.8778[0m  0.1210
     28        0.8781  0.1290
     29        0.8801  0.1210
     30        [36m0.8751[0m  0.1180
  epoch    train_loss     dur
-------  ----------

     10        [36m0.9765[0m  0.1150
     11        [36m0.9737[0m  0.1210
     12        0.9745  0.1150
     13        0.9745  0.1210
     14        0.9739  0.1210
     15        [36m0.9729[0m  0.1150
     16        [36m0.9728[0m  0.1300
     17        0.9737  0.1230
     18        0.9731  0.1260
     19        [36m0.9726[0m  0.1190
     20        0.9726  0.1260
     21        [36m0.9723[0m  0.1220
     22        [36m0.9719[0m  0.1150
     23        0.9723  0.1180
     24        0.9724  0.1170
     25        [36m0.9707[0m  0.1190
     26        0.9721  0.1190
     27        0.9709  0.1160
     28        0.9717  0.1210
     29        0.9711  0.1220
     30        [36m0.9703[0m  0.1190
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7466[0m  0.1220
      2        [36m1.0911[0m  0.1180
      3        [36m1.0695[0m  0.1190
      4        [36m1.0497[0m  0.1210
      5        [36m1.0444[0m  0.1250
      6        [36m1.0094[0m  0.

      7       11.9568  0.1170
      8       11.9568  0.1240
      9       11.9568  0.1200
     10       11.9568  0.1200
     11       11.9568  0.1190
     12       11.9568  0.1230
     13       11.9568  0.1270
     14       11.9568  0.1270
     15       11.9568  0.1230
     16       11.9568  0.1200
     17       11.9568  0.1290
     18       11.9568  0.1170
     19       11.9568  0.1220
     20       11.9568  0.1200
     21       11.9568  0.1210
     22       11.9568  0.1230
     23       11.9568  0.1230
     24       11.9568  0.1160
     25       11.9568  0.1220
     26       11.9568  0.1220
     27       11.9568  0.1270
     28       11.9568  0.1170
     29       11.9568  0.1280
     30       11.9568  0.1230
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9379[0m  0.1200
      2       11.9568  0.1250
      3       11.9568  0.1240
      4       11.9568  0.1370
      5       11.9568  0.1300
      6       11.9568  0.1260
      7       11.9568  0.1240
 

      2        [36m1.3868[0m  0.1300
      3        1.3868  0.1270
      4        1.3868  0.1280
      5        1.3868  0.1190
      6        1.3868  0.1240
      7        1.3868  0.1210
      8        1.3868  0.1180
      9        1.3868  0.1150
     10        1.3868  0.1200
     11        1.3868  0.1210
     12        1.3868  0.1220
     13        1.3868  0.1320
     14        1.3868  0.1910
     15        1.3868  0.1420
     16        1.3868  0.1550
     17        1.3868  0.1300
     18        1.3868  0.1310
     19        1.3868  0.1300
     20        1.3868  0.1260
     21        1.3868  0.1370
     22        1.3868  0.1310
     23        1.3868  0.1290
     24        1.3868  0.1240
     25        1.3868  0.1270
     26        1.3868  0.1280
     27        1.3868  0.1310
     28        1.3868  0.1160
     29        1.3868  0.1280
     30        1.3868  0.1190
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m9.9011[0m  0.1260
      2        [36m1.

     13       11.9568  0.1200
     14       11.9568  0.1210
     15       11.9568  0.1280
     16       11.9568  0.1290
     17       11.9568  0.1210
     18       11.9568  0.1260
     19       11.9568  0.1190
     20       11.9568  0.1220
     21        [36m9.9901[0m  0.1240
     22        [36m1.3924[0m  0.1280
     23        [36m1.3922[0m  0.1200
     24        [36m1.3922[0m  0.1170
     25        [36m1.3922[0m  0.1180
     26        1.3922  0.1240
     27        1.3922  0.1270
     28        1.3922  0.1230
     29        1.3922  0.1290
     30        1.3922  0.1150
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9193[0m  0.1220
      2       11.9568  0.1230
      3        [36m1.6165[0m  0.1260
      4        [36m1.3900[0m  0.1220
      5        1.3900  0.1200
      6        1.3900  0.1250
      7        1.3900  0.1250
      8        1.3900  0.1320
      9        1.3900  0.1280
     10        1.3900  0.1180
     11        1.3900  0.135

     16        1.3904  0.1330
     17        1.3904  0.1270
     18        1.3904  0.1250
     19        1.3904  0.1220
     20        1.3904  0.1260
     21        1.3904  0.1270
     22        1.3904  0.1190
     23        1.3904  0.1250
     24        1.3904  0.1270
     25        1.3904  0.1160
     26        1.3904  0.1210
     27        1.3904  0.1270
     28        1.3904  0.1230
     29        1.3904  0.1270
     30        1.3904  0.1190
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m7.6024[0m  0.1280
      2       10.3794  0.1220
      3        [36m5.8638[0m  0.1200
      4        [36m1.4039[0m  0.1200
      5        [36m1.3906[0m  0.1290
      6        [36m1.3904[0m  0.1210
      7        [36m1.3903[0m  0.1230
      8        [36m1.3903[0m  0.1250
      9        1.3903  0.1280
     10        1.3903  0.1240
     11        1.3903  0.1200
     12        1.3903  0.1220
     13        1.3903  0.1320
     14        [36m1.3903[0m  0.124

     35        [36m1.3863[0m  0.1160
     36        [36m1.3863[0m  0.1150
     37        [36m1.3863[0m  0.1230
     38        [36m1.3863[0m  0.1190
     39        1.3863  0.1240
     40        [36m1.3863[0m  0.1240
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4855[0m  0.1130
      2        [36m1.4106[0m  0.1170
      3        [36m1.3998[0m  0.1190
      4        [36m1.3938[0m  0.1160
      5        [36m1.3905[0m  0.1170
      6        [36m1.3887[0m  0.1270
      7        [36m1.3877[0m  0.1230
      8        [36m1.3871[0m  0.1240
      9        [36m1.3868[0m  0.1170
     10        [36m1.3866[0m  0.1130
     11        [36m1.3865[0m  0.1240
     12        [36m1.3865[0m  0.1210
     13        [36m1.3864[0m  0.1170
     14        [36m1.3864[0m  0.1140
     15        [36m1.3864[0m  0.1250
     16        [36m1.3864[0m  0.1180
     17        [36m1.3864[0m  0.1150
     18        [36m1.3864[0m  0.1200
     19      

     16        1.3864  0.1160
     17        1.3864  0.1190
     18        1.3864  0.1250
     19        1.3864  0.1170
     20        1.3864  0.1250
     21        1.3864  0.1190
     22        1.3864  0.1190
     23        1.3864  0.1220
     24        1.3864  0.1210
     25        1.3864  0.1310
     26        1.3864  0.1139
     27        1.3864  0.1200
     28        1.3864  0.1180
     29        1.3864  0.1180
     30        1.3864  0.1220
     31        1.3864  0.1160
     32        1.3864  0.1160
     33        1.3864  0.1140
     34        1.3864  0.1180
     35        1.3864  0.1210
     36        1.3864  0.1290
     37        1.3864  0.1250
     38        1.3864  0.1190
     39        1.3864  0.1320
     40        1.3864  0.1230
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.8073[0m  0.1190
      2        [36m1.3924[0m  0.1200
      3        [36m1.3883[0m  0.1270
      4        [36m1.3871[0m  0.1230
      5        [36m1.3866[0m  0.

      2        [36m1.3868[0m  0.1290
      3        1.3869  0.1220
      4        1.3869  0.1290
      5        1.3869  0.1230
      6        1.3869  0.1220
      7        1.3869  0.1190
      8        1.3869  0.1180
      9        1.3869  0.1180
     10        1.3869  0.1310
     11        1.3869  0.1200
     12        1.3869  0.1200
     13        1.3869  0.1180
     14        1.3869  0.1250
     15        1.3869  0.1140
     16        1.3869  0.1200
     17        1.3869  0.1230
     18        1.3869  0.1190
     19        1.3869  0.1210
     20        1.3869  0.1240
     21        1.3869  0.1130
     22        1.3869  0.1167
     23        1.3869  0.1170
     24        1.3869  0.1220
     25        1.3869  0.1140
     26        1.3869  0.1190
     27        1.3869  0.1240
     28        1.3869  0.1210
     29        1.3869  0.1190
     30        1.3869  0.1160
     31        1.3869  0.1240
     32        1.3869  0.1180
     33        1.3869  0.1140
     34        1.3869  0.1150
 

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4093[0m  0.1210
      2        [36m1.3862[0m  0.1220
      3        1.3868  0.1220
      4        1.3868  0.1210
      5        1.3868  0.1200
      6        1.3868  0.1220
      7        1.3868  0.1270
      8        1.3868  0.1210
      9        1.3868  0.1220
     10        1.3868  0.1290
     11        1.3868  0.1270
     12        1.3868  0.1210
     13        1.3868  0.1200
     14        1.3868  0.1150
     15        1.3868  0.1280
     16        1.3868  0.1200
     17        1.3868  0.1260
     18        1.3868  0.1140
     19        1.3868  0.1120
     20        1.3868  0.1150
     21        1.3868  0.1180
     22        1.3868  0.1250
     23        1.3868  0.1260
     24        1.3868  0.1270
     25        1.3868  0.1240
     26        1.3868  0.1210
     27        1.3868  0.1160
     28        1.3868  0.1240
     29        1.3868  0.1200
     30        1.3868  0.1220
     31        1.3868 

     36        1.3868  0.1280
     37        1.3868  0.1190
     38        1.3868  0.1240
     39        1.3868  0.1210
     40        1.3868  0.1200
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4121[0m  0.1220
      2        [36m1.3868[0m  0.1190
      3        [36m1.3868[0m  0.1200
      4        1.3868  0.1210
      5        1.3868  0.1160
      6        1.3868  0.1170
      7        1.3868  0.1130
      8        1.3868  0.1130
      9        1.3868  0.1250
     10        1.3868  0.1170
     11        1.3868  0.1160
     12        1.3868  0.1130
     13        1.3868  0.1190
     14        1.3868  0.1160
     15        1.3868  0.1190
     16        1.3868  0.1150
     17        1.3868  0.1230
     18        1.3868  0.1190
     19        1.3868  0.1190
     20        1.3868  0.1250
     21        1.3868  0.1230
     22        1.3868  0.1240
     23        1.3868  0.1210
     24        1.3868  0.1180
     25        1.3868  0.1140
     26      

     10       11.9568  0.1230
     11       11.9568  0.1280
     12       11.9568  0.1230
     13       11.9568  0.1260
     14       11.9568  0.1240
     15       11.9568  0.1180
     16       11.9568  0.1310
     17       11.9568  0.1250
     18        [36m9.0880[0m  0.1220
     19        [36m1.3909[0m  0.1160
     20        1.3911  0.1160
     21        1.3911  0.1230
     22        1.3911  0.1310
     23        1.3911  0.1150
     24        1.3911  0.1160
     25        1.3911  0.1200
     26        1.3911  0.1150
     27        1.3911  0.1230
     28        1.3911  0.1290
     29        1.3911  0.1280
     30        1.3911  0.1220
     31        1.3911  0.1150
     32        1.3911  0.1220
     33        1.3911  0.1180
     34        1.3911  0.1200
     35        1.3911  0.1190
     36        1.3911  0.1210
     37        1.3911  0.1140
     38        1.3911  0.1220
     39        1.3911  0.1160
     40        1.3911  0.1230
  epoch    train_loss     dur
-------  ------------ 

     25        1.3920  0.1200
     26        1.3920  0.1260
     27        1.3920  0.1150
     28        1.3920  0.1160
     29        1.3920  0.1200
     30        1.3920  0.1170
     31        1.3920  0.1200
     32        1.3920  0.1200
     33        1.3920  0.1170
     34        1.3920  0.1240
     35        1.3920  0.1240
     36        1.3920  0.1180
     37        1.3920  0.1190
     38        1.3920  0.1210
     39        1.3920  0.1200
     40        1.3920  0.1180
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m5.3408[0m  0.1210
      2        6.8349  0.1190
      3        [36m4.4789[0m  0.1230
      4        [36m4.2441[0m  0.1190
      5        [36m1.3893[0m  0.1210
      6        1.3894  0.1160
      7        1.3894  0.1150
      8        1.3894  0.1190
      9        1.3894  0.1220
     10        1.3894  0.1230
     11        1.3894  0.1280
     12        1.3894  0.1210
     13        1.3894  0.1200
     14        1.3894  0.1170
    

     32        [36m0.9807[0m  0.1200
     33        [36m0.9787[0m  0.1270
     34        0.9792  0.1270
     35        [36m0.9744[0m  0.1200
     36        [36m0.9673[0m  0.1190
     37        0.9680  0.1170
     38        [36m0.9602[0m  0.1220
     39        0.9661  0.1290
     40        0.9610  0.1200
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4877[0m  0.1260
      2        [36m1.3246[0m  0.1240
      3        [36m1.2127[0m  0.1260
      4        [36m1.0852[0m  0.1250
      5        [36m1.0351[0m  0.1210
      6        1.1262  0.1220
      7        1.1032  0.1270
      8        1.0681  0.1230
      9        1.0522  0.1230
     10        1.0361  0.1240
     11        [36m1.0297[0m  0.1260
     12        [36m1.0182[0m  0.1330
     13        1.0323  0.1210
     14        [36m1.0032[0m  0.1280
     15        [36m1.0016[0m  0.1330
     16        1.0066  0.1340
     17        [36m0.9791[0m  0.1290
     18        [36m0.974

     10        [36m1.3864[0m  0.1270
     11        [36m1.3864[0m  0.1230
     12        [36m1.3864[0m  0.1260
     13        [36m1.3863[0m  0.1220
     14        [36m1.3863[0m  0.1170
     15        [36m1.3863[0m  0.1200
     16        [36m1.3863[0m  0.1200
     17        [36m1.3863[0m  0.1250
     18        [36m1.3863[0m  0.1250
     19        [36m1.3863[0m  0.1240
     20        [36m1.3863[0m  0.1150
     21        [36m1.3863[0m  0.1260
     22        [36m1.3863[0m  0.1320
     23        [36m1.3863[0m  0.1150
     24        [36m1.3863[0m  0.1150
     25        1.3863  0.1210
     26        1.3863  0.1250
     27        1.3863  0.1210
     28        1.3863  0.1240
     29        1.3863  0.1180
     30        1.3863  0.1240
     31        1.3863  0.1240
     32        1.3863  0.1210
     33        1.3863  0.1240
     34        1.3863  0.1180
     35        1.3863  0.1160
     36        [36m1.3863[0m  0.1280
     37        1.3863  0.1320
     38        1

     28        0.9919  0.1180
     29        0.9930  0.1150
     30        0.9936  0.1170
     31        0.9894  0.1320
     32        0.9894  0.1290
     33        0.9910  0.1210
     34        0.9908  0.1200
     35        0.9909  0.1190
     36        0.9909  0.1210
     37        0.9900  0.1260
     38        [36m0.9878[0m  0.1150
     39        0.9890  0.1270
     40        0.9915  0.1180
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.0065[0m  0.1190
      2        [36m1.3859[0m  0.1240
      3        [36m1.3818[0m  0.1270
      4        [36m1.3693[0m  0.1200
      5        [36m1.3296[0m  0.1250
      6        [36m1.2328[0m  0.1290
      7        [36m1.1485[0m  0.1240
      8        [36m1.1124[0m  0.1150
      9        [36m1.1029[0m  0.1150
     10        [36m1.0733[0m  0.1220
     11        [36m1.0622[0m  0.1190
     12        [36m1.0532[0m  0.1200
     13        [36m1.0482[0m  0.1330
     14        [36m1.0460[0m  0.

     32       11.9568  0.1340
     33       11.9568  0.1270
     34       11.9568  0.1230
     35       11.9568  0.1300
     36       11.9568  0.1280
     37       11.9568  0.1320
     38       11.9568  0.1340
     39       11.9568  0.1280
     40       11.9568  0.1300
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5730[0m  0.1280
      2        [36m1.3877[0m  0.1240
      3        [36m1.3877[0m  0.1220
      4        [36m1.3877[0m  0.1280
      5        [36m1.3877[0m  0.1220
      6        [36m1.3877[0m  0.1150
      7        [36m1.3877[0m  0.1220
      8        [36m1.3877[0m  0.1180
      9        [36m1.3877[0m  0.1190
     10        [36m1.3876[0m  0.1210
     11        [36m1.3876[0m  0.1254
     12        [36m1.3876[0m  0.1250
     13        [36m1.3876[0m  0.1300
     14        [36m1.3876[0m  0.1220
     15        [36m1.3876[0m  0.1200
     16        [36m1.3876[0m  0.1220
     17        [36m1.3876[0m  0.1270
     18

     25        [36m1.3867[0m  0.1270
     26        [36m1.3809[0m  0.1180
     27        1.3869  0.1200
     28        1.3869  0.1190
     29        1.3869  0.1190
     30        1.3869  0.1220
     31        1.3869  0.1220
     32        1.3869  0.1240
     33        1.3869  0.1270
     34        1.3869  0.1270
     35        1.3869  0.1210
     36        1.3869  0.1200
     37        1.3869  0.1200
     38        1.3869  0.1140
     39        1.3869  0.1270
     40        1.3869  0.1210
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5532[0m  0.1190
      2        [36m1.3869[0m  0.1240
      3        1.3869  0.1180
      4        1.3869  0.1290
      5        1.3869  0.1250
      6        1.3869  0.1160
      7        1.3869  0.1240
      8        1.3869  0.1200
      9        1.3869  0.1180
     10        1.3869  0.1210
     11        1.3869  0.1220
     12        1.3869  0.1220
     13        1.3869  0.1230
     14        1.3869  0.1270
    

     40        1.3868  0.1210
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9177[0m  0.1240
      2       11.9589  0.1190
      3       11.9589  0.1250
      4       11.9589  0.1240
      5       11.9589  0.1310
      6       11.9589  0.1250
      7       11.9589  0.1240
      8       11.9589  0.1240
      9       11.9589  0.1180
     10       11.9589  0.1260
     11       11.9589  0.1260
     12       11.9589  0.1250
     13       11.9589  0.1300
     14       11.9589  0.1190
     15       11.9589  0.1220
     16       11.9589  0.1260
     17       11.9589  0.1290
     18       11.9589  0.1260
     19       11.9589  0.1280
     20       11.9589  0.1180
     21       11.9589  0.1200
     22       11.9589  0.1340
     23       11.9589  0.1200
     24       11.9589  0.1240
     25       11.9589  0.1180
     26       11.9589  0.1280
     27       11.9589  0.1190
     28       11.9589  0.1250
     29       11.9589  0.1160
     30       11.9589  0.1260
 

      7        1.3913  0.1210
      8        1.3913  0.1250
      9        1.3913  0.1150
     10        1.3913  0.1190
     11        1.3913  0.1200
     12        1.3913  0.1240
     13        1.3913  0.1200
     14        1.3913  0.1180
     15        1.3913  0.1210
     16        1.3913  0.1150
     17        1.3913  0.1200
     18        1.3913  0.1180
     19        1.3913  0.1190
     20        1.3913  0.1240
     21        1.3913  0.1210
     22        1.3913  0.1190
     23        1.3913  0.1210
     24        1.3913  0.1290
     25        1.3913  0.1260
     26        1.3913  0.1180
     27        1.3913  0.1210
     28        1.3913  0.1270
     29        1.3913  0.1260
     30        1.3913  0.1170
     31        1.3913  0.1180
     32        1.3913  0.1320
     33        1.3913  0.1190
     34        1.3913  0.1240
     35        1.3913  0.1150
     36        1.3913  0.1140
     37        1.3913  0.1170
     38        1.3913  0.1190
     39        1.3913  0.1260
     40   

     18        1.3904  0.1200
     19        1.3904  0.1250
     20        1.3904  0.1160
     21        1.3904  0.1240
     22        1.3904  0.1260
     23        1.3904  0.1320
     24        1.3904  0.1240
     25        1.3904  0.1180
     26        1.3904  0.1190
     27        1.3904  0.1250
     28        1.3904  0.1270
     29        1.3904  0.1260
     30        1.3904  0.1280
     31        1.3904  0.1290
     32        1.3904  0.1170
     33        1.3904  0.1270
     34        1.3904  0.1300
     35        1.3904  0.1270
     36        1.3904  0.1270
     37        1.3904  0.1220
     38        1.3904  0.1240
     39        1.3904  0.1300
     40        1.3904  0.1270
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m8.5859[0m  0.1210
      2        [36m5.1088[0m  0.1240
      3        6.0838  0.1200
      4        7.8348  0.1200
      5        8.0547  0.1240
      6        [36m2.3126[0m  0.1320
      7       10.2377  0.1170
      8      

      7        [36m0.9820[0m  0.1340
      8        [36m0.9644[0m  0.1370
      9        [36m0.9529[0m  0.1250
     10        [36m0.9395[0m  0.1260
     11        [36m0.9325[0m  0.1240
     12        [36m0.9198[0m  0.1280
     13        [36m0.9165[0m  0.1250
     14        0.9184  0.1210
     15        [36m0.9114[0m  0.1230
     16        [36m0.9110[0m  0.1260
     17        0.9132  0.1250
     18        [36m0.9024[0m  0.1270
     19        0.9070  0.1260
     20        [36m0.9018[0m  0.1240
     21        [36m0.8939[0m  0.1280
     22        [36m0.8896[0m  0.1507
     23        [36m0.8860[0m  0.1694
     24        0.8940  0.1840
     25        [36m0.8838[0m  0.1670
     26        [36m0.8813[0m  0.1460
     27        [36m0.8794[0m  0.1430
     28        0.8869  0.1420
     29        0.8854  0.1440
     30        [36m0.8763[0m  0.1430
     31        [36m0.8724[0m  0.1380
     32        0.8819  0.1330
     33        [36m0.8667[0m  0.1280
     34   

     26        [36m1.0033[0m  0.1360
     27        [36m0.9989[0m  0.1320
     28        [36m0.9975[0m  0.1280
     29        [36m0.9946[0m  0.1360
     30        0.9960  0.1390
     31        [36m0.9918[0m  0.1350
     32        [36m0.9883[0m  0.1300
     33        [36m0.9845[0m  0.1300
     34        0.9867  0.1230
     35        0.9848  0.1270
     36        0.9856  0.1180
     37        [36m0.9822[0m  0.1310
     38        [36m0.9818[0m  0.1290
     39        [36m0.9796[0m  0.1370
     40        [36m0.9788[0m  0.1410
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.3579[0m  0.1440
      2        [36m1.2019[0m  0.1410
      3        [36m1.1582[0m  0.1340
      4        [36m1.1119[0m  0.1370
      5        [36m1.0916[0m  0.1340
      6        [36m1.0772[0m  0.1220
      7        [36m1.0675[0m  0.1220
      8        [36m1.0516[0m  0.1320
      9        [36m1.0463[0m  0.1250
     10        1.0515  0.1270
     11   

      7        0.9753  0.1220
      8        [36m0.9673[0m  0.1190
      9        [36m0.9638[0m  0.1250
     10        0.9725  0.1260
     11        [36m0.9622[0m  0.1270
     12        0.9667  0.1290
     13        0.9637  0.1300
     14        [36m0.9606[0m  0.1260
     15        [36m0.9593[0m  0.1190
     16        0.9605  0.1280
     17        0.9651  0.1280
     18        0.9625  0.1250
     19        [36m0.9570[0m  0.1400
     20        0.9612  0.1240
     21        0.9605  0.1280
     22        0.9625  0.1320
     23        0.9590  0.1300
     24        0.9624  0.1270
     25        0.9613  0.1390
     26        0.9583  0.1350
     27        0.9611  0.1250
     28        0.9594  0.1160
     29        0.9614  0.1180
     30        0.9596  0.1410
     31        0.9601  0.1290
     32        0.9590  0.1420
     33        0.9608  0.1360
     34        0.9592  0.1280
     35        0.9600  0.1270
     36        0.9628  0.1230
     37        0.9580  0.1380
     38        0

     40        [36m1.3870[0m  0.1180
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9564[0m  0.1284
      2       11.9589  0.1480
      3       11.9589  0.1400
      4       11.9589  0.1290
      5       11.9589  0.1350
      6       11.9589  0.1260
      7       11.9589  0.1340
      8       11.9966  0.1250
      9       11.9568  0.1380
     10       11.9568  0.1330
     11       11.9568  0.1280
     12        [36m8.4714[0m  0.1370
     13        [36m1.3867[0m  0.1290
     14        1.3869  0.1230
     15        1.3869  0.1280
     16        1.3869  0.1230
     17        1.3869  0.1210
     18        1.3869  0.1160
     19        1.3869  0.1270
     20        1.3869  0.1250
     21        1.3869  0.1200
     22        1.3869  0.1280
     23        1.3869  0.1280
     24        1.3869  0.1230
     25        1.3869  0.1240
     26        1.3869  0.1240
     27        1.3869  0.1260
     28        1.3869  0.1330
     29        1.3869  0.1250
    

      2        [36m1.3878[0m  0.1230
      3        [36m1.3868[0m  0.1240
      4        [36m1.3868[0m  0.1260
      5        [36m1.3868[0m  0.1220
      6        [36m1.3868[0m  0.1210
      7        1.3868  0.1280
      8        1.3868  0.1250
      9        1.3868  0.1220
     10        1.3868  0.1260
     11        1.3868  0.1260
     12        1.3868  0.1160
     13        1.3868  0.1240
     14        1.3868  0.1280
     15        1.3868  0.1210
     16        1.3868  0.1230
     17        1.3868  0.1250
     18        1.3868  0.1190
     19        1.3868  0.1280
     20        1.3868  0.1220
     21        1.3868  0.1260
     22        1.3868  0.1240
     23        1.3868  0.1260
     24        1.3868  0.1270
     25        1.3868  0.1240
     26        1.3868  0.1190
     27        1.3868  0.1320
     28        1.3868  0.1220
     29        1.3868  0.1250
     30        1.3868  0.1240
     31        1.3868  0.1310
     32        1.3868  0.1428
     33        1.3868  0.

     16       11.9547  0.1300
     17       11.9547  0.1410
     18       11.9547  0.1250
     19       11.9547  0.1250
     20       11.9547  0.1310
     21       11.9547  0.1290
     22       11.9547  0.1360
     23       11.9547  0.1310
     24       11.9547  0.1280
     25       11.9547  0.1400
     26       11.9547  0.1350
     27       11.9547  0.1320
     28       11.9547  0.1210
     29       11.9547  0.1210
     30       11.9547  0.1240
     31       11.9547  0.1410
     32       [36m10.5299[0m  0.1230
     33        [36m1.3920[0m  0.1200
     34        [36m1.3911[0m  0.1250
     35        [36m1.3911[0m  0.1250
     36        1.3911  0.1240
     37        1.3911  0.1280
     38        [36m1.3911[0m  0.1230
     39        1.3911  0.1200
     40        1.3911  0.1300
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8988[0m  0.1340
      2       11.9568  0.1370
      3       11.9568  0.1220
      4       11.9568  0.1340
      5       11

     26        1.3910  0.1350
     27        1.3910  0.1260
     28        1.3910  0.1280
     29        1.3910  0.1300
     30        1.3910  0.1170
     31        1.3910  0.1260
     32        1.3910  0.1200
     33        1.3910  0.1280
     34        1.3910  0.1240
     35        1.3910  0.1230
     36        1.3910  0.1220
     37        1.3910  0.1350
     38        1.3910  0.1250
     39        1.3910  0.1200
     40        1.3910  0.1200
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.0156[0m  0.1360
      2        [36m1.3918[0m  0.1380
      3        1.3920  0.1230
      4        1.3920  0.1210
      5        1.3920  0.1230
      6        1.3920  0.1340
      7        1.3920  0.1180
      8        1.3920  0.1200
      9        1.3920  0.1250
     10        1.3920  0.1300
     11        1.3920  0.1280
     12        1.3920  0.1170
     13        1.3920  0.1250
     14        1.3920  0.1200
     15        1.3920  0.1330
     16        1.3920 

     39        1.3905  0.1360
     40        1.3905  0.1310
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.2528[0m  0.1350
      2        [36m1.0406[0m  0.1300
      3        [36m0.9952[0m  0.1240
      4        [36m0.9720[0m  0.1210
      5        [36m0.9477[0m  0.1350
      6        [36m0.9403[0m  0.1290
      7        [36m0.9313[0m  0.1340
      8        [36m0.9293[0m  0.1290
      9        [36m0.9225[0m  0.1340
     10        [36m0.9159[0m  0.1270
     11        0.9180  0.1270
     12        0.9257  0.1280
     13        0.9286  0.1370
     14        0.9169  0.1380
     15        [36m0.9147[0m  0.1280
     16        [36m0.9077[0m  0.1300
     17        [36m0.9020[0m  0.1260
     18        [36m0.8976[0m  0.1270
     19        [36m0.8973[0m  0.1280
     20        [36m0.8900[0m  0.1180
     21        0.8917  0.1230
     22        0.8937  0.1280
     23        [36m0.8872[0m  0.1260
     24        [36m0.8868[0m  0.120

     14        [36m0.9157[0m  0.1340
     15        0.9244  0.1220
     16        0.9294  0.1200
     17        [36m0.9092[0m  0.1160
     18        [36m0.9027[0m  0.1300
     19        0.9028  0.1310
     20        [36m0.9022[0m  0.1340
     21        [36m0.8980[0m  0.1350
     22        0.9051  0.1240
     23        0.8980  0.1250
     24        0.9087  0.1200
     25        0.9051  0.1270
     26        [36m0.8954[0m  0.1220
     27        0.9022  0.1220
     28        0.9047  0.1270
     29        0.9001  0.1290
     30        0.8986  0.1240
     31        0.8976  0.1260
     32        [36m0.8932[0m  0.1330
     33        [36m0.8906[0m  0.1260
     34        0.8916  0.1220
     35        [36m0.8861[0m  0.1370
     36        [36m0.8854[0m  0.1190
     37        0.8871  0.1270
     38        [36m0.8852[0m  0.1240
     39        [36m0.8814[0m  0.1350
     40        0.8845  0.1290
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.

      2        [36m1.0824[0m  0.1220
      3        [36m1.0376[0m  0.1270
      4        1.0391  0.1320
      5        [36m1.0196[0m  0.1250
      6        [36m1.0034[0m  0.1300
      7        [36m0.9997[0m  0.1280
      8        1.0109  0.1200
      9        1.0044  0.1180
     10        1.0050  0.1240
     11        [36m0.9985[0m  0.1290
     12        [36m0.9924[0m  0.1230
     13        [36m0.9892[0m  0.1260
     14        0.9946  0.1190
     15        0.9929  0.1320
     16        [36m0.9866[0m  0.1180
     17        0.9919  0.1280
     18        0.9871  0.1240
     19        0.9892  0.1220
     20        0.9911  0.1210
     21        0.9899  0.1210
     22        0.9877  0.1200
     23        0.9896  0.1240
     24        0.9890  0.1320
     25        0.9873  0.1290
     26        0.9899  0.1300
     27        0.9888  0.1270
     28        0.9893  0.1200
     29        [36m0.9858[0m  0.1200
     30        0.9910  0.1300
     31        0.9868  0.1290
     32   

      8       11.9568  0.1280
      9       11.9568  0.1300
     10       11.9568  0.1270
     11       11.9568  0.1350
     12       11.9568  0.1240
     13       11.9568  0.1430
     14       11.9568  0.1520
     15       11.9568  0.1340
     16       11.9568  0.1360
     17       11.9568  0.1260
     18       11.9568  0.1270
     19       11.9568  0.1290
     20       11.9568  0.1250
     21       11.9568  0.1280
     22       11.9568  0.1250
     23       11.9568  0.1270
     24       11.9568  0.1310
     25       11.9568  0.1270
     26       11.9568  0.1280
     27       11.9568  0.1260
     28       11.9568  0.1230
     29       11.9568  0.1390
     30       11.9568  0.1390
     31       11.9568  0.1320
     32       11.9568  0.1330
     33       11.9568  0.1330
     34       11.9568  0.1350
     35       11.9568  0.1430
     36       11.9568  0.1300
     37       11.9568  0.1280
     38       11.9568  0.1370
     39       11.9568  0.1440
     40       11.9568  0.1350
  epoch   

     22        [36m1.3869[0m  0.1260
     23        [36m1.3869[0m  0.1190
     24        [36m1.3869[0m  0.1330
     25        [36m1.3869[0m  0.1220
     26        [36m1.3869[0m  0.1220
     27        [36m1.3869[0m  0.1260
     28        [36m1.3869[0m  0.1430
     29        [36m1.3869[0m  0.1330
     30        [36m1.3869[0m  0.1370
     31        [36m1.3869[0m  0.1360
     32        [36m1.3869[0m  0.1300
     33        [36m1.3869[0m  0.1250
     34        [36m1.3869[0m  0.1340
     35        [36m1.3869[0m  0.1320
     36        [36m1.3869[0m  0.1270
     37        [36m1.3869[0m  0.1340
     38        [36m1.3869[0m  0.1350
     39        1.3869  0.1350
     40        [36m1.3869[0m  0.1530
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5514[0m  0.1590
      2        [36m1.3869[0m  0.1380
      3        1.3869  0.1400
      4        1.3869  0.1390
      5        1.3869  0.1390
      6        1.3869  0.1320
      7   

     32        1.3868  0.1180
     33        1.3868  0.1370
     34        1.3868  0.1400
     35        1.3868  0.1290
     36        1.3868  0.1420
     37        1.3868  0.1320
     38        1.3868  0.1300
     39        1.3868  0.1290
     40        1.3868  0.1390
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9767[0m  0.1310
      2       [36m11.9589[0m  0.1340
      3       11.9589  0.1310
      4       11.9589  0.1480
      5       11.9589  0.1270
      6       11.9589  0.1260
      7       11.9589  0.1280
      8       11.9589  0.1360
      9       11.9589  0.1290
     10       11.9589  0.1240
     11       11.9589  0.1270
     12       11.9589  0.1270
     13       11.9589  0.1270
     14       11.9589  0.1240
     15       11.9589  0.1300
     16       11.9589  0.1260
     17       11.9589  0.1610
     18       11.9589  0.1310
     19       11.9589  0.1360
     20       11.9589  0.1370
     21       11.9589  0.1340
     22       11.9589 

      4        [36m9.2128[0m  0.1300
      5        [36m1.3913[0m  0.1320
      6        1.3913  0.1340
      7        1.3913  0.1190
      8        1.3913  0.1260
      9        1.3913  0.1300
     10        1.3913  0.1470
     11        1.3913  0.1260
     12        1.3913  0.1300
     13        1.3913  0.1510
     14        1.3913  0.1420
     15        1.3913  0.1350
     16        1.3913  0.1300
     17        1.3913  0.1360
     18        1.3913  0.1320
     19        1.3913  0.1300
     20        1.3913  0.1230
     21        1.3913  0.1450
     22        1.3913  0.1350
     23        1.3913  0.1360
     24        1.3913  0.1320
     25        1.3913  0.1340
     26        1.3913  0.1370
     27        1.3913  0.1340
     28        1.3913  0.1270
     29        1.3913  0.1250
     30        1.3913  0.1290
     31        1.3913  0.1280
     32        1.3913  0.1300
     33        1.3913  0.1470
     34        1.3913  0.1290
     35        1.3913  0.1500
     36        1.3913 

     16        1.3904  0.1330
     17        1.3904  0.1200
     18        1.3904  0.1250
     19        1.3904  0.1200
     20        1.3904  0.1210
     21        1.3904  0.1230
     22        1.3904  0.1210
     23        1.3904  0.1230
     24        1.3904  0.1390
     25        1.3904  0.1240
     26        1.3904  0.1260
     27        1.3904  0.1300
     28        1.3904  0.1270
     29        1.3904  0.1210
     30        1.3904  0.1320
     31        1.3904  0.1190
     32        1.3904  0.1250
     33        1.3904  0.1280
     34        1.3904  0.1240
     35        1.3904  0.1350
     36        1.3904  0.1260
     37        1.3904  0.1270
     38        1.3904  0.1240
     39        1.3904  0.1260
     40        1.3904  0.1330
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m5.3060[0m  0.1350
      2        [36m3.8023[0m  0.1340
      3        [36m1.3902[0m  0.1240
      4        1.3903  0.1250
      5        1.3903  0.1240
      6      

     26        [36m0.9477[0m  0.1240
     27        [36m0.9442[0m  0.1150
     28        [36m0.9375[0m  0.1180
     29        0.9486  0.1170
     30        [36m0.9274[0m  0.1170
     31        0.9326  0.1230
     32        [36m0.9272[0m  0.1300
     33        0.9318  0.1230
     34        0.9298  0.1250
     35        0.9280  0.1260
     36        0.9335  0.1280
     37        [36m0.9247[0m  0.1350
     38        0.9258  0.1190
     39        [36m0.9224[0m  0.1250
     40        0.9234  0.1190
     41        0.9241  0.1360
     42        0.9239  0.1220
     43        0.9241  0.1280
     44        0.9244  0.1240
     45        0.9247  0.1230
     46        0.9232  0.1200
     47        [36m0.9214[0m  0.1260
     48        0.9221  0.1490
     49        [36m0.9214[0m  0.1260
     50        0.9218  0.1230
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5405[0m  0.1200
      2        [36m1.4012[0m  0.1310
      3        [36m1.3948[0m 

     48        [36m1.3864[0m  0.1180
     49        [36m1.3864[0m  0.1250
     50        [36m1.3864[0m  0.1230
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5094[0m  0.1320
      2        [36m1.3898[0m  0.1330
      3        [36m1.3879[0m  0.1280
      4        [36m1.3871[0m  0.1320
      5        [36m1.3867[0m  0.1190
      6        [36m1.3865[0m  0.1170
      7        [36m1.3864[0m  0.1240
      8        [36m1.3864[0m  0.1290
      9        [36m1.3864[0m  0.1230
     10        [36m1.3864[0m  0.1360
     11        [36m1.3864[0m  0.1330
     12        [36m1.3864[0m  0.1220
     13        1.3864  0.1260
     14        [36m1.3864[0m  0.1180
     15        [36m1.3863[0m  0.1250
     16        [36m1.3863[0m  0.1230
     17        1.3864  0.1190
     18        1.3863  0.1290
     19        1.3863  0.1310
     20        1.3863  0.1280
     21        1.3864  0.1230
     22        1.3864  0.1250
     23        1.3863  0.129

     27        [36m1.3864[0m  0.1280
     28        [36m1.3864[0m  0.1250
     29        1.3864  0.1210
     30        1.3864  0.1260
     31        1.3864  0.1270
     32        1.3864  0.1240
     33        1.3864  0.1250
     34        1.3864  0.1280
     35        1.3864  0.1220
     36        1.3864  0.1260
     37        1.3864  0.1230
     38        1.3864  0.1290
     39        1.3864  0.1250
     40        1.3864  0.1230
     41        1.3864  0.1290
     42        1.3864  0.1250
     43        1.3864  0.1210
     44        1.3864  0.1300
     45        1.3864  0.1190
     46        1.3864  0.1220
     47        [36m1.3864[0m  0.1210
     48        1.3864  0.1220
     49        1.3864  0.1240
     50        1.3864  0.1240
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4197[0m  0.1200
      2        [36m1.3920[0m  0.1260
      3        [36m1.3890[0m  0.1220
      4        [36m1.3879[0m  0.1370
      5        [36m1.3873[0m  0.127

     48        [36m1.3869[0m  0.1380
     49        [36m1.3869[0m  0.1350
     50        [36m1.3869[0m  0.1330
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.3929[0m  0.1310
      2        [36m1.3869[0m  0.1270
      3        [36m1.3868[0m  0.1400
      4        [36m1.3868[0m  0.1260
      5        [36m1.3868[0m  0.1190
      6        [36m1.3868[0m  0.1360
      7        [36m1.3867[0m  0.1380
      8        [36m1.3867[0m  0.1380
      9        [36m1.3867[0m  0.1260
     10        [36m1.3867[0m  0.1260
     11        1.3867  0.1280
     12        1.3867  0.1300
     13        [36m1.3867[0m  0.1390
     14        1.3867  0.1340
     15        [36m1.3866[0m  0.1240
     16        [36m1.3866[0m  0.1270
     17        [36m1.3866[0m  0.1570
     18        [36m1.3866[0m  0.1280
     19        [36m1.3866[0m  0.1260
     20        1.3866  0.1290
     21        [36m1.3866[0m  0.1380
     22        [36m1.3866[0m  0.1280
 

     28        [36m1.3869[0m  0.1320
     29        [36m1.3869[0m  0.1230
     30        [36m1.3869[0m  0.1280
     31        [36m1.3869[0m  0.1290
     32        [36m1.3869[0m  0.1240
     33        [36m1.3869[0m  0.1360
     34        1.3869  0.1280
     35        1.3869  0.1260
     36        1.3869  0.1250
     37        1.3869  0.1290
     38        1.3869  0.1320
     39        1.3869  0.1340
     40        1.3869  0.1290
     41        1.3869  0.1320
     42        1.3869  0.1230
     43        1.3869  0.1240
     44        1.3869  0.1330
     45        1.3869  0.1280
     46        1.3869  0.1300
     47        1.3869  0.1470
     48        1.3869  0.1320
     49        1.3869  0.1290
     50        1.3869  0.1320
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m10.0918[0m  0.1260
      2        [36m1.3818[0m  0.1290
      3        1.3869  0.1330
      4        1.3869  0.1380
      5        1.3869  0.1310
      6        1.3869  0.130

      9        1.3868  0.1300
     10        1.3868  0.1200
     11        1.3868  0.1280
     12        1.3868  0.1290
     13        1.3868  0.1240
     14        1.3868  0.1260
     15        1.3868  0.1250
     16        1.3868  0.1270
     17        1.3868  0.1290
     18        1.3868  0.1280
     19        1.3868  0.1270
     20        1.3868  0.1290
     21        1.3868  0.1220
     22        1.3868  0.1250
     23        1.3868  0.1320
     24        1.3868  0.1320
     25        1.3868  0.1290
     26        1.3868  0.1250
     27        1.3868  0.1340
     28        1.3868  0.1200
     29        1.3868  0.1250
     30        1.3868  0.1310
     31        1.3868  0.1320
     32        1.3868  0.1340
     33        1.3868  0.1840
     34        1.3868  0.1320
     35        1.3868  0.1340
     36        1.3868  0.1310
     37        1.3868  0.1250
     38        1.3868  0.1330
     39        1.3868  0.1540
     40        1.3868  0.1370
     41        1.3868  0.1340
     42   

     15        1.3901  0.1310
     16        1.3901  0.1310
     17        1.3901  0.1250
     18        1.3901  0.1190
     19        [36m1.3901[0m  0.1220
     20        1.3901  0.1220
     21        1.3901  0.1220
     22        1.3901  0.1180
     23        1.3901  0.1170
     24        1.3901  0.1350
     25        1.3901  0.1210
     26        1.3901  0.1260
     27        1.3901  0.1140
     28        1.3901  0.1220
     29        [36m1.3901[0m  0.1280
     30        1.3901  0.1210
     31        1.3901  0.1230
     32        1.3901  0.1220
     33        1.3901  0.1180
     34        1.3901  0.1320
     35        1.3901  0.1180
     36        1.3901  0.1130
     37        1.3901  0.1170
     38        1.3901  0.1200
     39        [36m1.3901[0m  0.1140
     40        1.3901  0.1200
     41        1.3901  0.1230
     42        1.3901  0.1300
     43        1.3901  0.1200
     44        1.3901  0.1160
     45        1.3901  0.1190
     46        1.3901  0.1220
     47      

     21        1.3900  0.1250
     22        1.3900  0.1230
     23        1.3900  0.1150
     24        1.3900  0.1300
     25        1.3900  0.1270
     26        [36m1.3900[0m  0.1200
     27        1.3900  0.1190
     28        1.3900  0.1180
     29        1.3900  0.1220
     30        1.3900  0.1170
     31        1.3900  0.1160
     32        1.3900  0.1180
     33        1.3900  0.1160
     34        1.3900  0.1170
     35        1.3900  0.1210
     36        1.3900  0.1210
     37        1.3900  0.1240
     38        1.3900  0.1200
     39        1.3900  0.1180
     40        1.3900  0.1260
     41        1.3900  0.1240
     42        1.3900  0.1160
     43        1.3900  0.1290
     44        1.3900  0.1250
     45        1.3900  0.1300
     46        1.3900  0.1210
     47        1.3900  0.1180
     48        1.3900  0.1200
     49        1.3900  0.1180
     50        1.3900  0.1260
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4171[0m 

     27        1.3894  0.1240
     28        1.3894  0.1280
     29        1.3894  0.1220
     30        1.3894  0.1350
     31        1.3894  0.1220
     32        1.3894  0.1250
     33        1.3894  0.1210
     34        1.3894  0.1170
     35        1.3894  0.1240
     36        1.3894  0.1140
     37        1.3894  0.1190
     38        1.3894  0.1210
     39        1.3894  0.1180
     40        1.3894  0.1170
     41        1.3894  0.1250
     42        1.3894  0.1160
     43        1.3894  0.1350
     44        1.3894  0.1160
     45        1.3894  0.1240
     46        1.3894  0.1230
     47        1.3894  0.1240
     48        1.3894  0.1230
     49        1.3894  0.1240
     50        1.3894  0.1170
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4036[0m  0.1560
      2        [36m1.3913[0m  0.1290
      3        1.3913  0.1260
      4        1.3913  0.1320
      5        1.3913  0.1180
      6        1.3913  0.1300
      7        1.3913 

     29        [36m1.3863[0m  0.1280
     30        [36m1.3863[0m  0.1400
     31        [36m1.3863[0m  0.1220
     32        [36m1.3863[0m  0.1180
     33        [36m1.3863[0m  0.1190
     34        [36m1.3863[0m  0.1230
     35        1.3863  0.1290
     36        1.3863  0.1280
     37        [36m1.3863[0m  0.1200
     38        [36m1.3863[0m  0.1230
     39        [36m1.3863[0m  0.1280
     40        [36m1.3863[0m  0.1210
     41        [36m1.3863[0m  0.1340
     42        [36m1.3863[0m  0.1360
     43        [36m1.3863[0m  0.1300
     44        [36m1.3863[0m  0.1300
     45        [36m1.3863[0m  0.1330
     46        [36m1.3863[0m  0.1370
     47        [36m1.3863[0m  0.1390
     48        [36m1.3863[0m  0.1620
     49        [36m1.3863[0m  0.1850
     50        [36m1.3863[0m  0.1400
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7151[0m  0.1370
      2        [36m1.3441[0m  0.1340
      3        [36m1.

      4        [36m1.3546[0m  0.1390
      5        [36m1.2982[0m  0.1350
      6        [36m1.2395[0m  0.1280
      7        [36m1.1760[0m  0.1330
      8        [36m1.1463[0m  0.1340
      9        [36m1.1422[0m  0.1370
     10        [36m1.0931[0m  0.1370
     11        [36m1.0556[0m  0.1390
     12        [36m1.0412[0m  0.1360
     13        [36m1.0326[0m  0.1380
     14        [36m1.0201[0m  0.1310
     15        1.0351  0.1350
     16        1.0297  0.1390
     17        [36m0.9984[0m  0.1300
     18        1.0171  0.1360
     19        1.0029  0.1290
     20        [36m0.9917[0m  0.1450
     21        [36m0.9836[0m  0.1340
     22        1.0275  0.1300
     23        0.9890  0.1350
     24        0.9858  0.1380
     25        1.0061  0.1300
     26        0.9961  0.1290
     27        1.0076  0.1290
     28        0.9929  0.1330
     29        [36m0.9745[0m  0.1260
     30        0.9902  0.1380
     31        0.9919  0.1340
     32        0.9783  0.

     33        1.3863  0.1150
     34        1.3863  0.1160
     35        1.3863  0.1370
     36        1.3863  0.1360
     37        1.3863  0.1200
     38        1.3863  0.1250
     39        1.3863  0.1350
     40        1.3863  0.1380
     41        1.3863  0.1340
     42        1.3863  0.1390
     43        1.3863  0.1290
     44        [36m1.3814[0m  0.1310
     45        [36m1.3246[0m  0.1330
     46        [36m1.2309[0m  0.1340
     47        [36m1.1774[0m  0.1260
     48        [36m1.1376[0m  0.1170
     49        [36m1.0976[0m  0.1260
     50        [36m1.0844[0m  0.1330
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4335[0m  0.1270
      2        [36m1.2837[0m  0.1280
      3        [36m1.1962[0m  0.1200
      4        [36m1.1058[0m  0.1280
      5        [36m1.0541[0m  0.1220
      6        [36m1.0239[0m  0.1350
      7        [36m1.0065[0m  0.1230
      8        [36m0.9958[0m  0.1220
      9        [36m0.989

     20        0.9775  0.1280
     21        0.9780  0.1230
     22        0.9704  0.1145
     23        0.9813  0.1220
     24        0.9735  0.1170
     25        0.9795  0.1300
     26        0.9747  0.1280
     27        0.9723  0.1220
     28        0.9731  0.1300
     29        0.9734  0.1190
     30        0.9727  0.1260
     31        0.9743  0.1220
     32        [36m0.9679[0m  0.1250
     33        0.9811  0.1250
     34        0.9728  0.1280
     35        0.9783  0.1270
     36        0.9733  0.1280
     37        0.9786  0.1240
     38        0.9680  0.1270
     39        0.9729  0.1230
     40        0.9756  0.1210
     41        0.9701  0.1210
     42        0.9722  0.1310
     43        0.9726  0.1140
     44        0.9753  0.1190
     45        0.9727  0.1230
     46        0.9701  0.1300
     47        0.9737  0.1160
     48        0.9707  0.1220
     49        0.9771  0.1250
     50        0.9725  0.1190
  epoch    train_loss     dur
-------  ------------  ------
 

      2        [36m1.3871[0m  0.1290
      3        [36m1.3871[0m  0.1240
      4        [36m1.3871[0m  0.1260
      5        [36m1.3870[0m  0.1200
      6        [36m1.3870[0m  0.1350
      7        [36m1.3870[0m  0.1240
      8        [36m1.3870[0m  0.1250
      9        [36m1.3870[0m  0.1220
     10        [36m1.3870[0m  0.1330
     11        [36m1.3870[0m  0.1270
     12        [36m1.3870[0m  0.1240
     13        [36m1.3870[0m  0.1250
     14        [36m1.3870[0m  0.1270
     15        [36m1.3870[0m  0.1190
     16        [36m1.3870[0m  0.1230
     17        [36m1.3870[0m  0.1190
     18        [36m1.3870[0m  0.1330
     19        [36m1.3870[0m  0.1230
     20        [36m1.3870[0m  0.1210
     21        [36m1.3870[0m  0.1240
     22        [36m1.3870[0m  0.1200
     23        [36m1.3870[0m  0.1680
     24        [36m1.3870[0m  0.1330
     25        [36m1.3870[0m  0.1350
     26        [36m1.3870[0m  0.1260
     27        [36m1.387

     38        1.3869  0.1230
     39        1.3869  0.1220
     40        1.3869  0.1170
     41        1.3869  0.1230
     42        1.3869  0.1150
     43        1.3869  0.1210
     44        1.3869  0.1350
     45        1.3869  0.1230
     46        1.3869  0.1320
     47        [36m1.3869[0m  0.1290
     48        [36m1.3865[0m  0.1230
     49        [36m1.3831[0m  0.1220
     50        [36m1.3787[0m  0.1240
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9103[0m  0.1250
      2       11.9568  0.1240
      3       11.9568  0.1190
      4       11.9568  0.1210
      5       11.9568  0.1220
      6        [36m5.6473[0m  0.1220
      7        [36m1.3874[0m  0.1210
      8        [36m1.3869[0m  0.1240
      9        1.3869  0.1270
     10        1.3869  0.1250
     11        1.3869  0.1220
     12        1.3869  0.1255
     13        1.3869  0.1300
     14        1.3869  0.1280
     15        [36m1.3869[0m  0.1190
     16        [36

     34        1.3869  0.1290
     35        1.3869  0.1240
     36        1.3869  0.1180
     37        1.3869  0.1210
     38        1.3869  0.1200
     39        1.3869  0.1160
     40        1.3869  0.1310
     41        1.3869  0.1230
     42        1.3869  0.1220
     43        1.3869  0.1250
     44        1.3869  0.1390
     45        1.3869  0.1270
     46        1.3869  0.1200
     47        1.3869  0.1220
     48        1.3869  0.1200
     49        1.3869  0.1170
     50        1.3869  0.1210
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4464[0m  0.1200
      2        [36m1.3868[0m  0.1230
      3        [36m1.3868[0m  0.1280
      4        [36m1.3868[0m  0.1290
      5        [36m1.3868[0m  0.1250
      6        [36m1.3868[0m  0.1210
      7        1.3868  0.1250
      8        1.3868  0.1210
      9        1.3868  0.1210
     10        1.3868  0.1250
     11        1.3868  0.1170
     12        1.3868  0.1210
     13        1

     37        1.3911  0.1290
     38        1.3911  0.1370
     39        1.3911  0.1310
     40        1.3911  0.1310
     41        1.3911  0.1420
     42        1.3911  0.1330
     43        1.3911  0.1340
     44        1.3911  0.1260
     45        1.3911  0.1350
     46        1.3911  0.1300
     47        1.3911  0.1290
     48        1.3911  0.1330
     49        1.3911  0.1290
     50        1.3911  0.1300
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8845[0m  0.1300
      2       11.9568  0.1300
      3       11.9568  0.1350
      4       11.9568  0.1230
      5       11.9568  0.1290
      6       11.9568  0.1400
      7       11.9568  0.1360
      8       11.9568  0.1350
      9       11.9568  0.1310
     10       11.9568  0.1250
     11       11.9568  0.1310
     12       11.9568  0.1300
     13       11.9568  0.1380
     14       11.9568  0.1310
     15       11.9568  0.1610
     16       11.9105  0.1290
     17       11.9568  0.1370
 

     43        1.3910  0.1200
     44        1.3910  0.1330
     45        1.3910  0.1250
     46        1.3910  0.1290
     47        1.3910  0.1260
     48        1.3910  0.1260
     49        1.3910  0.1230
     50        1.3910  0.1260
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5267[0m  0.1160
      2        [36m1.4536[0m  0.1330
      3        [36m1.3920[0m  0.1260
      4        [36m1.3920[0m  0.1150
      5        [36m1.3920[0m  0.1250
      6        [36m1.3920[0m  0.1210
      7        1.3920  0.1230
      8        1.3920  0.1150
      9        1.3920  0.1210
     10        1.3920  0.1230
     11        1.3920  0.1240
     12        1.3920  0.1220
     13        1.3920  0.1300
     14        1.3920  0.1180
     15        1.3920  0.1220
     16        1.3920  0.1250
     17        1.3920  0.1300
     18        1.3920  0.1270
     19        [36m1.3920[0m  0.1220
     20        1.3920  0.1290
     21        1.3920  0.1350
     22

     49        1.3903  0.1270
     50        1.3903  0.1320
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m7.8040[0m  0.1300
      2        [36m4.2037[0m  0.1310
      3        7.2431  0.1320
      4        7.4568  0.1290
      5        5.2434  0.1290
      6        6.5308  0.1320
      7        9.5042  0.1390
      8        6.7473  0.1290
      9        [36m1.3958[0m  0.1320
     10        [36m1.3904[0m  0.1380
     11        1.3905  0.1300
     12        1.3905  0.1230
     13        1.3905  0.1310
     14        1.3905  0.1320
     15        1.3905  0.1320
     16        1.3905  0.1310
     17        1.3905  0.1280
     18        1.3905  0.1300
     19        1.3905  0.1250
     20        1.3905  0.1260
     21        1.3905  0.1280
     22        1.3905  0.1340
     23        1.3905  0.1300
     24        1.3905  0.1320
     25        1.3905  0.1300
     26        1.3905  0.1270
     27        1.3905  0.1310
     28        1.3905  0.1250
    

     29        [36m0.8900[0m  0.1290
     30        [36m0.8882[0m  0.1340
     31        [36m0.8862[0m  0.1280
     32        [36m0.8853[0m  0.1300
     33        0.8860  0.1340
     34        0.8856  0.1280
     35        0.8861  0.1230
     36        [36m0.8839[0m  0.1340
     37        [36m0.8824[0m  0.1370
     38        [36m0.8814[0m  0.1210
     39        [36m0.8798[0m  0.1260
     40        [36m0.8797[0m  0.1190
     41        0.8816  0.1240
     42        0.8809  0.1230
     43        [36m0.8796[0m  0.1230
     44        [36m0.8783[0m  0.1250
     45        0.8789  0.1210
     46        0.8800  0.1240
     47        0.8802  0.1270
     48        0.8823  0.1260
     49        0.8920  0.1290
     50        0.8876  0.1310
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5286[0m  0.1220
      2        [36m1.2935[0m  0.1250
      3        [36m1.1937[0m  0.1640
      4        [36m1.1010[0m  0.1320
      5        [36m1.032

     50        [36m0.9231[0m  0.1460
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4735[0m  0.1250
      2        [36m1.3474[0m  0.1410
      3        [36m1.2982[0m  0.1290
      4        [36m1.1903[0m  0.1320
      5        [36m1.1263[0m  0.1590
      6        [36m1.0827[0m  0.1420
      7        [36m1.0555[0m  0.1310
      8        [36m1.0525[0m  0.1370
      9        [36m1.0251[0m  0.1300
     10        [36m1.0150[0m  0.1370
     11        [36m1.0098[0m  0.1340
     12        [36m0.9980[0m  0.1320
     13        [36m0.9792[0m  0.1310
     14        [36m0.9775[0m  0.1340
     15        [36m0.9741[0m  0.1360
     16        0.9755  0.1260
     17        [36m0.9636[0m  0.1330
     18        0.9829  0.1300
     19        0.9647  0.1240
     20        [36m0.9636[0m  0.1290
     21        0.9727  0.1230
     22        [36m0.9521[0m  0.1290
     23        [36m0.9473[0m  0.1230
     24        [36m0.9459[0m  0.1290
 

     31        [36m0.9653[0m  0.1320
     32        0.9654  0.1310
     33        [36m0.9650[0m  0.1200
     34        0.9658  0.1220
     35        [36m0.9642[0m  0.1220
     36        0.9651  0.1800
     37        0.9652  0.1240
     38        0.9650  0.1260
     39        0.9651  0.1220
     40        0.9649  0.1190
     41        0.9648  0.1260
     42        0.9646  0.1280
     43        0.9649  0.1260
     44        0.9646  0.1250
     45        [36m0.9638[0m  0.1190
     46        0.9648  0.1340
     47        0.9640  0.1270
     48        0.9658  0.1240
     49        0.9641  0.1330
     50        0.9650  0.1290
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.8587[0m  0.1410
      2        [36m1.1702[0m  0.1230
      3        [36m1.0696[0m  0.1200
      4        [36m1.0322[0m  0.1210
      5        [36m1.0113[0m  0.1250
      6        [36m0.9949[0m  0.1400
      7        [36m0.9895[0m  0.1320
      8        [36m0.9726[0m 

     33        1.3868  0.1210
     34        1.3868  0.1260
     35        1.3868  0.1160
     36        1.3868  0.1280
     37        1.3868  0.1230
     38        1.3868  0.1280
     39        1.3868  0.1310
     40        1.3868  0.1150
     41        1.3868  0.1200
     42        1.3868  0.1300
     43        1.3868  0.1210
     44        1.3868  0.1200
     45        1.3868  0.1220
     46        1.3868  0.1220
     47        1.3868  0.1210
     48        1.3868  0.1200
     49        1.3868  0.1230
     50        1.3868  0.1280
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5424[0m  0.1230
      2        [36m1.3858[0m  0.1260
      3        1.3871  0.1180
      4        1.3871  0.1250
      5        1.3871  0.1330
      6        1.3871  0.1250
      7        1.3871  0.1300
      8        1.3871  0.1350
      9        1.3871  0.1380
     10        1.3871  0.1370
     11        1.3871  0.1360
     12        1.3871  0.1300
     13        1.3871 

     43        1.3868  0.1190
     44        1.3868  0.1270
     45        1.3868  0.1250
     46        1.3868  0.1290
     47        1.3868  0.1190
     48        1.3868  0.1230
     49        1.3868  0.1160
     50        1.3868  0.1150
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9127[0m  0.1270
      2       11.9568  0.1180
      3       11.9568  0.1330
      4       11.9568  0.1370
      5       11.9568  0.1300
      6       11.9568  0.1200
      7       11.9568  0.1260
      8       11.9568  0.1273
      9       11.9568  0.1230
     10       11.9568  0.1340
     11       11.9568  0.1250
     12       [36m10.5916[0m  0.1240
     13        [36m1.3870[0m  0.1230
     14        [36m1.3869[0m  0.1270
     15        [36m1.3869[0m  0.1170
     16        [36m1.3869[0m  0.1220
     17        1.3869  0.1210
     18        1.3869  0.1320
     19        [36m1.3869[0m  0.1230
     20        1.3869  0.1190
     21        1.3869  0.1180
     22

     50        1.3868  0.1190
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9136[0m  0.1270
      2        [36m4.9794[0m  0.1170
      3        [36m1.3868[0m  0.1190
      4        1.3869  0.1150
      5        1.3869  0.1180
      6        1.3869  0.1310
      7        1.3869  0.1180
      8        1.3869  0.1220
      9        1.3869  0.1170
     10        1.3869  0.1230
     11        1.3869  0.1220
     12        1.3869  0.1180
     13        1.3869  0.1210
     14        1.3869  0.1230
     15        1.3869  0.1260
     16        1.3869  0.1280
     17        1.3869  0.1190
     18        1.3869  0.1240
     19        1.3869  0.1180
     20        1.3869  0.1260
     21        1.3869  0.1340
     22        1.3869  0.1190
     23        1.3869  0.1150
     24        1.3869  0.1190
     25        1.3869  0.1180
     26        1.3869  0.1200
     27        1.3869  0.1160
     28        1.3869  0.1230
     29        1.3869  0.1190
     30      

      6       11.9568  0.1170
      7       11.9568  0.1210
      8       11.9568  0.1330
      9       11.9568  0.1250
     10       11.9568  0.1220
     11       11.9568  0.1200
     12       11.9568  0.1270
     13       11.9568  0.1180
     14       11.9568  0.1210
     15       11.9568  0.1370
     16       11.9568  0.1280
     17       11.9568  0.1340
     18       11.9568  0.1310
     19       11.9568  0.1340
     20       11.9568  0.1230
     21       11.9568  0.1280
     22        [36m7.7539[0m  0.1540
     23        [36m1.3912[0m  0.1350
     24        [36m1.3911[0m  0.1250
     25        [36m1.3911[0m  0.1190
     26        [36m1.3911[0m  0.1270
     27        1.3911  0.1340
     28        1.3911  0.1290
     29        [36m1.3911[0m  0.1200
     30        1.3911  0.1260
     31        1.3911  0.1330
     32        1.3911  0.1220
     33        [36m1.3911[0m  0.1300
     34        1.3911  0.1180
     35        1.3911  0.1200
     36        1.3911  0.1190
     37

     12        1.3910  0.1370
     13        1.3910  0.1380
     14        1.3910  0.1230
     15        1.3910  0.1300
     16        1.3910  0.1240
     17        1.3910  0.1270
     18        1.3910  0.1260
     19        1.3910  0.1360
     20        1.3910  0.1310
     21        1.3910  0.1290
     22        1.3910  0.1360
     23        1.3910  0.1250
     24        1.3910  0.1350
     25        1.3910  0.1310
     26        1.3910  0.1260
     27        1.3910  0.1360
     28        1.3910  0.1330
     29        1.3910  0.1370
     30        1.3910  0.1340
     31        1.3910  0.1330
     32        1.3910  0.1400
     33        1.3910  0.1430
     34        1.3910  0.1380
     35        1.3910  0.1240
     36        1.3910  0.1370
     37        1.3910  0.1380
     38        1.3910  0.1350
     39        1.3910  0.1380
     40        1.3910  0.1390
     41        1.3910  0.1330
     42        1.3910  0.1420
     43        1.3910  0.1400
     44        1.3910  0.1380
     45   

     16        1.3903  0.1180
     17        1.3903  0.1290
     18        1.3903  0.1230
     19        1.3903  0.1190
     20        1.3903  0.1220
     21        1.3903  0.1200
     22        1.3903  0.1220
     23        1.3903  0.1270
     24        1.3903  0.1250
     25        1.3903  0.1480
     26        1.3903  0.1290
     27        1.3903  0.1180
     28        1.3903  0.1180
     29        1.3903  0.1230
     30        1.3903  0.1340
     31        1.3903  0.1270
     32        1.3903  0.1250
     33        1.3903  0.1180
     34        1.3903  0.1250
     35        1.3903  0.1190
     36        1.3903  0.1160
     37        1.3903  0.1170
     38        1.3903  0.1160
     39        1.3903  0.1310
     40        1.3903  0.1200
     41        1.3903  0.1220
     42        1.3903  0.1370
     43        1.3903  0.1280
     44        1.3903  0.1260
     45        1.3903  0.1500
     46        1.3903  0.1330
     47        1.3903  0.1170
     48        1.3903  0.1220
     49   

      3        [36m0.9971[0m  0.1210
      4        [36m0.9686[0m  0.1280
      5        [36m0.9441[0m  0.1250
      6        [36m0.9336[0m  0.1260
      7        0.9339  0.1260
      8        [36m0.9291[0m  0.1210
      9        [36m0.9263[0m  0.1260
     10        0.9306  0.1220
     11        [36m0.9145[0m  0.1180
     12        [36m0.9140[0m  0.1190
     13        [36m0.9012[0m  0.1210
     14        [36m0.8972[0m  0.1180
     15        0.8973  0.1260
     16        0.8986  0.1220
     17        0.9022  0.1270
     18        0.9043  0.1200
     19        0.9003  0.1190
     20        [36m0.8892[0m  0.1160
     21        [36m0.8862[0m  0.1210
     22        [36m0.8859[0m  0.1250
     23        [36m0.8839[0m  0.1320
     24        [36m0.8825[0m  0.1220
     25        0.8841  0.1250
     26        0.8839  0.1520
     27        [36m0.8793[0m  0.1260
     28        0.8799  0.1210
     29        0.8821  0.1230
     30        [36m0.8746[0m  0.1290
     31

     26        0.8960  0.1300
     27        [36m0.8928[0m  0.1280
     28        0.8931  0.1200
     29        [36m0.8875[0m  0.1190
     30        0.8877  0.1260
     31        [36m0.8863[0m  0.1280
     32        0.8886  0.1190
     33        [36m0.8836[0m  0.1200
     34        0.8863  0.1180
     35        [36m0.8830[0m  0.1250
     36        [36m0.8796[0m  0.1200
     37        [36m0.8756[0m  0.1270
     38        0.8778  0.1260
     39        0.8800  0.1260
     40        0.8807  0.1180
     41        0.8790  0.1300
     42        0.8761  0.1280
     43        0.8787  0.1290
     44        0.8760  0.1270
     45        [36m0.8685[0m  0.1210
     46        0.8757  0.1260
     47        0.8747  0.1280
     48        0.8720  0.1240
     49        0.8703  0.1250
     50        0.8713  0.1210
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5104[0m  0.1330
      2        [36m1.2449[0m  0.1260
      3        [36m1.0980[0m  0.1200
 

      7        [36m0.9766[0m  0.1190
      8        [36m0.9759[0m  0.1230
      9        [36m0.9724[0m  0.1250
     10        [36m0.9706[0m  0.1190
     11        [36m0.9684[0m  0.1200
     12        0.9698  0.1220
     13        0.9695  0.1360
     14        [36m0.9666[0m  0.1180
     15        0.9690  0.1180
     16        0.9677  0.1310
     17        0.9672  0.1280
     18        0.9671  0.1230
     19        0.9666  0.1260
     20        0.9672  0.1170
     21        0.9668  0.1290
     22        [36m0.9663[0m  0.1250
     23        0.9665  0.1240
     24        0.9680  0.1190
     25        0.9664  0.1200
     26        0.9666  0.1240
     27        0.9665  0.1340
     28        0.9665  0.1226
     29        [36m0.9661[0m  0.1260
     30        0.9666  0.1260
     31        0.9668  0.1220
     32        0.9667  0.1210
     33        0.9667  0.1320
     34        0.9677  0.1210
     35        0.9662  0.1190
     36        [36m0.9659[0m  0.1200
     37        [36

      2       11.9568  0.1230
      3       11.9568  0.1250
      4       11.9568  0.1250
      5       11.9568  0.1280
      6       11.9568  0.1370
      7       11.9568  0.1210
      8       11.9568  0.1210
      9       11.9568  0.1220
     10       11.9568  0.1290
     11       11.9568  0.1200
     12       11.9568  0.1230
     13       11.9568  0.1280
     14       11.9568  0.1290
     15       11.9568  0.1340
     16       11.9568  0.1300
     17       11.9568  0.1340
     18       11.9568  0.1180
     19       11.9568  0.1280
     20       11.9568  0.1230
     21       11.9568  0.1280
     22       11.9568  0.1180
     23       11.9568  0.1250
     24       11.9568  0.1310
     25       11.9568  0.1220
     26       11.9568  0.1280
     27       11.9568  0.1220
     28       11.9568  0.1240
     29       11.9568  0.1290
     30       11.9568  0.1190
     31       11.9568  0.1250
     32       11.9568  0.1350
     33       11.9568  0.1310
     34       11.9568  0.1220
     35   

  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9586[0m  0.1220
      2       [36m11.9547[0m  0.1270
      3       11.9547  0.1360
      4       11.9547  0.1230
      5       11.9547  0.1250
      6       [36m11.9547[0m  0.1340
      7        [36m4.1082[0m  0.1330
      8        [36m1.3868[0m  0.1190
      9        1.3868  0.1220
     10        1.3868  0.1190
     11        1.3868  0.1240
     12        1.3868  0.1270
     13        1.3868  0.1180
     14        1.3868  0.1200
     15        1.3868  0.1220
     16        1.3868  0.1250
     17        1.3868  0.1290
     18        1.3868  0.1320
     19        1.3868  0.1220
     20        1.3868  0.1240
     21        1.3868  0.1190
     22        1.3868  0.1190
     23        1.3868  0.1270
     24        1.3868  0.1240
     25        1.3868  0.1250
     26        1.3868  0.1220
     27        1.3868  0.1310
     28        1.3868  0.1290
     29        1.3868  0.1270
     30        1.3868  0.

      4        [36m1.3868[0m  0.1370
      5        1.3868  0.1340
      6        1.3868  0.1350
      7        1.3868  0.1290
      8        1.3868  0.1270
      9        1.3868  0.1320
     10        1.3868  0.1300
     11        1.3868  0.1370
     12        1.3868  0.1260
     13        [36m1.3868[0m  0.1330
     14        1.3868  0.1260
     15        1.3868  0.1290
     16        1.3868  0.1340
     17        1.3868  0.1280
     18        1.3868  0.1410
     19        1.3868  0.1630
     20        1.3868  0.1370
     21        1.3868  0.1420
     22        1.3868  0.1320
     23        1.3868  0.1330
     24        1.3868  0.1350
     25        1.3868  0.1350
     26        1.3868  0.1410
     27        1.3868  0.1420
     28        1.3868  0.1360
     29        1.3868  0.1400
     30        1.3868  0.1440
     31        1.3868  0.1380
     32        1.3868  0.1400
     33        1.3868  0.1360
     34        1.3868  0.1390
     35        1.3868  0.1310
     36        1.3868 

     11       11.9568  0.1310
     12       11.9568  0.1240
     13       12.0034  0.1180
     14       11.9568  0.1230
     15       11.9568  0.1310
     16       11.9568  0.1230
     17       11.9568  0.1280
     18       11.9568  0.1190
     19       11.9568  0.1220
     20       11.9568  0.1250
     21       11.9568  0.1250
     22       11.9568  0.1250
     23       11.9568  0.1300
     24       11.9568  0.1280
     25       11.9568  0.1220
     26       11.9568  0.1280
     27       11.9568  0.1420
     28       11.9568  0.1230
     29       11.9568  0.1200
     30       11.9568  0.1200
     31       11.9568  0.1260
     32       11.9568  0.1200
     33       11.9568  0.1200
     34       11.9568  0.1200
     35       [36m11.4838[0m  0.1200
     36        [36m1.3910[0m  0.1180
     37        1.3911  0.1300
     38        1.3911  0.1270
     39        1.3911  0.1250
     40        1.3911  0.1260
     41        1.3911  0.1210
     42        1.3911  0.1160
     43        1.3911 

     14        1.3910  0.1210
     15        1.3910  0.1290
     16        1.3910  0.1200
     17        1.3910  0.1230
     18        1.3910  0.1260
     19        1.3910  0.1170
     20        1.3910  0.1190
     21        1.3910  0.1200
     22        1.3910  0.1310
     23        1.3910  0.1210
     24        1.3910  0.1210
     25        1.3910  0.1210
     26        1.3910  0.1210
     27        1.3910  0.1160
     28        1.3910  0.1200
     29        1.3910  0.1210
     30        1.3910  0.1260
     31        [36m1.3910[0m  0.1200
     32        1.3910  0.1230
     33        1.3910  0.1180
     34        1.3910  0.1320
     35        1.3910  0.1170
     36        1.3910  0.1280
     37        1.3910  0.1190
     38        1.3910  0.1200
     39        1.3910  0.1320
     40        1.3910  0.1260
     41        1.3910  0.1160
     42        1.3910  0.1310
     43        1.3910  0.1220
     44        1.3910  0.1180
     45        1.3910  0.1210
     46        1.3910  0.1250
 

     19        1.3904  0.1390
     20        1.3904  0.1350
     21        1.3904  0.1310
     22        1.3904  0.1310
     23        1.3904  0.1320
     24        1.3904  0.1360
     25        1.3904  0.1370
     26        1.3904  0.1350
     27        1.3904  0.1380
     28        1.3904  0.1340
     29        1.3904  0.1270
     30        1.3904  0.1360
     31        1.3904  0.1240
     32        1.3904  0.1210
     33        1.3904  0.1340
     34        1.3904  0.1310
     35        1.3904  0.1370
     36        1.3904  0.1250
     37        1.3904  0.1270
     38        1.3904  0.1260
     39        1.3904  0.1260
     40        1.3904  0.1340
     41        1.3904  0.1300
     42        1.3904  0.1330
     43        1.3904  0.1280
     44        1.3904  0.1300
     45        1.3904  0.1240
     46        1.3904  0.1330
     47        1.3904  0.1310
     48        1.3904  0.1260
     49        1.3904  0.1200
     50        1.3904  0.1220
  epoch    train_loss     dur
-------  -

      9        [36m1.3886[0m  0.0970
     10        [36m1.3879[0m  0.0830
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5371[0m  0.0830
      2        [36m1.4265[0m  0.1230
      3        [36m1.4159[0m  0.0890
      4        [36m1.4081[0m  0.0870
      5        [36m1.4024[0m  0.0840
      6        [36m1.3981[0m  0.0830
      7        [36m1.3950[0m  0.0840
      8        [36m1.3927[0m  0.0830
      9        [36m1.3910[0m  0.0860
     10        [36m1.3898[0m  0.0880
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4480[0m  0.1060
      2        [36m1.3887[0m  0.0840
      3        [36m1.3878[0m  0.0790
      4        [36m1.3873[0m  0.0840
      5        [36m1.3870[0m  0.0880
      6        [36m1.3867[0m  0.0860
      7        [36m1.3866[0m  0.0850
      8        [36m1.3865[0m  0.0820
      9        [36m1.3864[0m  0.1150
     10        [36m1.3864[0m  0.0860
  epoch    train_loss 

      2        [36m1.3864[0m  0.0850
      3        1.3866  0.0840
      4        1.3866  0.0810
      5        1.3866  0.0840
      6        1.3866  0.0850
      7        1.3866  0.0810
      8        1.3866  0.0800
      9        1.3866  0.0880
     10        1.3866  0.0790
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4167[0m  0.0860
      2        [36m1.3865[0m  0.0880
      3        1.3865  0.0840
      4        1.3865  0.0830
      5        1.3865  0.0900
      6        1.3865  0.0790
      7        1.3865  0.0870
      8        1.3865  0.0880
      9        1.3865  0.0900
     10        1.3865  0.0830
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6190[0m  0.0850
      2        [36m1.3877[0m  0.0840
      3        [36m1.3877[0m  0.0920
      4        1.3877  0.0810
      5        1.3877  0.0870
      6        1.3877  0.0830
      7        1.3877  0.0840
      8        1.3877  0.0860
      9        1

      9        [36m1.0660[0m  0.0870
     10        [36m1.0523[0m  0.0870
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5594[0m  0.0900
      2        [36m1.3181[0m  0.0830
      3        [36m1.2762[0m  0.0860
      4        [36m1.2332[0m  0.0870
      5        [36m1.2031[0m  0.0840
      6        [36m1.1779[0m  0.0820
      7        [36m1.1581[0m  0.0800
      8        [36m1.1392[0m  0.0830
      9        [36m1.1227[0m  0.0880
     10        [36m1.1108[0m  0.0840
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5333[0m  0.0870
      2        [36m1.3218[0m  0.0820
      3        [36m1.2428[0m  0.0810
      4        [36m1.1319[0m  0.0840
      5        [36m1.0126[0m  0.0960
      6        [36m0.9670[0m  0.0890
      7        [36m0.9513[0m  0.0850
      8        [36m0.9381[0m  0.0840
      9        [36m0.9294[0m  0.0860
     10        [36m0.9228[0m  0.0990
  epoch    train_loss 

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4260[0m  0.0910
      2        [36m1.3868[0m  0.0910
      3        [36m1.3867[0m  0.0880
      4        [36m1.3866[0m  0.0860
      5        [36m1.3866[0m  0.0870
      6        [36m1.3866[0m  0.0860
      7        [36m1.3866[0m  0.0870
      8        [36m1.3866[0m  0.0870
      9        [36m1.3866[0m  0.0890
     10        [36m1.3866[0m  0.0810
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m3.8493[0m  0.0940
      2        [36m1.3865[0m  0.0810
      3        1.3867  0.0860
      4        1.3866  0.0960
      5        1.3866  0.0810
      6        [36m1.3856[0m  0.0870
      7        1.3860  0.0920
      8        [36m1.3663[0m  0.0890
      9        [36m1.3624[0m  0.0880
     10        1.3876  0.0840
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m10.0746[0m  0.0830
      2        [36m1.3869[0m  0.0930
      3

      2        [36m3.2456[0m  0.0850
      3        [36m1.4977[0m  0.0820
      4       10.9663  0.0870
      5       10.0908  0.0950
      6       11.8378  0.0860
      7        2.5943  0.0880
      8        1.5622  0.0840
      9        [36m1.3921[0m  0.0840
     10        [36m1.3880[0m  0.0950
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.3907[0m  0.0900
      2        [36m1.1690[0m  0.0830
      3        [36m1.0376[0m  0.0850
      4        [36m0.9938[0m  0.0890
      5        [36m0.9685[0m  0.0890
      6        [36m0.9479[0m  0.0890
      7        [36m0.9375[0m  0.0810
      8        [36m0.9260[0m  0.0940
      9        [36m0.9181[0m  0.0840
     10        [36m0.9161[0m  0.0810
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4910[0m  0.0870
      2        [36m1.2922[0m  0.0850
      3        [36m1.2476[0m  0.0880
      4        [36m1.2076[0m  0.0890
      5        [36m1.1621[

      9       11.9589  0.0950
     10       11.9589  0.0900
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.6697[0m  0.0880
      2       11.9568  0.0850
      3       11.9568  0.0920
      4       11.9568  0.0950
      5       11.9568  0.1030
      6       11.9568  0.1000
      7       11.9568  0.0900
      8       11.9568  0.0840
      9       11.9568  0.0840
     10       11.9568  0.0960
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.3470[0m  0.0970
      2        1.3902  0.0880
      3        1.3866  0.0880
      4        1.3866  0.0900
      5        1.3866  0.0880
      6        1.3866  0.0850
      7        1.3866  0.0880
      8        1.3866  0.0830
      9        1.3866  0.0880
     10        1.3866  0.0870
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5891[0m  0.0870
      2        [36m1.3865[0m  0.0910
      3        1.3866  0.0810
      4        1.3866  0.0810
    

      7        1.3884  0.0840
      8        1.3884  0.0840
      9        1.3884  0.0980
     10        1.3884  0.0950
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9125[0m  0.0870
      2       11.9568  0.0920
      3       11.9568  0.0910
      4       11.9568  0.1040
      5       11.9568  0.0990
      6       11.9568  0.0940
      7       [36m10.1826[0m  0.0830
      8        [36m1.3881[0m  0.0880
      9        1.3882  0.0950
     10        1.3881  0.0960
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7576[0m  0.0960
      2        [36m5.5010[0m  0.0830
      3        [36m5.4552[0m  0.0820
      4        [36m1.4757[0m  0.0950
      5        6.6331  0.0970
      6        7.3211  0.0950
      7        6.9880  0.0950
      8        1.4948  0.0820
      9        1.4838  0.0810
     10        [36m1.3934[0m  0.0850
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.3034[

      6        [36m0.9519[0m  0.0940
      7        0.9569  0.0900
      8        [36m0.9459[0m  0.0910
      9        [36m0.9425[0m  0.0890
     10        [36m0.9410[0m  0.0890
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.9734[0m  0.1230
      2        [36m1.1551[0m  0.1110
      3        [36m1.0478[0m  0.0910
      4        [36m0.9615[0m  0.0890
      5        [36m0.9448[0m  0.0960
      6        [36m0.9368[0m  0.1000
      7        [36m0.9300[0m  0.0890
      8        0.9438  0.0970
      9        [36m0.9224[0m  0.0970
     10        0.9315  0.0900
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6573[0m  0.0840
      2        [36m1.2916[0m  0.0910
      3        [36m1.2409[0m  0.0950
      4        [36m1.1015[0m  0.0970
      5        [36m1.0287[0m  0.0930
      6        [36m0.9813[0m  0.0880
      7        [36m0.9747[0m  0.0980
      8        [36m0.9659[0m  0.0980
      9   

      2       11.9568  0.0870
      3       11.9568  0.0910
      4       11.9568  0.0950
      5       11.9568  0.0970
      6       11.9568  0.0970
      7       11.9568  0.0870
      8       11.9568  0.0850
      9       11.9568  0.0850
     10       11.9568  0.0870
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8988[0m  0.0880
      2       11.9568  0.0970
      3       11.9568  0.0860
      4       11.9568  0.0900
      5       11.9568  0.0890
      6       11.9568  0.0930
      7       11.9568  0.0900
      8       11.9568  0.0930
      9       11.9568  0.0840
     10       11.9568  0.0920
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9019[0m  0.0900
      2       11.9568  0.0880
      3       11.9568  0.1280
      4       11.9568  0.1000
      5       11.9568  0.1050
      6       [36m10.5659[0m  0.0970
      7        [36m1.3896[0m  0.0880
      8        [36m1.3876[0m  0.0850
      9        1.3876  0.

      5        [36m1.3871[0m  0.0830
      6        [36m1.3869[0m  0.0810
      7        [36m1.3867[0m  0.0850
      8        [36m1.3866[0m  0.0940
      9        [36m1.3866[0m  0.0850
     10        [36m1.3865[0m  0.0870
     11        [36m1.3865[0m  0.0830
     12        [36m1.3864[0m  0.0810
     13        [36m1.3864[0m  0.0820
     14        [36m1.3864[0m  0.0820
     15        [36m1.3864[0m  0.0830
     16        [36m1.3864[0m  0.0900
     17        [36m1.3864[0m  0.0860
     18        [36m1.3863[0m  0.0830
     19        [36m1.3863[0m  0.0830
     20        [36m1.3863[0m  0.0830
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.1904[0m  0.0910
      2        [36m1.3911[0m  0.0840
      3        [36m1.3894[0m  0.0910
      4        [36m1.3884[0m  0.0810
      5        [36m1.3877[0m  0.0880
      6        [36m1.3873[0m  0.0850
      7        [36m1.3870[0m  0.0807
      8        [36m1.3868[0m  0.0840
    

      2        [36m1.4087[0m  0.0810
      3        [36m1.4013[0m  0.0900
      4        [36m1.3963[0m  0.0850
      5        [36m1.3929[0m  0.0820
      6        [36m1.3907[0m  0.0880
      7        [36m1.3892[0m  0.0880
      8        [36m1.3882[0m  0.0880
      9        [36m1.3876[0m  0.0850
     10        [36m1.3872[0m  0.0850
     11        [36m1.3869[0m  0.0930
     12        [36m1.3867[0m  0.0860
     13        [36m1.3866[0m  0.0950
     14        [36m1.3865[0m  0.0920
     15        [36m1.3864[0m  0.0870
     16        [36m1.3864[0m  0.0850
     17        [36m1.3864[0m  0.0920
     18        [36m1.3864[0m  0.0890
     19        [36m1.3863[0m  0.0860
     20        [36m1.3863[0m  0.0820
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6079[0m  0.0830
      2        [36m1.3881[0m  0.0920
      3        [36m1.3865[0m  0.1020
      4        1.3866  0.0820
      5        1.3866  0.0840
      6        1.3866 

      3        1.3866  0.0810
      4        1.3866  0.0870
      5        1.3866  0.0840
      6        1.3866  0.0900
      7        1.3866  0.0840
      8        1.3866  0.0830
      9        1.3866  0.0800
     10        1.3866  0.0870
     11        1.3866  0.0840
     12        1.3866  0.0840
     13        1.3866  0.0930
     14        1.3866  0.0900
     15        1.3866  0.0870
     16        1.3866  0.0870
     17        1.3866  0.0840
     18        1.3866  0.0910
     19        1.3866  0.0810
     20        1.3866  0.0850
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4093[0m  0.0790
      2        [36m1.3866[0m  0.0830
      3        [36m1.3865[0m  0.0920
      4        [36m1.3865[0m  0.0870
      5        [36m1.3865[0m  0.0840
      6        1.3865  0.0880
      7        1.3865  0.0820
      8        1.3865  0.0870
      9        1.3865  0.0860
     10        1.3865  0.0890
     11        1.3865  0.0820
     12        1.3865  0.

     17        1.3875  0.0860
     18        1.3875  0.0850
     19        1.3875  0.0800
     20        1.3875  0.0800
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8788[0m  0.0890
      2       11.9568  0.0900
      3       11.9568  0.0870
      4       11.9568  0.0860
      5        [36m2.8927[0m  0.0880
      6        [36m1.3879[0m  0.0890
      7        [36m1.3879[0m  0.0870
      8        1.3879  0.0920
      9        1.3879  0.0830
     10        1.3879  0.0830
     11        1.3879  0.0840
     12        1.3879  0.0820
     13        1.3879  0.0850
     14        1.3879  0.0840
     15        1.3879  0.0800
     16        1.3879  0.0800
     17        1.3879  0.0820
     18        1.3879  0.0890
     19        1.3879  0.0950
     20        1.3879  0.0880
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8195[0m  0.0820
      2       11.8753  0.0860
      3       11.9568  0.0990
      4       11.9568  0.

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.3624[0m  0.0930
      2        [36m1.1082[0m  0.0890
      3        [36m0.9878[0m  0.0880
      4        [36m0.9557[0m  0.0850
      5        [36m0.9517[0m  0.0860
      6        [36m0.9458[0m  0.0860
      7        0.9558  0.0870
      8        [36m0.9234[0m  0.0800
      9        0.9237  0.0840
     10        [36m0.9193[0m  0.0910
     11        0.9325  0.0900
     12        0.9242  0.0810
     13        0.9244  0.0860
     14        0.9238  0.0910
     15        0.9336  0.0840
     16        0.9399  0.0890
     17        0.9255  0.0830
     18        0.9213  0.0900
     19        0.9194  0.0930
     20        [36m0.9160[0m  0.0960
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.3659[0m  0.0850
      2        [36m1.3957[0m  0.0810
      3        [36m1.3769[0m  0.0930
      4        [36m1.3378[0m  0.0870
      5        [36m1.2882[0m  0.0890
    

      6        [36m1.1802[0m  0.0940
      7        [36m1.0807[0m  0.0910
      8        [36m1.0325[0m  0.0880
      9        [36m0.9725[0m  0.0880
     10        [36m0.9615[0m  0.0830
     11        [36m0.9432[0m  0.0850
     12        [36m0.9387[0m  0.0807
     13        0.9403  0.0810
     14        [36m0.9348[0m  0.0840
     15        [36m0.9320[0m  0.0880
     16        [36m0.9302[0m  0.0870
     17        [36m0.9294[0m  0.0830
     18        [36m0.9279[0m  0.0860
     19        [36m0.9272[0m  0.0900
     20        0.9299  0.0960
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6063[0m  0.0910
      2        [36m1.3129[0m  0.0870
      3        [36m1.2220[0m  0.0900
      4        [36m1.1373[0m  0.0850
      5        [36m1.0708[0m  0.0930
      6        [36m1.0533[0m  0.0970
      7        [36m1.0254[0m  0.0940
      8        [36m1.0100[0m  0.0970
      9        [36m1.0012[0m  0.0900
     10        [36m0.

      5        1.3641  0.0880
      6        1.3871  0.0850
      7        1.3865  0.0900
      8        1.3865  0.0810
      9        1.3865  0.0930
     10        1.3865  0.0850
     11        1.3865  0.0810
     12        1.3865  0.0830
     13        1.3865  0.0870
     14        1.3865  0.0800
     15        1.3865  0.0870
     16        1.3858  0.0830
     17        1.3875  0.0810
     18        1.3865  0.0880
     19        1.3865  0.0820
     20        1.3865  0.0870
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4665[0m  0.0860
      2        [36m1.3866[0m  0.0850
      3        [36m1.3866[0m  0.0810
      4        [36m1.3866[0m  0.0830
      5        [36m1.3866[0m  0.0850
      6        [36m1.3866[0m  0.0850
      7        [36m1.3866[0m  0.0890
      8        [36m1.3866[0m  0.0840
      9        [36m1.3866[0m  0.0810
     10        1.3866  0.0910
     11        1.3866  0.0860
     12        1.3866  0.0940
     13        1.38

      5        [36m1.3880[0m  0.0820
      6        [36m1.3875[0m  0.0830
      7        1.3875  0.0840
      8        1.3875  0.0930
      9        1.3875  0.0840
     10        1.3875  0.0880
     11        1.3875  0.0840
     12        1.3875  0.0850
     13        1.3875  0.0880
     14        1.3875  0.0820
     15        1.3875  0.0800
     16        1.3875  0.0880
     17        1.3875  0.0850
     18        1.3875  0.0920
     19        1.3875  0.0850
     20        1.3875  0.0870
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7428[0m  0.0880
      2        [36m1.3887[0m  0.0870
      3        [36m1.3880[0m  0.0900
      4        [36m1.3879[0m  0.0830
      5        [36m1.3879[0m  0.0830
      6        [36m1.3879[0m  0.0910
      7        [36m1.3879[0m  0.0880
      8        [36m1.3879[0m  0.0870
      9        1.3879  0.0860
     10        1.3879  0.0840
     11        1.3879  0.0870
     12        1.3879  0.0910
     13   

     15       11.9547  0.0920
     16       11.9547  0.0910
     17       11.9547  0.0940
     18       11.9547  0.0930
     19       11.9547  0.0920
     20       11.9547  0.0920
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.1285[0m  0.0940
      2        [36m1.2782[0m  0.0890
      3        [36m1.1066[0m  0.0870
      4        [36m1.0053[0m  0.0930
      5        [36m0.9623[0m  0.0960
      6        [36m0.9602[0m  0.0900
      7        0.9610  0.0820
      8        [36m0.9412[0m  0.0860
      9        [36m0.9284[0m  0.0850
     10        [36m0.9230[0m  0.0860
     11        [36m0.9182[0m  0.0830
     12        [36m0.9149[0m  0.0840
     13        0.9155  0.0850
     14        [36m0.9073[0m  0.0820
     15        0.9081  0.0850
     16        0.9103  0.0910
     17        0.9145  0.0870
     18        0.9190  0.0820
     19        0.9477  0.0860
     20        0.9253  0.0860
  epoch    train_loss     dur
-------  ------------ 

      2        [36m1.2070[0m  0.0930
      3        [36m1.0551[0m  0.0910
      4        [36m0.9730[0m  0.0840
      5        [36m0.9544[0m  0.0830
      6        [36m0.9484[0m  0.0820
      7        [36m0.9419[0m  0.0820
      8        [36m0.9411[0m  0.0890
      9        [36m0.9395[0m  0.0860
     10        [36m0.9387[0m  0.0850
     11        0.9393  0.0930
     12        [36m0.9383[0m  0.0920
     13        [36m0.9356[0m  0.0820
     14        0.9367  0.0860
     15        [36m0.9343[0m  0.0820
     16        [36m0.9339[0m  0.0860
     17        [36m0.9322[0m  0.0850
     18        0.9324  0.0860
     19        0.9322  0.0890
     20        [36m0.9312[0m  0.0970
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.8169[0m  0.0860
      2        [36m1.3870[0m  0.0940
      3        [36m1.3867[0m  0.0890
      4        [36m1.3865[0m  0.0970
      5        [36m1.3864[0m  0.0840
      6        [36m1.3864[0m  0.0900
 

      2        [36m1.2859[0m  0.0930
      3        1.3342  0.0930
      4        1.3870  0.0890
      5        1.3866  0.0850
      6        1.3866  0.0920
      7        1.3866  0.0910
      8        1.3866  0.0960
      9        1.3866  0.0880
     10        1.3866  0.0910
     11        1.3866  0.0860
     12        1.3866  0.0890
     13        1.3866  0.1350
     14        1.3866  0.1050
     15        1.3865  0.0990
     16        1.3865  0.1040
     17        1.3865  0.0980
     18        1.3865  0.0840
     19        1.3865  0.0860
     20        1.3865  0.0980
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6240[0m  0.0850
      2        [36m1.3878[0m  0.0920
      3        [36m1.3863[0m  0.0860
      4        [36m1.3675[0m  0.0880
      5        1.3869  0.0860
      6        1.3866  0.0910
      7        1.3866  0.0830
      8        1.3866  0.0840
      9        1.3866  0.0860
     10        1.3866  0.0830
     11        1.3866  0.

     20        1.3876  0.0870
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8899[0m  0.0990
      2       11.9568  0.0950
      3       11.9568  0.1040
      4       11.9568  0.0940
      5        [36m9.6341[0m  0.0910
      6        [36m1.3876[0m  0.0940
      7        [36m1.3876[0m  0.0870
      8        [36m1.3875[0m  0.0890
      9        [36m1.3875[0m  0.0830
     10        [36m1.3875[0m  0.0830
     11        1.3875  0.0890
     12        [36m1.3875[0m  0.0820
     13        1.3875  0.0850
     14        1.3875  0.0990
     15        [36m1.3875[0m  0.0890
     16        1.3875  0.0970
     17        1.3875  0.0920
     18        1.3875  0.0970
     19        1.3875  0.0900
     20        1.3875  0.0940
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8706[0m  0.1010
      2       11.9547  0.0910
      3       11.9547  0.0970
      4       11.9547  0.0980
      5        [36m5.0984[0m  0.1520
 

      4        [36m0.9990[0m  0.0880
      5        [36m0.9675[0m  0.1010
      6        [36m0.9524[0m  0.0840
      7        [36m0.9440[0m  0.0880
      8        0.9445  0.0910
      9        [36m0.9384[0m  0.0930
     10        0.9447  0.0920
     11        [36m0.9243[0m  0.0930
     12        [36m0.9220[0m  0.0860
     13        [36m0.9198[0m  0.0880
     14        [36m0.9168[0m  0.0880
     15        [36m0.9165[0m  0.0860
     16        [36m0.9158[0m  0.0850
     17        0.9226  0.0840
     18        0.9269  0.0870
     19        0.9165  0.0820
     20        [36m0.9070[0m  0.0860
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.1262[0m  0.0840
      2        [36m1.3859[0m  0.0920
      3        [36m1.3716[0m  0.0840
      4        [36m1.3551[0m  0.0940
      5        [36m1.3164[0m  0.0920
      6        [36m1.2081[0m  0.0890
      7        [36m1.0629[0m  0.0930
      8        [36m0.9794[0m  0.0860
      9   

     10        [36m0.9568[0m  0.0850
     11        [36m0.9537[0m  0.0890
     12        [36m0.9520[0m  0.0830
     13        [36m0.9517[0m  0.0840
     14        0.9529  0.0870
     15        [36m0.9507[0m  0.0830
     16        [36m0.9483[0m  0.0830
     17        [36m0.9481[0m  0.0890
     18        [36m0.9459[0m  0.0940
     19        [36m0.9451[0m  0.0890
     20        [36m0.9442[0m  0.0820
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7640[0m  0.0890
      2        [36m1.1989[0m  0.0860
      3        [36m1.0403[0m  0.0880
      4        [36m0.9612[0m  0.0940
      5        [36m0.9571[0m  0.0850
      6        [36m0.9467[0m  0.0860
      7        [36m0.9401[0m  0.0890
      8        [36m0.9357[0m  0.0920
      9        [36m0.9325[0m  0.0850
     10        [36m0.9306[0m  0.0920
     11        0.9310  0.0890
     12        [36m0.9262[0m  0.0880
     13        0.9267  0.0920
     14        [36m0.9243[0m 

     13       11.9568  0.0880
     14       11.9568  0.0940
     15       11.9568  0.0840
     16       11.9568  0.0840
     17       11.9568  0.0830
     18       11.9568  0.0870
     19       11.9568  0.1090
     20       11.9568  0.1000
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.9228[0m  0.0840
      2        [36m1.3867[0m  0.0860
      3        [36m1.3865[0m  0.0940
      4        [36m1.3864[0m  0.0830
      5        [36m1.3863[0m  0.0830
      6        [36m1.3826[0m  0.0900
      7        1.3864  0.0970
      8        1.3863  0.1010
      9        1.3860  0.1180
     10        [36m1.3765[0m  0.1030
     11        [36m1.3362[0m  0.0850
     12        [36m1.3169[0m  0.0850
     13        1.3757  0.0970
     14        1.3866  0.0890
     15        1.3865  0.1030
     16        1.3866  0.1020
     17        1.3866  0.1010
     18        1.3866  0.0970
     19        1.3865  0.0970
     20        1.3865  0.0960
  epoch    train_lo

      8        [36m1.3876[0m  0.0850
      9        1.3876  0.0860
     10        1.3876  0.0820
     11        1.3876  0.0850
     12        1.3876  0.0860
     13        1.3876  0.0860
     14        1.3876  0.0820
     15        1.3876  0.0830
     16        1.3876  0.0860
     17        1.3876  0.0840
     18        1.3876  0.0880
     19        1.3876  0.0890
     20        1.3876  0.0900
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9138[0m  0.0940
      2       11.9631  0.0880
      3       11.9589  0.0930
      4       11.9589  0.0960
      5       11.9589  0.0860
      6       11.9589  0.0920
      7       11.9589  0.0860
      8        [36m6.5663[0m  0.0890
      9        [36m1.3875[0m  0.0840
     10        1.3875  0.0870
     11        1.3875  0.0830
     12        1.3875  0.0830
     13        1.3875  0.0940
     14        1.3875  0.0820
     15        1.3875  0.0830
     16        1.3875  0.0930
     17        1.3875  0.0910
    

      6        [36m1.3925[0m  0.0880
      7        [36m1.3909[0m  0.0870
      8        [36m1.3898[0m  0.0890
      9        [36m1.3889[0m  0.0840
     10        [36m1.3883[0m  0.0840
     11        [36m1.3878[0m  0.0830
     12        [36m1.3874[0m  0.0840
     13        [36m1.3871[0m  0.0860
     14        [36m1.3869[0m  0.0880
     15        [36m1.3868[0m  0.0900
     16        [36m1.3866[0m  0.0880
     17        [36m1.3866[0m  0.0810
     18        [36m1.3865[0m  0.0890
     19        [36m1.3864[0m  0.0820
     20        [36m1.3864[0m  0.0830
     21        [36m1.3864[0m  0.0850
     22        [36m1.3864[0m  0.0790
     23        [36m1.3863[0m  0.0850
     24        [36m1.3863[0m  0.0810
     25        [36m1.3863[0m  0.0870
     26        [36m1.3863[0m  0.0830
     27        [36m1.3863[0m  0.0800
     28        [36m1.3863[0m  0.0830
     29        [36m1.3863[0m  0.0830
     30        [36m1.3863[0m  0.0840
  epoch    train_loss    

     28        [36m1.3863[0m  0.0860
     29        [36m1.3863[0m  0.0890
     30        [36m1.3863[0m  0.0830
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4049[0m  0.0810
      2        [36m1.3926[0m  0.0850
      3        [36m1.3704[0m  0.0800
      4        [36m1.3468[0m  0.0860
      5        [36m1.3228[0m  0.0800
      6        [36m1.2941[0m  0.0860
      7        [36m1.2583[0m  0.0860
      8        [36m1.2113[0m  0.0860
      9        [36m1.1782[0m  0.0840
     10        [36m1.1508[0m  0.0880
     11        [36m1.1259[0m  0.0800
     12        [36m1.1089[0m  0.0800
     13        [36m1.0899[0m  0.0940
     14        [36m1.0735[0m  0.0820
     15        [36m1.0580[0m  0.0840
     16        [36m1.0460[0m  0.0800
     17        1.0473  0.0870
     18        [36m1.0360[0m  0.0820
     19        1.0448  0.0850
     20        [36m1.0217[0m  0.0850
     21        [36m1.0212[0m  0.0850
     22        [36m1.

     19        [36m1.3825[0m  0.0850
     20        [36m1.3776[0m  0.0860
     21        [36m1.3685[0m  0.0810
     22        [36m1.3523[0m  0.0910
     23        [36m1.3282[0m  0.0900
     24        [36m1.2910[0m  0.0810
     25        [36m1.2419[0m  0.0870
     26        [36m1.1988[0m  0.0830
     27        [36m1.1597[0m  0.0830
     28        [36m1.1383[0m  0.0830
     29        [36m1.1251[0m  0.0910
     30        [36m1.1117[0m  0.0810
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m4.9746[0m  0.0870
      2        [36m1.3869[0m  0.0870
      3        [36m1.3866[0m  0.0820
      4        [36m1.3866[0m  0.0810
      5        1.3866  0.0860
      6        1.3866  0.0890
      7        1.3866  0.0880
      8        1.3866  0.0860
      9        1.3866  0.0890
     10        1.3866  0.0860
     11        1.3866  0.0940
     12        1.3866  0.0830
     13        1.3866  0.0840
     14        1.3866  0.0850
     15        1

     28        [36m1.3865[0m  0.0840
     29        [36m1.3865[0m  0.0800
     30        [36m1.3865[0m  0.0900
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5261[0m  0.0920
      2        [36m1.3870[0m  0.0800
      3        [36m1.3865[0m  0.0840
      4        [36m1.3865[0m  0.0800
      5        [36m1.3865[0m  0.0850
      6        [36m1.3865[0m  0.0820
      7        [36m1.3865[0m  0.0860
      8        [36m1.3865[0m  0.0830
      9        [36m1.3865[0m  0.0810
     10        [36m1.3865[0m  0.1150
     11        [36m1.3865[0m  0.0860
     12        [36m1.3865[0m  0.0840
     13        [36m1.3865[0m  0.0810
     14        [36m1.3865[0m  0.0810
     15        [36m1.3865[0m  0.0870
     16        [36m1.3865[0m  0.0830
     17        [36m1.3865[0m  0.0820
     18        [36m1.3865[0m  0.0820
     19        [36m1.3865[0m  0.0860
     20        [36m1.3865[0m  0.0830
     21        [36m1.3865[0m  0.0920
    

     28        1.3865  0.0860
     29        1.3865  0.0850
     30        1.3865  0.0860
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7536[0m  0.0850
      2        [36m1.3884[0m  0.0870
      3        [36m1.3884[0m  0.0800
      4        [36m1.3883[0m  0.0890
      5        [36m1.3882[0m  0.0830
      6        [36m1.3881[0m  0.0800
      7        [36m1.3880[0m  0.0850
      8        [36m1.3879[0m  0.0860
      9        [36m1.3878[0m  0.0870
     10        [36m1.3878[0m  0.0850
     11        [36m1.3878[0m  0.0880
     12        [36m1.3877[0m  0.0840
     13        [36m1.3877[0m  0.0900
     14        [36m1.3877[0m  0.0850
     15        [36m1.3877[0m  0.0870
     16        [36m1.3877[0m  0.0860
     17        [36m1.3877[0m  0.0870
     18        [36m1.3877[0m  0.0840
     19        1.3877  0.0830
     20        1.3877  0.0830
     21        1.3877  0.0830
     22        1.3877  0.0820
     23        1.3877  0.083

     28        1.3879  0.0890
     29        1.3879  0.0790
     30        1.3879  0.0920
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6731[0m  0.0780
      2        [36m1.3886[0m  0.0800
      3        [36m1.3884[0m  0.0790
      4        1.3884  0.0820
      5        1.3884  0.0790
      6        1.3884  0.0800
      7        1.3884  0.0870
      8        1.3884  0.0850
      9        1.3884  0.0890
     10        1.3884  0.0800
     11        1.3884  0.0790
     12        1.3884  0.0840
     13        1.3884  0.0830
     14        1.3884  0.0810
     15        1.3884  0.0840
     16        1.3884  0.0840
     17        1.3884  0.0800
     18        1.3884  0.0840
     19        1.3884  0.0860
     20        1.3884  0.0790
     21        1.3884  0.0850
     22        1.3884  0.0820
     23        1.3884  0.0800
     24        1.3884  0.0910
     25        1.3884  0.0840
     26        1.3884  0.0850
     27        1.3884  0.0850
     28      

     28        [36m1.3627[0m  0.0960
     29        [36m1.3565[0m  0.0820
     30        [36m1.3488[0m  0.0860
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4776[0m  0.0810
      2        [36m1.3278[0m  0.0900
      3        [36m1.2769[0m  0.0880
      4        [36m1.2200[0m  0.0880
      5        [36m1.1008[0m  0.0910
      6        [36m1.0280[0m  0.0830
      7        [36m0.9754[0m  0.0830
      8        [36m0.9536[0m  0.0800
      9        [36m0.9376[0m  0.0860
     10        [36m0.9274[0m  0.0850
     11        [36m0.9199[0m  0.0840
     12        [36m0.9162[0m  0.0800
     13        [36m0.9138[0m  0.0840
     14        0.9151  0.0800
     15        0.9188  0.0890
     16        0.9156  0.0850
     17        0.9156  0.0810
     18        0.9248  0.0830
     19        0.9412  0.0870
     20        [36m0.9087[0m  0.0870
     21        0.9428  0.0930
     22        0.9400  0.0820
     23        0.9314  0.0830
     24

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7417[0m  0.0880
      2        [36m1.3885[0m  0.0830
      3        [36m1.3785[0m  0.0860
      4        [36m1.3558[0m  0.0820
      5        [36m1.3252[0m  0.0840
      6        [36m1.2900[0m  0.0870
      7        [36m1.2496[0m  0.0810
      8        [36m1.2129[0m  0.0930
      9        [36m1.1865[0m  0.0890
     10        [36m1.1383[0m  0.0860
     11        [36m1.0350[0m  0.0890
     12        [36m0.9499[0m  0.0870
     13        0.9610  0.0830
     14        [36m0.9396[0m  0.0900
     15        [36m0.9305[0m  0.0850
     16        [36m0.9274[0m  0.0850
     17        0.9311  0.0900
     18        0.9335  0.0810
     19        [36m0.9237[0m  0.0890
     20        0.9264  0.0840
     21        0.9342  0.0940
     22        0.9312  0.0910
     23        0.9408  0.0900
     24        0.9369  0.0920
     25        0.9267  0.0950
     26        0.9255  0.0840
     27        0

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.6776[0m  0.0800
      2        [36m1.3867[0m  0.0890
      3        [36m1.3866[0m  0.0840
      4        [36m1.3865[0m  0.0860
      5        [36m1.3865[0m  0.0870
      6        [36m1.3865[0m  0.0880
      7        [36m1.3865[0m  0.0890
      8        [36m1.3865[0m  0.0910
      9        [36m1.3864[0m  0.0830
     10        [36m1.3864[0m  0.0800
     11        [36m1.3864[0m  0.0840
     12        [36m1.3864[0m  0.0810
     13        [36m1.3864[0m  0.0820
     14        [36m1.3864[0m  0.0810
     15        [36m1.3864[0m  0.0840
     16        [36m1.3864[0m  0.0830
     17        [36m1.3863[0m  0.0820
     18        [36m1.3863[0m  0.0850
     19        [36m1.3863[0m  0.0880
     20        [36m1.3863[0m  0.0870
     21        [36m1.3863[0m  0.0840
     22        [36m1.3863[0m  0.0840
     23        [36m1.3863[0m  0.0860
     24        [36m1.3863[0m  0.0860
    

     30        1.3865  0.0870
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5892[0m  0.0830
      2        [36m1.3863[0m  0.0850
      3        [36m1.3863[0m  0.0850
      4        [36m1.3837[0m  0.0840
      5        [36m1.3789[0m  0.0850
      6        [36m1.3069[0m  0.0860
      7        1.3804  0.0870
      8        1.3870  0.0800
      9        1.3866  0.0800
     10        1.3866  0.0830
     11        1.3866  0.0870
     12        1.3866  0.0810
     13        1.3866  0.0920
     14        1.3865  0.0810
     15        1.3865  0.0960
     16        1.3865  0.0910
     17        1.3865  0.0800
     18        1.3865  0.0890
     19        1.3865  0.0850
     20        1.3866  0.0820
     21        1.3866  0.0900
     22        1.3866  0.0840
     23        1.3866  0.0810
     24        1.3866  0.0840
     25        1.3866  0.0830
     26        1.3866  0.0860
     27        1.3866  0.0860
     28        1.3866  0.0880
     29        1

      6       11.9568  0.0870
      7       11.9568  0.0870
      8       11.9568  0.0900
      9       11.9568  0.0950
     10       11.9568  0.0940
     11       11.9568  0.0930
     12       11.9568  0.0870
     13       11.9568  0.0860
     14       11.9568  0.0920
     15       11.9568  0.0840
     16       11.9568  0.0930
     17       11.9568  0.0860
     18       11.9568  0.0930
     19       11.9568  0.0920
     20       11.9568  0.0900
     21       11.9568  0.0900
     22       11.9568  0.0940
     23       11.9568  0.0900
     24       11.9568  0.0860
     25       11.9568  0.0900
     26       11.9568  0.0880
     27       11.9568  0.0860
     28       11.9568  0.0920
     29       11.9568  0.0860
     30       11.9568  0.0950
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8549[0m  0.0860
      2       11.9547  0.0870
      3       11.9547  0.0850
      4       11.9547  0.0830
      5       11.9547  0.0870
      6       11.9547  0.0870
 

     15        1.3881  0.0850
     16        1.3881  0.0810
     17        1.3881  0.0850
     18        1.3881  0.0870
     19        1.3881  0.0870
     20        1.3881  0.0900
     21        1.3881  0.0810
     22        1.3881  0.0900
     23        1.3881  0.0890
     24        1.3881  0.0810
     25        1.3881  0.0850
     26        1.3881  0.0850
     27        1.3881  0.0840
     28        1.3881  0.0880
     29        1.3881  0.0810
     30        1.3881  0.0820
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.5366[0m  0.0880
      2        [36m4.7013[0m  0.0890
      3        5.5486  0.0830
      4        [36m1.3895[0m  0.0820
      5        [36m1.3874[0m  0.0850
      6        [36m1.3874[0m  0.0810
      7        [36m1.3874[0m  0.0840
      8        1.3874  0.0950
      9        1.3874  0.0870
     10        1.3874  0.0860
     11        1.3874  0.0860
     12        1.3874  0.0830
     13        1.3874  0.0870
     14        1

      8        [36m1.3534[0m  0.0860
      9        [36m1.3165[0m  0.0870
     10        [36m1.2946[0m  0.0810
     11        [36m1.2478[0m  0.0890
     12        [36m1.2046[0m  0.0980
     13        [36m1.1574[0m  0.0880
     14        [36m1.1300[0m  0.0850
     15        1.1582  0.0950
     16        [36m1.0929[0m  0.0880
     17        [36m1.0700[0m  0.0910
     18        1.0735  0.0890
     19        [36m1.0619[0m  0.0840
     20        [36m1.0405[0m  0.0840
     21        1.0934  0.0810
     22        1.0462  0.0850
     23        [36m1.0160[0m  0.0850
     24        1.0442  0.0850
     25        1.0237  0.0810
     26        [36m0.9991[0m  0.0880
     27        [36m0.9930[0m  0.0820
     28        [36m0.9833[0m  0.0910
     29        [36m0.9762[0m  0.0890
     30        0.9816  0.0830
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.2427[0m  0.0840
      2        [36m1.2303[0m  0.0840
      3        [36m1.1013[

     13        0.9323  0.0880
     14        0.9522  0.0920
     15        0.9735  0.0820
     16        0.9538  0.0830
     17        0.9366  0.0960
     18        0.9343  0.0860
     19        0.9329  0.0820
     20        [36m0.9246[0m  0.0880
     21        [36m0.9230[0m  0.0910
     22        [36m0.9211[0m  0.0810
     23        0.9220  0.0860
     24        [36m0.9178[0m  0.0890
     25        [36m0.9094[0m  0.0890
     26        [36m0.9077[0m  0.0890
     27        [36m0.9058[0m  0.0870
     28        [36m0.9034[0m  0.0930
     29        [36m0.9015[0m  0.0920
     30        0.9021  0.0930
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.1585[0m  0.0870
      2        [36m1.3373[0m  0.0840
      3        [36m1.2717[0m  0.0930
      4        [36m1.1819[0m  0.0890
      5        [36m1.1091[0m  0.0880
      6        [36m1.0405[0m  0.0810
      7        [36m0.9858[0m  0.0890
      8        [36m0.9824[0m  0.0870
      9

     25        1.3867  0.0935
     26        1.3867  0.0870
     27        1.3867  0.0950
     28        1.3867  0.0920
     29        1.3867  0.0920
     30        1.3866  0.0870
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8761[0m  0.0970
      2       11.9568  0.1030
      3       11.9568  0.1040
      4       11.9568  0.0990
      5       11.9568  0.1100
      6       11.9568  0.1010
      7       11.9568  0.1000
      8       11.9568  0.1000
      9       11.9568  0.1070
     10       11.9568  0.0930
     11       11.9568  0.0990
     12       11.9568  0.1000
     13       11.9568  0.0920
     14       11.9568  0.0890
     15       11.9568  0.0850
     16       11.9568  0.0850
     17       11.9568  0.0870
     18       11.9568  0.0850
     19       11.9568  0.0946
     20       11.9568  0.0880
     21       11.9568  0.0880
     22       11.9568  0.0880
     23       11.9568  0.0950
     24       11.9568  0.0890
     25       11.9568  0.1010
 

      3        [36m1.3878[0m  0.0870
      4        [36m1.3866[0m  0.0940
      5        [36m1.3866[0m  0.0880
      6        [36m1.3866[0m  0.0980
      7        [36m1.3866[0m  0.0950
      8        [36m1.3866[0m  0.0950
      9        [36m1.3866[0m  0.0830
     10        1.3866  0.0850
     11        1.3866  0.0930
     12        1.3866  0.0840
     13        1.3866  0.0950
     14        1.3866  0.0940
     15        1.3866  0.0960
     16        1.3866  0.0840
     17        1.3866  0.0890
     18        1.3866  0.0900
     19        1.3866  0.0940
     20        1.3866  0.0860
     21        1.3866  0.0890
     22        1.3866  0.0920
     23        1.3866  0.0900
     24        1.3866  0.0910
     25        1.3866  0.0840
     26        1.3866  0.0880
     27        1.3866  0.0860
     28        1.3866  0.0850
     29        1.3866  0.0820
     30        1.3866  0.0820
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.6746[0m  0.093

      8       11.9568  0.0900
      9       11.9568  0.0880
     10       11.9568  0.1260
     11       11.9568  0.0900
     12       11.9568  0.0950
     13       11.9568  0.0960
     14       11.9568  0.0920
     15       11.9568  0.1000
     16       11.9568  0.0970
     17       11.9568  0.0950
     18       11.9568  0.0840
     19       11.9568  0.0940
     20       11.9568  0.0910
     21       11.9568  0.0920
     22       11.9568  0.0920
     23       11.9568  0.0910
     24       11.9568  0.0920
     25       11.9568  0.0920
     26       11.9568  0.0940
     27       11.9568  0.0890
     28       11.9568  0.0920
     29       11.9568  0.0860
     30       11.9568  0.0900
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9641[0m  0.0950
      2       [36m11.9568[0m  0.0900
      3       11.9568  0.0880
      4       11.9568  0.0930
      5       11.9568  0.0970
      6       11.9568  0.0960
      7       11.9568  0.0930
      8       11.9568 

     14        [36m1.4134[0m  0.0810
     15        [36m1.3881[0m  0.0850
     16        1.4704  0.0870
     17        1.5390  0.0860
     18        2.9652  0.0870
     19        5.8746  0.0910
     20        6.8423  0.0890
     21        [36m1.3881[0m  0.0830
     22        [36m1.3874[0m  0.0880
     23        [36m1.3874[0m  0.0930
     24        1.3874  0.0920
     25        1.3874  0.0870
     26        1.3874  0.0850
     27        1.3874  0.0840
     28        1.3874  0.0860
     29        1.3874  0.0860
     30        1.3874  0.0850
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.5682[0m  0.0930
      2       [36m10.7983[0m  0.0880
      3        [36m5.4406[0m  0.0830
      4        5.8893  0.0950
      5        [36m1.3889[0m  0.0910
      6        [36m1.3878[0m  0.0860
      7        1.3878  0.0950
      8        1.3878  0.0940
      9        1.3878  0.0930
     10        1.3878  0.0840
     11        1.3878  0.0880
     12   

      2        [36m1.0170[0m  0.0830
      3        1.0217  0.0830
      4        [36m0.9835[0m  0.0860
      5        [36m0.9751[0m  0.0890
      6        [36m0.9639[0m  0.0830
      7        [36m0.9536[0m  0.0860
      8        [36m0.9447[0m  0.0860
      9        [36m0.9373[0m  0.0920
     10        [36m0.9348[0m  0.0890
     11        [36m0.9269[0m  0.0830
     12        [36m0.9202[0m  0.0920
     13        [36m0.9175[0m  0.0900
     14        [36m0.9146[0m  0.0960
     15        [36m0.9112[0m  0.0960
     16        [36m0.9088[0m  0.0950
     17        [36m0.9056[0m  0.0960
     18        [36m0.9036[0m  0.0950
     19        [36m0.9020[0m  0.0970
     20        [36m0.8969[0m  0.0900
     21        0.8970  0.0940
     22        [36m0.8936[0m  0.0870
     23        [36m0.8928[0m  0.0870
     24        [36m0.8912[0m  0.0940
     25        [36m0.8892[0m  0.0830
     26        [36m0.8883[0m  0.0907
     27        [36m0.8862[0m  0.0900
    

      3        [36m1.0408[0m  0.0890
      4        [36m0.9881[0m  0.0880
      5        [36m0.9516[0m  0.0840
      6        [36m0.9392[0m  0.0920
      7        [36m0.9368[0m  0.0850
      8        [36m0.9336[0m  0.0880
      9        [36m0.9297[0m  0.0890
     10        0.9337  0.0880
     11        [36m0.9284[0m  0.0880
     12        [36m0.9274[0m  0.0840
     13        0.9282  0.0890
     14        [36m0.9273[0m  0.0810
     15        [36m0.9268[0m  0.0980
     16        0.9279  0.0890
     17        [36m0.9263[0m  0.0930
     18        0.9267  0.0900
     19        0.9275  0.0850
     20        0.9264  0.0830
     21        0.9264  0.0860
     22        [36m0.9259[0m  0.0850
     23        [36m0.9255[0m  0.0840
     24        0.9269  0.0870
     25        0.9269  0.0850
     26        0.9267  0.0850
     27        0.9265  0.0890
     28        0.9265  0.0880
     29        0.9268  0.0910
     30        0.9277  0.0840
  epoch    train_loss     dur
----

     26       11.9568  0.0940
     27       11.9568  0.0860
     28       11.9568  0.0870
     29       11.9568  0.0860
     30       11.9568  0.0850
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5345[0m  0.0910
      2        [36m1.3870[0m  0.0870
      3        [36m1.3868[0m  0.0930
      4        [36m1.3868[0m  0.0910
      5        [36m1.3868[0m  0.0850
      6        [36m1.3868[0m  0.0950
      7        [36m1.3868[0m  0.0870
      8        [36m1.3868[0m  0.0880
      9        [36m1.3868[0m  0.0880
     10        [36m1.3868[0m  0.0870
     11        [36m1.3868[0m  0.0900
     12        [36m1.3868[0m  0.0860
     13        [36m1.3868[0m  0.0860
     14        [36m1.3868[0m  0.0830
     15        [36m1.3867[0m  0.0820
     16        [36m1.3867[0m  0.0850
     17        [36m1.3867[0m  0.0860
     18        [36m1.3867[0m  0.0860
     19        [36m1.3867[0m  0.0850
     20        [36m1.3867[0m  0.0840
     21   

     28        1.3865  0.0830
     29        1.3865  0.0860
     30        1.3865  0.0820
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8491[0m  0.0870
      2       11.9568  0.0870
      3       [36m10.3164[0m  0.0940
      4        [36m1.3865[0m  0.0880
      5        [36m1.3864[0m  0.0860
      6        [36m1.3843[0m  0.0850
      7        [36m1.3467[0m  0.0940
      8        [36m1.3251[0m  0.0870
      9        1.3888  0.0830
     10        1.3865  0.0880
     11        1.3865  0.0850
     12        1.3865  0.0870
     13        1.3865  0.0880
     14        1.3865  0.0870
     15        1.3865  0.0900
     16        1.3865  0.0890
     17        1.3865  0.0890
     18        1.3865  0.0850
     19        1.3865  0.0870
     20        1.3865  0.0860
     21        1.3865  0.0840
     22        1.3865  0.0850
     23        1.3865  0.0940
     24        1.3865  0.0950
     25        1.3865  0.0870
     26        1.3865  0.0850
     27

      7        [36m1.3877[0m  0.0860
      8        [36m1.3876[0m  0.0880
      9        1.3876  0.0850
     10        1.3876  0.0820
     11        1.3876  0.0860
     12        1.3876  0.0820
     13        1.3876  0.0870
     14        1.3876  0.0910
     15        1.3876  0.0920
     16        1.3876  0.0830
     17        1.3876  0.0830
     18        1.3876  0.0870
     19        1.3876  0.0920
     20        1.3876  0.0900
     21        1.3876  0.0880
     22        1.3876  0.0870
     23        1.3876  0.0900
     24        1.3876  0.0910
     25        1.3876  0.0880
     26        1.3876  0.0860
     27        1.3876  0.0850
     28        1.3876  0.0830
     29        1.3876  0.0870
     30        1.3876  0.0900
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9162[0m  0.0880
      2       11.9589  0.0950
      3       11.9589  0.1000
      4       [36m11.8440[0m  0.0910
      5       11.9547  0.0920
      6       11.9547  0.0980
    

      7        1.3883  0.0970
      8        1.3883  0.0920
      9        1.3883  0.0940
     10        1.3883  0.0880
     11        1.3883  0.0980
     12        1.3883  0.0880
     13        1.3883  0.0950
     14        1.3883  0.0890
     15        1.3883  0.1280
     16        1.3883  0.0950
     17        1.3883  0.0910
     18        1.3883  0.0860
     19        1.3883  0.0830
     20        1.3883  0.0940
     21        1.3883  0.0890
     22        1.3883  0.0820
     23        1.3883  0.0860
     24        1.3883  0.0880
     25        1.3883  0.0880
     26        1.3883  0.0870
     27        1.3883  0.0860
     28        1.3883  0.0880
     29        1.3883  0.0830
     30        1.3883  0.0890
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m7.8198[0m  0.0930
      2        [36m3.3378[0m  0.0920
      3        9.6849  0.0870
      4       11.5321  0.0890
      5        [36m1.6713[0m  0.0850
      6        7.0770  0.0840
      7      

     17        [36m1.1042[0m  0.0810
     18        [36m1.0976[0m  0.0830
     19        [36m1.0912[0m  0.0790
     20        [36m1.0843[0m  0.0840
     21        [36m1.0790[0m  0.0850
     22        [36m1.0750[0m  0.0870
     23        [36m1.0686[0m  0.0830
     24        [36m1.0644[0m  0.0860
     25        [36m1.0593[0m  0.0840
     26        [36m1.0548[0m  0.0880
     27        [36m1.0509[0m  0.0800
     28        [36m1.0474[0m  0.0830
     29        [36m1.0428[0m  0.0810
     30        [36m1.0399[0m  0.0890
     31        [36m1.0381[0m  0.0840
     32        [36m1.0348[0m  0.0850
     33        [36m1.0342[0m  0.0820
     34        [36m1.0293[0m  0.0890
     35        1.0311  0.0830
     36        [36m1.0253[0m  0.0870
     37        [36m1.0227[0m  0.0830
     38        [36m1.0199[0m  0.0850
     39        [36m1.0179[0m  0.0820
     40        [36m1.0174[0m  0.0900
  epoch    train_loss     dur
-------  ------------  ------
      1      

     23        [36m1.3860[0m  0.0810
     24        [36m1.3859[0m  0.0800
     25        [36m1.3858[0m  0.0840
     26        [36m1.3828[0m  0.0800
     27        [36m1.3517[0m  0.0860
     28        [36m1.3176[0m  0.0860
     29        [36m1.2761[0m  0.0820
     30        [36m1.2319[0m  0.0860
     31        [36m1.1920[0m  0.0880
     32        [36m1.1858[0m  0.0870
     33        [36m1.1374[0m  0.0820
     34        [36m1.1197[0m  0.0850
     35        [36m1.0946[0m  0.0880
     36        [36m1.0805[0m  0.0890
     37        [36m1.0637[0m  0.0860
     38        [36m1.0522[0m  0.0880
     39        [36m1.0407[0m  0.0800
     40        [36m1.0290[0m  0.0840
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4064[0m  0.0790
      2        [36m1.3896[0m  0.0850
      3        [36m1.3884[0m  0.0890
      4        [36m1.3876[0m  0.0810
      5        [36m1.3871[0m  0.0810
      6        [36m1.3868[0m  0.0810
    

     38        1.0416  0.0800
     39        1.0412  0.0830
     40        1.0407  0.0870
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6032[0m  0.0840
      2        [36m1.3866[0m  0.0840
      3        [36m1.3865[0m  0.0840
      4        1.3866  0.0860
      5        1.3866  0.0850
      6        1.3866  0.0830
      7        1.3866  0.0830
      8        1.3866  0.0803
      9        1.3866  0.0820
     10        1.3866  0.0810
     11        1.3866  0.0830
     12        1.3866  0.0860
     13        1.3866  0.0840
     14        1.3866  0.0850
     15        1.3866  0.0870
     16        1.3866  0.0840
     17        1.3866  0.0920
     18        1.3866  0.0830
     19        1.3866  0.0910
     20        1.3866  0.0800
     21        1.3866  0.0860
     22        1.3866  0.0830
     23        1.3866  0.0840
     24        1.3866  0.0890
     25        1.3866  0.0830
     26        1.3866  0.0860
     27        1.3866  0.0840
     28      

      9        1.3865  0.0840
     10        1.3865  0.0800
     11        1.3865  0.0810
     12        1.3865  0.0860
     13        1.3865  0.0840
     14        1.3865  0.0900
     15        1.3865  0.0810
     16        1.3865  0.0890
     17        1.3865  0.0870
     18        1.3865  0.0830
     19        1.3865  0.0860
     20        1.3865  0.0820
     21        1.3865  0.0790
     22        1.3865  0.0880
     23        1.3865  0.0840
     24        1.3865  0.0830
     25        1.3865  0.0830
     26        1.3865  0.0820
     27        1.3865  0.0830
     28        1.3865  0.0840
     29        1.3865  0.0940
     30        1.3865  0.0900
     31        1.3865  0.0860
     32        1.3865  0.0930
     33        1.3865  0.0930
     34        1.3865  0.0860
     35        1.3865  0.0850
     36        1.3865  0.0820
     37        1.3865  0.0800
     38        1.3865  0.0860
     39        1.3865  0.0890
     40        1.3865  0.0980
  epoch    train_loss     dur
-------  -

     35        1.3865  0.0900
     36        1.3865  0.0850
     37        1.3865  0.0880
     38        1.3865  0.0830
     39        1.3865  0.0890
     40        1.3865  0.0890
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5454[0m  0.0860
      2        [36m1.3865[0m  0.0850
      3        1.3865  0.0800
      4        1.3865  0.0830
      5        1.3865  0.0840
      6        1.3865  0.0870
      7        1.3865  0.0800
      8        1.3865  0.0870
      9        1.3865  0.0800
     10        1.3865  0.0800
     11        1.3865  0.0840
     12        1.3865  0.0890
     13        1.3865  0.0830
     14        1.3865  0.0880
     15        1.3865  0.0940
     16        1.3865  0.0950
     17        1.3865  0.0830
     18        1.3865  0.0840
     19        1.3865  0.0840
     20        1.3865  0.0820
     21        1.3865  0.0870
     22        1.3865  0.0860
     23        1.3865  0.0910
     24        1.3865  0.0840
     25        1.3865 

      8       11.9568  0.0920
      9       11.9568  0.0930
     10       11.9568  0.0880
     11       11.9568  0.0910
     12       11.9568  0.0900
     13       11.9568  0.0830
     14       11.9568  0.0860
     15       11.9568  0.0860
     16       11.9568  0.0890
     17       11.9568  0.0840
     18       11.9568  0.0870
     19       11.9568  0.0830
     20       11.9568  0.0860
     21       11.9568  0.0920
     22       11.9568  0.0850
     23       11.9568  0.0870
     24       11.9568  0.0850
     25       11.9568  0.0840
     26       11.9568  0.1010
     27       11.9568  0.0920
     28       11.9568  0.0930
     29       11.9568  0.0940
     30       11.9568  0.0890
     31       11.9568  0.0830
     32       11.9568  0.0890
     33       11.9568  0.0930
     34       11.9568  0.0900
     35       11.9568  0.0940
     36       11.9568  0.0990
     37       11.9568  0.0990
     38       11.9568  0.0980
     39       11.9568  0.0910
     40       11.9568  0.0950
  epoch   

     16        [36m1.3881[0m  0.0830
     17        1.3881  0.0830
     18        1.3881  0.0910
     19        1.3881  0.0850
     20        1.3881  0.0860
     21        1.3881  0.0860
     22        1.3881  0.0840
     23        1.3881  0.0920
     24        1.3881  0.0900
     25        1.3881  0.0910
     26        1.3881  0.0870
     27        [36m1.3881[0m  0.0860
     28        1.3881  0.0900
     29        1.3881  0.0900
     30        [36m1.3881[0m  0.0810
     31        1.3881  0.0960
     32        1.3881  0.0910
     33        1.3881  0.0860
     34        1.3881  0.0840
     35        1.3881  0.0900
     36        1.3881  0.0920
     37        1.3881  0.0830
     38        1.3881  0.0830
     39        1.3881  0.0850
     40        1.3881  0.0850
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4999[0m  0.0850
      2        [36m1.3955[0m  0.0860
      3        [36m1.3874[0m  0.0880
      4        1.3874  0.0840
      5        1

     23        [36m0.9837[0m  0.0870
     24        0.9849  0.0950
     25        [36m0.9749[0m  0.0940
     26        [36m0.9734[0m  0.0840
     27        0.9840  0.0900
     28        [36m0.9643[0m  0.0830
     29        0.9846  0.0960
     30        [36m0.9616[0m  0.0920
     31        0.9676  0.0930
     32        0.9757  0.0850
     33        [36m0.9569[0m  0.0880
     34        0.9636  0.0930
     35        [36m0.9568[0m  0.0840
     36        0.9576  0.0860
     37        0.9614  0.0860
     38        [36m0.9521[0m  0.0850
     39        [36m0.9496[0m  0.0850
     40        0.9516  0.0850
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7124[0m  0.0870
      2        [36m1.3471[0m  0.0840
      3        [36m1.2982[0m  0.0900
      4        [36m1.1939[0m  0.0920
      5        [36m1.0753[0m  0.0870
      6        [36m0.9794[0m  0.0970
      7        [36m0.9599[0m  0.0900
      8        [36m0.9473[0m  0.0870
      9

      6        [36m1.3887[0m  0.0920
      7        [36m1.3880[0m  0.0830
      8        [36m1.3875[0m  0.0830
      9        [36m1.3872[0m  0.0900
     10        [36m1.3870[0m  0.0920
     11        [36m1.3868[0m  0.0890
     12        [36m1.3867[0m  0.0850
     13        [36m1.3866[0m  0.0950
     14        [36m1.3865[0m  0.0880
     15        [36m1.3864[0m  0.0930
     16        [36m1.3864[0m  0.0820
     17        [36m1.3864[0m  0.0850
     18        [36m1.3864[0m  0.0820
     19        [36m1.3864[0m  0.0820
     20        [36m1.3863[0m  0.0910
     21        [36m1.3863[0m  0.0880
     22        [36m1.3863[0m  0.0890
     23        [36m1.3863[0m  0.0870
     24        [36m1.3863[0m  0.0890
     25        [36m1.3863[0m  0.0870
     26        [36m1.3863[0m  0.0900
     27        [36m1.3863[0m  0.0870
     28        [36m1.3863[0m  0.0850
     29        [36m1.3863[0m  0.0880
     30        [36m1.3863[0m  0.0910
     31        [36m1.386

     14        [36m1.3863[0m  0.0890
     15        [36m1.3863[0m  0.1000
     16        [36m1.3863[0m  0.0830
     17        [36m1.3863[0m  0.0940
     18        1.3863  0.0920
     19        1.3863  0.0930
     20        1.3863  0.0890
     21        1.3863  0.0950
     22        1.3863  0.0900
     23        1.3863  0.0850
     24        1.3863  0.0980
     25        1.3863  0.0850
     26        1.3863  0.0860
     27        1.3863  0.0890
     28        1.3863  0.0880
     29        1.3863  0.0860
     30        1.3863  0.0840
     31        1.3863  0.0910
     32        1.3863  0.0900
     33        1.3863  0.0880
     34        1.3863  0.0860
     35        1.3863  0.0890
     36        1.3863  0.1010
     37        1.3863  0.0990
     38        1.3863  0.0910
     39        1.3863  0.0960
     40        1.3863  0.1150
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6603[0m  0.1010
      2        [36m1.3169[0m  0.1150
      3        

      6        1.3866  0.0850
      7        1.3866  0.0820
      8        1.3866  0.0870
      9        1.3866  0.0870
     10        1.3866  0.0870
     11        1.3866  0.0890
     12        1.3866  0.0870
     13        1.3866  0.0870
     14        1.3866  0.0910
     15        1.3866  0.0930
     16        1.3866  0.0900
     17        1.3866  0.0840
     18        1.3866  0.0840
     19        1.3866  0.0810
     20        1.3866  0.0870
     21        1.3866  0.0850
     22        1.3866  0.0850
     23        1.3866  0.0870
     24        1.3866  0.0820
     25        1.3866  0.0850
     26        1.3866  0.0900
     27        1.3866  0.0910
     28        1.3866  0.0880
     29        1.3866  0.0920
     30        1.3866  0.0960
     31        1.3866  0.0880
     32        1.3866  0.0830
     33        1.3866  0.0890
     34        1.3866  0.0870
     35        1.3866  0.0930
     36        1.3866  0.0860
     37        1.3866  0.0890
     38        1.3866  0.0910
     39   

      3       [36m11.9426[0m  0.0930
      4       11.9568  0.0830
      5       11.9568  0.0880
      6       11.9568  0.0890
      7       11.9568  0.0920
      8       11.9568  0.0920
      9       11.9568  0.0860
     10       [36m11.9147[0m  0.0910
     11       11.9568  0.0910
     12       11.9568  0.0950
     13       11.9568  0.0910
     14       11.9568  0.0950
     15       11.9568  0.0940
     16       11.9568  0.0920
     17       11.9568  0.0960
     18       11.9568  0.0960
     19       11.9568  0.0920
     20       11.9568  0.0950
     21       11.9568  0.0860
     22       11.9568  0.0950
     23       11.9568  0.0810
     24       11.9568  0.0880
     25       11.9568  0.0860
     26       11.9568  0.0900
     27       11.9567  0.0880
     28        [36m5.5498[0m  0.0870
     29        [36m1.3869[0m  0.0860
     30        [36m1.3867[0m  0.0810
     31        [36m1.3867[0m  0.0900
     32        [36m1.3867[0m  0.0870
     33        [36m1.3866[0m  0.088

     12        1.3865  0.0820
     13        1.3865  0.0840
     14        1.3865  0.0850
     15        1.3865  0.0870
     16        1.3865  0.0920
     17        1.3865  0.0880
     18        1.3865  0.0880
     19        1.3865  0.0870
     20        1.3865  0.0990
     21        1.3865  0.0940
     22        1.3865  0.0920
     23        1.3865  0.0860
     24        1.3865  0.0920
     25        1.3865  0.0850
     26        1.3865  0.0880
     27        1.3865  0.1060
     28        1.3865  0.0960
     29        1.3865  0.0880
     30        1.3865  0.0890
     31        1.3865  0.0870
     32        1.3865  0.0830
     33        1.3865  0.0860
     34        1.3865  0.0920
     35        1.3865  0.0880
     36        1.3865  0.1070
     37        1.3865  0.0860
     38        1.3865  0.0850
     39        1.3865  0.0870
     40        1.3865  0.0850
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7972[0m  0.0900
      2        [36m1.3876[0m 

     24        1.3876  0.0880
     25        1.3876  0.0840
     26        1.3876  0.0900
     27        1.3876  0.0850
     28        1.3876  0.0840
     29        1.3876  0.0860
     30        1.3876  0.0930
     31        1.3876  0.0830
     32        1.3876  0.0830
     33        1.3876  0.0860
     34        1.3876  0.0810
     35        1.3876  0.0810
     36        1.3876  0.0800
     37        1.3876  0.0820
     38        1.3876  0.0880
     39        1.3876  0.0830
     40        1.3876  0.0850
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9503[0m  0.0830
      2       11.9568  0.0930
      3       11.9568  0.0940
      4        [36m6.8085[0m  0.0870
      5        [36m1.3880[0m  0.0840
      6        [36m1.3875[0m  0.0860
      7        1.3875  0.0880
      8        1.3875  0.0800
      9        1.3875  0.0900
     10        1.3875  0.0880
     11        1.3875  0.0850
     12        1.3875  0.0880
     13        1.3875  0.0840
    

     33        1.3874  0.0820
     34        1.3874  0.0850
     35        1.3874  0.0880
     36        1.3874  0.0930
     37        1.3874  0.0880
     38        1.3874  0.0830
     39        1.3874  0.0870
     40        1.3874  0.0900
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m7.6262[0m  0.0890
      2        [36m2.7502[0m  0.0920
      3        5.7288  0.0890
      4        [36m1.5118[0m  0.0890
      5        [36m1.3881[0m  0.0930
      6        [36m1.3879[0m  0.0820
      7        [36m1.3878[0m  0.0850
      8        1.3878  0.0860
      9        1.3878  0.0910
     10        1.3878  0.0850
     11        1.3878  0.0910
     12        1.3878  0.0920
     13        1.3878  0.0910
     14        1.3878  0.0860
     15        1.3878  0.0830
     16        1.3878  0.0890
     17        1.3878  0.0880
     18        1.3878  0.0930
     19        1.3878  0.0830
     20        1.3878  0.0910
     21        1.3878  0.0910
     22        1

     25        0.9108  0.0870
     26        [36m0.9097[0m  0.0860
     27        0.9115  0.0860
     28        0.9109  0.0860
     29        [36m0.9095[0m  0.0850
     30        [36m0.9070[0m  0.0860
     31        0.9085  0.0880
     32        0.9074  0.0870
     33        0.9085  0.0860
     34        0.9083  0.0840
     35        0.9074  0.0820
     36        0.9079  0.0830
     37        0.9083  0.0840
     38        0.9097  0.0860
     39        0.9152  0.0900
     40        0.9244  0.0860
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.8652[0m  0.0870
      2        [36m1.2923[0m  0.0900
      3        [36m1.2539[0m  0.0920
      4        [36m1.2025[0m  0.0860
      5        [36m1.1605[0m  0.0940
      6        [36m1.1179[0m  0.0850
      7        [36m1.0806[0m  0.0880
      8        [36m1.0285[0m  0.0950
      9        [36m0.9460[0m  0.0950
     10        [36m0.9251[0m  0.0820
     11        [36m0.9230[0m  0.0830
    

      2        [36m1.0751[0m  0.0860
      3        [36m0.9774[0m  0.0840
      4        [36m0.9688[0m  0.0820
      5        [36m0.9665[0m  0.0910
      6        [36m0.9621[0m  0.0830
      7        [36m0.9329[0m  0.0860
      8        [36m0.9285[0m  0.0910
      9        [36m0.9217[0m  0.0820
     10        0.9243  0.0830
     11        [36m0.9216[0m  0.0870
     12        [36m0.9122[0m  0.0850
     13        [36m0.9093[0m  0.0840
     14        0.9112  0.0840
     15        0.9105  0.0890
     16        0.9163  0.0910
     17        0.9364  0.0950
     18        0.9198  0.0880
     19        0.9191  0.0900
     20        0.9128  0.0970
     21        0.9107  0.0960
     22        0.9101  0.0830
     23        0.9101  0.0920
     24        [36m0.9041[0m  0.0870
     25        [36m0.9027[0m  0.0830
     26        [36m0.9026[0m  0.0840
     27        [36m0.8993[0m  0.0940
     28        [36m0.8985[0m  0.0930
     29        [36m0.8968[0m  0.0860
     30

     24        [36m1.0675[0m  0.0870
     25        [36m1.0673[0m  0.0930
     26        [36m1.0588[0m  0.0920
     27        [36m1.0505[0m  0.0920
     28        [36m1.0453[0m  0.0870
     29        [36m1.0429[0m  0.0940
     30        [36m1.0425[0m  0.0870
     31        [36m1.0402[0m  0.0930
     32        [36m1.0401[0m  0.0850
     33        [36m1.0336[0m  0.0920
     34        1.0352  0.0830
     35        [36m1.0284[0m  0.0850
     36        [36m1.0263[0m  0.0880
     37        1.0274  0.0820
     38        [36m1.0255[0m  0.0890
     39        [36m1.0228[0m  0.0880
     40        [36m1.0189[0m  0.0880
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.2251[0m  0.0830
      2        [36m1.3688[0m  0.0840
      3        [36m1.3426[0m  0.0850
      4        [36m1.3009[0m  0.0890
      5        [36m1.2616[0m  0.0910
      6        [36m1.1992[0m  0.0890
      7        [36m1.0412[0m  0.0960
      8        [36m1.

     17        [36m1.3410[0m  0.0910
     18        1.3895  0.0840
     19        1.3865  0.0860
     20        1.3866  0.0850
     21        1.3866  0.0900
     22        1.3866  0.0850
     23        1.3866  0.0910
     24        1.3866  0.0865
     25        1.3866  0.0960
     26        1.3866  0.0890
     27        1.3866  0.0920
     28        1.3866  0.0860
     29        1.3866  0.0890
     30        1.3866  0.0840
     31        1.3866  0.0894
     32        1.3866  0.0840
     33        1.3866  0.0900
     34        1.3866  0.0860
     35        1.3866  0.0870
     36        1.3866  0.0870
     37        1.3866  0.0900
     38        1.3866  0.0910
     39        1.3866  0.0920
     40        1.3866  0.0890
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9510[0m  0.0950
      2       11.9568  0.0940
      3       11.9568  0.0950
      4       11.9568  0.0880
      5       11.9568  0.0880
      6       11.9568  0.0920
      7       11.9568 

     22        1.3866  0.0820
     23        1.3866  0.0870
     24        1.3866  0.0870
     25        1.3866  0.0910
     26        1.3866  0.0840
     27        1.3866  0.1385
     28        1.3866  0.0920
     29        1.3866  0.0840
     30        1.3866  0.0970
     31        1.3866  0.0920
     32        1.3866  0.0890
     33        1.3866  0.0890
     34        1.3866  0.0910
     35        1.3866  0.0920
     36        1.3866  0.0870
     37        1.3866  0.0970
     38        1.3866  0.0910
     39        1.3866  0.0900
     40        1.3866  0.0870
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8357[0m  0.0880
      2       11.9589  0.0850
      3        [36m4.0111[0m  0.0860
      4        [36m1.3866[0m  0.0850
      5        [36m1.3865[0m  0.0990
      6        [36m1.3865[0m  0.0870
      7        1.3865  0.0952
      8        1.3865  0.0900
      9        1.3865  0.0910
     10        1.3865  0.0910
     11        1.3865  0.

     38       11.9547  0.0880
     39       11.9547  0.0860
     40       11.9547  0.1020
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8474[0m  0.0870
      2       11.9589  0.0900
      3       11.9589  0.0930
      4       11.9589  0.0920
      5       11.9589  0.1000
      6       11.9589  0.0915
      7       11.9589  0.1061
      8       11.9589  0.0890
      9       11.9589  0.0920
     10       11.9589  0.0890
     11       11.9589  0.0980
     12       11.9589  0.0842
     13       11.9589  0.0860
     14       11.9589  0.0850
     15       11.9589  0.0940
     16       11.9589  0.0950
     17       11.9589  0.0860
     18       11.9589  0.0960
     19       11.9589  0.1120
     20       11.9589  0.0890
     21       11.9589  0.0950
     22       11.9589  0.0870
     23       11.9589  0.0860
     24       11.9589  0.0980
     25       11.9589  0.0870
     26       11.9589  0.0940
     27       11.9589  0.0940
     28       11.9589  0.0870
 

     10        1.3884  0.0920
     11        1.3884  0.0850
     12        1.3884  0.0880
     13        1.3884  0.0930
     14        1.3884  0.0920
     15        1.3884  0.0840
     16        1.3884  0.0850
     17        1.3884  0.1080
     18        1.3884  0.0890
     19        1.3884  0.0940
     20        1.3884  0.0830
     21        1.3884  0.0910
     22        1.3884  0.0910
     23        1.3884  0.0930
     24        1.3884  0.0920
     25        1.3884  0.0970
     26        1.3884  0.0920
     27        1.3884  0.0900
     28        1.3884  0.1010
     29        1.3884  0.0890
     30        1.3884  0.0910
     31        1.3884  0.0880
     32        1.3884  0.0920
     33        1.3884  0.0890
     34        1.3884  0.0920
     35        1.3884  0.0900
     36        1.3884  0.0900
     37        1.3884  0.0890
     38        1.3884  0.0890
     39        1.3884  0.0940
     40        1.3884  0.1080
  epoch    train_loss     dur
-------  ------------  ------
      1   

     23        1.3880  0.0980
     24        1.3880  0.0930
     25        1.3880  0.0940
     26        1.3880  0.0930
     27        1.3880  0.0960
     28        1.3880  0.1000
     29        1.3880  0.1050
     30        1.3880  0.0870
     31        1.3880  0.0830
     32        1.3880  0.0880
     33        1.3880  0.0890
     34        1.3880  0.0880
     35        1.3880  0.0900
     36        1.3880  0.0920
     37        1.3880  0.0900
     38        1.3880  0.0910
     39        1.3880  0.0950
     40        1.3880  0.0870
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m3.1589[0m  0.0930
      2        [36m1.3189[0m  0.0970
      3        [36m1.2719[0m  0.0960
      4        [36m1.1843[0m  0.0950
      5        [36m1.0628[0m  0.0920
      6        [36m0.9765[0m  0.0930
      7        [36m0.9417[0m  0.0900
      8        [36m0.9412[0m  0.0840
      9        [36m0.9251[0m  0.0900
     10        [36m0.9165[0m  0.0840
     11   

      6        [36m1.3867[0m  0.0890
      7        [36m1.3851[0m  0.0950
      8        [36m1.3804[0m  0.1290
      9        [36m1.3740[0m  0.1170
     10        [36m1.3671[0m  0.1030
     11        [36m1.3597[0m  0.0950
     12        [36m1.3507[0m  0.0930
     13        [36m1.3364[0m  0.0920
     14        [36m1.3151[0m  0.0860
     15        [36m1.2677[0m  0.1040
     16        [36m1.2148[0m  0.0910
     17        [36m1.1806[0m  0.0940
     18        [36m1.1591[0m  0.1010
     19        [36m1.1331[0m  0.1010
     20        [36m1.1033[0m  0.0940
     21        [36m1.0945[0m  0.0980
     22        [36m1.0765[0m  0.0920
     23        [36m1.0668[0m  0.0970
     24        [36m1.0512[0m  0.0930
     25        [36m1.0459[0m  0.0860
     26        [36m1.0313[0m  0.0890
     27        [36m1.0219[0m  0.0840
     28        [36m1.0146[0m  0.0980
     29        [36m1.0106[0m  0.0910
     30        [36m1.0042[0m  0.0830
     31        [36m0.999

     24        [36m0.9228[0m  0.1520
     25        0.9245  0.1170
     26        0.9231  0.0960
     27        0.9239  0.0890
     28        0.9230  0.0840
     29        0.9230  0.0960
     30        0.9238  0.0990
     31        0.9232  0.0950
     32        [36m0.9220[0m  0.0940
     33        0.9238  0.0980
     34        0.9234  0.0960
     35        [36m0.9218[0m  0.0990
     36        0.9227  0.0970
     37        0.9236  0.0990
     38        0.9225  0.0980
     39        0.9225  0.1130
     40        0.9231  0.0840
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7870[0m  0.0860
      2        [36m1.3924[0m  0.0880
      3        [36m1.3903[0m  0.0990
      4        [36m1.3889[0m  0.1010
      5        [36m1.3880[0m  0.1000
      6        [36m1.3874[0m  0.0910
      7        [36m1.3871[0m  0.0930
      8        [36m1.3868[0m  0.0900
      9        [36m1.3866[0m  0.0910
     10        [36m1.3865[0m  0.0870
     11      

     17       11.9547  0.1030
     18       11.9547  0.1020
     19       11.9547  0.1040
     20       11.9547  0.1010
     21       11.9547  0.1000
     22       11.9547  0.1010
     23       11.9547  0.0940
     24       11.9547  0.1000
     25       11.9547  0.1050
     26       11.9547  0.1000
     27       11.9547  0.0950
     28       11.9547  0.0950
     29       11.9547  0.0990
     30       11.9547  0.1020
     31       11.9547  0.0930
     32       11.9547  0.0920
     33       11.9547  0.1030
     34       11.9547  0.1020
     35       11.9547  0.0990
     36       11.9547  0.0980
     37       11.9547  0.0900
     38       11.9547  0.1190
     39       11.9547  0.1040
     40       11.9547  0.0970
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8606[0m  0.0890
      2       11.9568  0.0900
      3       11.9568  0.1010
      4       11.9568  0.0980
      5       11.9568  0.0930
      6       11.9568  0.0870
      7       11.9568  0.0870
 

     34        1.3865  0.0900
     35        1.3865  0.0900
     36        1.3865  0.0900
     37        1.3865  0.0920
     38        1.3865  0.0890
     39        1.3865  0.0930
     40        1.3865  0.0870
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7626[0m  0.0820
      2        [36m1.3868[0m  0.0830
      3        [36m1.3866[0m  0.0900
      4        1.3866  0.1030
      5        1.3866  0.1010
      6        1.3866  0.0980
      7        [36m1.3866[0m  0.0890
      8        [36m1.3865[0m  0.0860
      9        [36m1.3865[0m  0.0890
     10        [36m1.3865[0m  0.0920
     11        [36m1.3865[0m  0.0870
     12        1.3865  0.0860
     13        1.3865  0.0910
     14        1.3865  0.1050
     15        1.3865  0.0960
     16        1.3865  0.0960
     17        1.3865  0.1100
     18        1.3865  0.0860
     19        1.3865  0.0950
     20        1.3865  0.0830
     21        1.3865  0.0980
     22        1.3866  0.086

      2       11.9568  0.0900
      3        [36m8.8319[0m  0.0950
      4        [36m1.3866[0m  0.0870
      5        [36m1.3865[0m  0.0890
      6        [36m1.3861[0m  0.0930
      7        [36m1.3635[0m  0.0830
      8        [36m1.3619[0m  0.0910
      9        1.3865  0.0900
     10        1.3865  0.0840
     11        1.3865  0.0830
     12        1.3865  0.0880
     13        1.3865  0.0880
     14        1.3865  0.0900
     15        1.3865  0.0870
     16        1.3865  0.0880
     17        1.3865  0.0860
     18        1.3865  0.0860
     19        1.3865  0.0940
     20        1.3865  0.0860
     21        1.3865  0.0890
     22        1.3865  0.0840
     23        1.3865  0.0840
     24        1.3865  0.0870
     25        1.3865  0.0890
     26        1.3865  0.0960
     27        1.3865  0.0860
     28        1.3865  0.0860
     29        1.3865  0.0890
     30        1.3865  0.0890
     31        1.3865  0.0870
     32        1.3865  0.0860
     33        1

     18        1.3876  0.0930
     19        1.3876  0.0910
     20        1.3876  0.0960
     21        1.3876  0.0870
     22        1.3876  0.0870
     23        1.3876  0.0890
     24        1.3876  0.0850
     25        1.3876  0.0930
     26        1.3876  0.0860
     27        1.3876  0.0850
     28        1.3876  0.0930
     29        1.3876  0.0890
     30        1.3876  0.0890
     31        1.3876  0.0920
     32        1.3876  0.0830
     33        1.3876  0.0910
     34        1.3876  0.0830
     35        1.3876  0.0840
     36        1.3876  0.0920
     37        1.3876  0.0940
     38        1.3876  0.0890
     39        1.3876  0.0920
     40        1.3876  0.0890
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8916[0m  0.0850
      2       11.9568  0.0900
      3       11.9568  0.0870
      4       [36m11.8596[0m  0.0870
      5        [36m1.3878[0m  0.0920
      6        [36m1.3875[0m  0.0900
      7        1.3875  0.0890
    

     30        1.3874  0.0870
     31        1.3874  0.0840
     32        1.3874  0.0900
     33        1.3874  0.0870
     34        1.3874  0.0880
     35        1.3874  0.0880
     36        1.3874  0.0860
     37        1.3874  0.0830
     38        1.3874  0.0890
     39        1.3874  0.0890
     40        1.3874  0.0850
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.4590[0m  0.0980
      2        [36m4.4270[0m  0.0910
      3       10.9856  0.0950
      4       11.6871  0.0950
      5        6.1632  0.0860
      6        4.5783  0.0870
      7       11.0496  0.0890
      8        6.6774  0.0890
      9        [36m1.6158[0m  0.0930
     10        5.1933  0.0850
     11        9.9536  0.0870
     12        9.2915  0.0890
     13       10.6062  0.0920
     14        5.3153  0.0870
     15        4.6687  0.0890
     16        [36m1.5807[0m  0.0870
     17        1.7285  0.0940
     18        1.5990  0.0870
     19        [36m1.5221[0m  0.

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7945[0m  0.0820
      2        [36m1.3919[0m  0.0850
      3        [36m1.3840[0m  0.0860
      4        [36m1.3758[0m  0.0840
      5        [36m1.3671[0m  0.0850
      6        [36m1.3545[0m  0.0840
      7        [36m1.3361[0m  0.0860
      8        [36m1.3106[0m  0.1190
      9        [36m1.2809[0m  0.1060
     10        [36m1.2451[0m  0.0940
     11        [36m1.2181[0m  0.0900
     12        [36m1.1961[0m  0.0880
     13        [36m1.1772[0m  0.0850
     14        [36m1.1620[0m  0.0890
     15        [36m1.1471[0m  0.0880
     16        [36m1.1365[0m  0.0950
     17        [36m1.1300[0m  0.0960
     18        [36m1.1271[0m  0.0800
     19        [36m1.1203[0m  0.0860
     20        [36m1.1123[0m  0.0870
     21        [36m1.0978[0m  0.0790
     22        [36m1.0936[0m  0.0880
     23        [36m1.0859[0m  0.0820
     24        [36m1.0780[0m  0.0850
    

     17        [36m1.3864[0m  0.0950
     18        [36m1.3864[0m  0.0810
     19        [36m1.3863[0m  0.0830
     20        [36m1.3863[0m  0.0810
     21        [36m1.3863[0m  0.0870
     22        1.3863  0.0800
     23        [36m1.3863[0m  0.0800
     24        [36m1.3862[0m  0.0840
     25        [36m1.3862[0m  0.0870
     26        1.3863  0.0850
     27        1.3863  0.0850
     28        [36m1.3862[0m  0.0820
     29        1.3862  0.0790
     30        [36m1.3860[0m  0.0880
     31        1.3862  0.0840
     32        [36m1.3854[0m  0.0840
     33        1.3861  0.0840
     34        1.3863  0.0800
     35        1.3863  0.0840
     36        1.3863  0.0800
     37        1.3863  0.0850
     38        1.3863  0.0850
     39        1.3863  0.0820
     40        1.3863  0.0810
     41        1.3863  0.0880
     42        1.3863  0.0840
     43        1.3863  0.0920
     44        1.3863  0.0870
     45        1.3863  0.0840
     46        1.3863  0.0830
 

     33        [36m0.9384[0m  0.0870
     34        [36m0.9373[0m  0.0920
     35        0.9375  0.0910
     36        0.9377  0.0810
     37        0.9376  0.0870
     38        [36m0.9368[0m  0.0830
     39        [36m0.9368[0m  0.0840
     40        [36m0.9367[0m  0.0850
     41        0.9370  0.0910
     42        0.9367  0.0870
     43        0.9367  0.0860
     44        0.9367  0.0940
     45        [36m0.9366[0m  0.0880
     46        [36m0.9365[0m  0.0870
     47        [36m0.9365[0m  0.0840
     48        [36m0.9364[0m  0.0840
     49        0.9364  0.0870
     50        [36m0.9362[0m  0.0850
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4950[0m  0.0920
      2        [36m1.4125[0m  0.0910
      3        [36m1.4035[0m  0.0940
      4        [36m1.3975[0m  0.0940
      5        [36m1.3936[0m  0.0900
      6        [36m1.3910[0m  0.0940
      7        [36m1.3893[0m  0.0870
      8        [36m1.3882[0m  0.085

     49        1.3863  0.0810
     50        1.3863  0.0810
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5847[0m  0.0850
      2        [36m1.3864[0m  0.0850
      3        1.3865  0.0830
      4        1.3866  0.0920
      5        1.3866  0.0880
      6        1.3866  0.0810
      7        1.3866  0.0860
      8        1.3866  0.0840
      9        1.3866  0.0800
     10        1.3866  0.0870
     11        1.3866  0.0850
     12        1.3866  0.0810
     13        1.3866  0.0870
     14        1.3866  0.0870
     15        1.3866  0.0846
     16        1.3866  0.0940
     17        1.3866  0.0880
     18        1.3866  0.0860
     19        1.3866  0.0820
     20        1.3866  0.0870
     21        1.3866  0.0890
     22        1.3866  0.0820
     23        1.3866  0.0870
     24        1.3866  0.0810
     25        1.3866  0.0820
     26        1.3866  0.0870
     27        1.3866  0.0810
     28        1.3866  0.0820
     29        1.3866 

     24        [36m1.3865[0m  0.0980
     25        [36m1.3865[0m  0.0850
     26        [36m1.3865[0m  0.0880
     27        [36m1.3865[0m  0.0900
     28        [36m1.3865[0m  0.0870
     29        [36m1.3865[0m  0.0900
     30        [36m1.3865[0m  0.0850
     31        [36m1.3865[0m  0.0810
     32        [36m1.3865[0m  0.0870
     33        [36m1.3865[0m  0.0920
     34        [36m1.3865[0m  0.0810
     35        [36m1.3865[0m  0.0850
     36        [36m1.3865[0m  0.0810
     37        [36m1.3865[0m  0.0869
     38        [36m1.3865[0m  0.0860
     39        [36m1.3865[0m  0.0810
     40        [36m1.3865[0m  0.0860
     41        [36m1.3865[0m  0.0830
     42        [36m1.3865[0m  0.0830
     43        [36m1.3865[0m  0.0820
     44        [36m1.3865[0m  0.0900
     45        [36m1.3865[0m  0.0840
     46        [36m1.3865[0m  0.0810
     47        [36m1.3865[0m  0.0860
     48        [36m1.3865[0m  0.0870
     49        [36m1.386

      2        [36m1.3870[0m  0.0910
      3        [36m1.3865[0m  0.0880
      4        1.3865  0.0850
      5        1.3865  0.0840
      6        1.3865  0.0870
      7        1.3865  0.0860
      8        1.3865  0.0870
      9        1.3865  0.0870
     10        1.3865  0.0860
     11        1.3865  0.0840
     12        1.3865  0.0890
     13        1.3865  0.0830
     14        1.3865  0.0910
     15        1.3865  0.0890
     16        1.3865  0.0840
     17        1.3865  0.0820
     18        1.3865  0.0900
     19        1.3865  0.0890
     20        1.3865  0.0930
     21        1.3865  0.0830
     22        1.3865  0.0850
     23        1.3865  0.0910
     24        1.3865  0.0840
     25        1.3865  0.0880
     26        1.3865  0.0810
     27        1.3865  0.0820
     28        1.3865  0.0830
     29        1.3865  0.0840
     30        1.3865  0.0860
     31        1.3865  0.0860
     32        1.3865  0.1400
     33        1.3865  0.0940
     34        1.3865 

     10        1.3865  0.0870
     11        1.3865  0.0870
     12        1.3865  0.1190
     13        1.3865  0.1140
     14        1.3865  0.0930
     15        1.3865  0.0890
     16        1.3865  0.0900
     17        1.3865  0.0910
     18        1.3865  0.0860
     19        1.3865  0.0800
     20        1.3865  0.0950
     21        1.3865  0.0890
     22        1.3865  0.0890
     23        1.3865  0.0810
     24        1.3865  0.0920
     25        1.3865  0.0870
     26        1.3865  0.0850
     27        1.3865  0.0840
     28        1.3865  0.0830
     29        1.3865  0.0800
     30        1.3865  0.0940
     31        1.3865  0.0920
     32        1.3865  0.0870
     33        1.3865  0.0890
     34        1.3865  0.0860
     35        1.3865  0.0880
     36        1.3865  0.0870
     37        1.3865  0.0890
     38        1.3865  0.0840
     39        1.3865  0.0840
     40        1.3865  0.0880
     41        1.3865  0.0870
     42        1.3865  0.0830
     43   

     11        [36m1.3882[0m  0.0870
     12        [36m1.3882[0m  0.0950
     13        [36m1.3882[0m  0.0800
     14        [36m1.3882[0m  0.0820
     15        [36m1.3882[0m  0.0890
     16        [36m1.3882[0m  0.0900
     17        [36m1.3882[0m  0.0980
     18        [36m1.3882[0m  0.0850
     19        [36m1.3882[0m  0.0940
     20        [36m1.3882[0m  0.0830
     21        [36m1.3882[0m  0.0820
     22        1.3882  0.0850
     23        [36m1.3882[0m  0.0950
     24        [36m1.3882[0m  0.0920
     25        [36m1.3882[0m  0.0890
     26        [36m1.3882[0m  0.0940
     27        1.3882  0.0920
     28        1.3882  0.1000
     29        1.3882  0.0940
     30        [36m1.3882[0m  0.0810
     31        1.3882  0.0820
     32        1.3882  0.0840
     33        1.3882  0.0900
     34        1.3882  0.0810
     35        1.3882  0.0860
     36        1.3882  0.0870
     37        1.3882  0.0860
     38        1.3882  0.0870
     39        1

     10        [36m1.3881[0m  0.0920
     11        1.3881  0.0900
     12        1.3881  0.0820
     13        1.3881  0.0910
     14        [36m1.3881[0m  0.0870
     15        1.3881  0.0920
     16        1.3881  0.0850
     17        1.3881  0.0970
     18        1.3881  0.0820
     19        1.3881  0.0810
     20        1.3881  0.0870
     21        1.3881  0.0870
     22        1.3881  0.0860
     23        1.3881  0.0920
     24        1.3881  0.0920
     25        1.3881  0.0840
     26        1.3881  0.0830
     27        1.3881  0.0820
     28        1.3881  0.0840
     29        1.3881  0.0820
     30        1.3881  0.0840
     31        1.3881  0.0840
     32        1.3881  0.0870
     33        1.3881  0.0910
     34        1.3881  0.0800
     35        1.3881  0.0810
     36        1.3881  0.0870
     37        1.3881  0.0820
     38        1.3881  0.0920
     39        1.3881  0.0880
     40        1.3881  0.0940
     41        1.3881  0.0860
     42        1.3881 

     17        1.3880  0.0930
     18        1.3880  0.0940
     19        1.3880  0.0910
     20        1.3880  0.0940
     21        1.3880  0.0890
     22        1.3880  0.0910
     23        1.3880  0.0930
     24        1.3880  0.0930
     25        1.3880  0.0810
     26        1.3880  0.0860
     27        1.3880  0.0860
     28        1.3880  0.0830
     29        1.3880  0.0830
     30        1.3880  0.0880
     31        1.3880  0.0900
     32        1.3880  0.0860
     33        1.3880  0.0920
     34        1.3880  0.0870
     35        1.3880  0.0900
     36        1.3880  0.0820
     37        1.3880  0.0840
     38        1.3880  0.0840
     39        1.3880  0.0820
     40        1.3880  0.0940
     41        1.3880  0.0840
     42        1.3880  0.0880
     43        1.3880  0.0840
     44        1.3880  0.0900
     45        1.3880  0.0830
     46        1.3880  0.0870
     47        1.3880  0.0840
     48        1.3880  0.0840
     49        1.3880  0.0860
     50   

     40        [36m1.3863[0m  0.0980
     41        [36m1.3863[0m  0.0860
     42        [36m1.3863[0m  0.0890
     43        1.3863  0.0850
     44        [36m1.3863[0m  0.0870
     45        [36m1.3863[0m  0.0950
     46        1.3863  0.0880
     47        1.3863  0.1030
     48        [36m1.3863[0m  0.0890
     49        1.3863  0.0930
     50        [36m1.3863[0m  0.0920
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5880[0m  0.0940
      2        [36m1.3611[0m  0.0960
      3        [36m1.3196[0m  0.0910
      4        [36m1.2568[0m  0.0830
      5        [36m1.1598[0m  0.0830
      6        [36m1.0730[0m  0.0910
      7        [36m1.0529[0m  0.0870
      8        [36m1.0224[0m  0.0830
      9        [36m0.9984[0m  0.0870
     10        [36m0.9875[0m  0.0800
     11        [36m0.9721[0m  0.0840
     12        [36m0.9599[0m  0.0830
     13        [36m0.9539[0m  0.0900
     14        [36m0.9476[0m  0.0870
 

      7        [36m1.1485[0m  0.0940
      8        [36m1.1046[0m  0.0910
      9        1.1053  0.0870
     10        [36m1.0626[0m  0.0940
     11        1.0678  0.0880
     12        [36m1.0469[0m  0.0930
     13        [36m1.0444[0m  0.0870
     14        [36m1.0354[0m  0.0920
     15        [36m1.0196[0m  0.0820
     16        1.0255  0.0840
     17        [36m0.9995[0m  0.0890
     18        1.0047  0.0830
     19        [36m0.9857[0m  0.0910
     20        [36m0.9778[0m  0.0960
     21        1.0310  0.0940
     22        [36m0.9722[0m  0.1040
     23        [36m0.9689[0m  0.0920
     24        0.9731  0.1120
     25        0.9942  0.1130
     26        [36m0.9560[0m  0.1440
     27        0.9724  0.0930
     28        [36m0.9525[0m  0.0900
     29        0.9582  0.0910
     30        0.9598  0.0980
     31        [36m0.9429[0m  0.1030
     32        0.9469  0.0910
     33        0.9504  0.0920
     34        [36m0.9374[0m  0.0970
     35        0

     32        [36m1.3863[0m  0.0850
     33        [36m1.3863[0m  0.0940
     34        [36m1.3863[0m  0.0890
     35        [36m1.3863[0m  0.0890
     36        [36m1.3863[0m  0.0850
     37        [36m1.3863[0m  0.0890
     38        [36m1.3863[0m  0.0970
     39        [36m1.3863[0m  0.0940
     40        [36m1.3863[0m  0.0940
     41        [36m1.3863[0m  0.0980
     42        [36m1.3863[0m  0.0920
     43        [36m1.3863[0m  0.0960
     44        1.3863  0.0910
     45        [36m1.3863[0m  0.0890
     46        [36m1.3863[0m  0.0900
     47        1.3863  0.0900
     48        [36m1.3863[0m  0.0900
     49        [36m1.3863[0m  0.0850
     50        [36m1.3863[0m  0.0810
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.8080[0m  0.0930
      2        [36m1.2496[0m  0.0880
      3        [36m1.1405[0m  0.0930
      4        [36m1.0546[0m  0.0970
      5        [36m0.9976[0m  0.0950
      6        [36m0.

      5       11.9568  0.0960
      6       11.9568  0.0910
      7       11.9568  0.0860
      8       11.9568  0.1030
      9       11.9568  0.0930
     10       11.9568  0.0920
     11       11.9568  0.1000
     12       11.9568  0.0940
     13       11.9568  0.0890
     14       11.9568  0.0880
     15       11.9568  0.1000
     16       11.9568  0.0910
     17       11.9568  0.0950
     18       11.9568  0.0920
     19       11.9568  0.0970
     20       11.9568  0.0980
     21       11.9568  0.0880
     22       11.9568  0.0970
     23       11.9568  0.0970
     24       11.9568  0.0890
     25       11.9568  0.0910
     26       11.9568  0.1040
     27       11.9568  0.0940
     28       11.9568  0.0910
     29       11.9568  0.0840
     30       11.9568  0.0840
     31       11.9568  0.0870
     32       11.9568  0.0840
     33       11.9568  0.0860
     34       11.9568  0.0850
     35       11.9568  0.0850
     36       11.9568  0.0860
     37       11.9568  0.0860
     38   

      2        [36m1.3867[0m  0.0860
      3        [36m1.3865[0m  0.0860
      4        [36m1.3865[0m  0.0860
      5        1.3865  0.0860
      6        1.3865  0.0860
      7        1.3865  0.0960
      8        1.3865  0.0890
      9        1.3865  0.0870
     10        1.3865  0.0870
     11        1.3865  0.0930
     12        1.3865  0.0880
     13        1.3865  0.1400
     14        1.3865  0.0900
     15        1.3865  0.0870
     16        1.3865  0.0930
     17        1.3865  0.0810
     18        1.3865  0.0850
     19        1.3865  0.0820
     20        1.3865  0.0900
     21        1.3865  0.0880
     22        1.3865  0.0850
     23        1.3865  0.0850
     24        1.3865  0.0870
     25        1.3865  0.0870
     26        1.3865  0.0840
     27        1.3865  0.0840
     28        1.3865  0.0860
     29        1.3865  0.0880
     30        1.3865  0.0840
     31        1.3865  0.0850
     32        1.3865  0.0910
     33        1.3865  0.0920
     34      

     49        1.3865  0.0990
     50        1.3865  0.1010
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7332[0m  0.0950
      2       [36m10.2029[0m  0.1010
      3        [36m1.3872[0m  0.0910
      4        [36m1.3865[0m  0.0910
      5        [36m1.3865[0m  0.0960
      6        [36m1.3865[0m  0.0980
      7        [36m1.3865[0m  0.0950
      8        1.3865  0.0890
      9        1.3865  0.0920
     10        1.3865  0.0970
     11        1.3865  0.0970
     12        1.3865  0.0950
     13        1.3865  0.0980
     14        1.3865  0.0940
     15        1.3865  0.0940
     16        1.3865  0.0940
     17        1.3865  0.0960
     18        1.3865  0.0960
     19        1.3865  0.0900
     20        1.3865  0.0840
     21        1.3865  0.0870
     22        1.3865  0.0840
     23        1.3865  0.0920
     24        1.3865  0.0890
     25        1.3865  0.0840
     26        1.3865  0.0920
     27        1.3865  0.0890
     28

     46        1.3876  0.0860
     47        1.3876  0.0880
     48        1.3876  0.0910
     49        1.3876  0.0920
     50        [36m1.3876[0m  0.0910
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8880[0m  0.0930
      2       11.9589  0.0930
      3       11.9589  0.1030
      4       11.9589  0.0940
      5       11.9589  0.0940
      6       11.9589  0.0910
      7       11.9589  0.0910
      8       11.9589  0.0930
      9       11.9589  0.0930
     10       11.9589  0.0880
     11       11.9589  0.0940
     12       11.9589  0.0850
     13       11.9589  0.0860
     14       11.9589  0.0900
     15       11.9589  0.0880
     16       11.9589  0.0920
     17       11.9589  0.0920
     18       11.9589  0.0960
     19       11.9589  0.0900
     20       11.9589  0.0930
     21       11.9589  0.0900
     22       11.9589  0.0910
     23       11.9589  0.0910
     24       11.9589  0.0880
     25       11.9589  0.0920
     26       11.9589 

      2        [36m1.3879[0m  0.0920
      3        [36m1.3879[0m  0.0840
      4        [36m1.3879[0m  0.0860
      5        [36m1.3879[0m  0.0920
      6        [36m1.3879[0m  0.0930
      7        [36m1.3879[0m  0.0820
      8        1.3879  0.0890
      9        [36m1.3879[0m  0.0920
     10        1.3879  0.0850
     11        [36m1.3879[0m  0.0900
     12        1.3879  0.0880
     13        [36m1.3879[0m  0.0810
     14        1.3879  0.0850
     15        1.3879  0.0930
     16        1.3879  0.0840
     17        1.3879  0.0920
     18        1.3879  0.0940
     19        1.3879  0.0870
     20        1.3879  0.0970
     21        1.3879  0.0870
     22        1.3879  0.0900
     23        1.3879  0.0960
     24        1.3879  0.0850
     25        1.3879  0.0910
     26        1.3879  0.0900
     27        1.3879  0.0890
     28        1.3879  0.0920
     29        1.3879  0.0880
     30        1.3879  0.0850
     31        1.3879  0.0850
     32        1.38

      3        [36m6.7280[0m  0.0940
      4        [36m1.5582[0m  0.0890
      5        7.3487  0.0890
      6        6.1868  0.0910
      7       10.2183  0.0900
      8        5.5680  0.0870
      9        7.8144  0.0920
     10        6.8368  0.0900
     11        6.1807  0.0900
     12        [36m1.4427[0m  0.0870
     13        [36m1.3885[0m  0.0820
     14        [36m1.3878[0m  0.0810
     15        1.3878  0.0870
     16        1.3878  0.0880
     17        1.3878  0.0830
     18        1.3878  0.0880
     19        1.3878  0.0820
     20        1.3878  0.0870
     21        1.3878  0.0920
     22        1.3878  0.0940
     23        1.3878  0.0880
     24        1.3878  0.0820
     25        1.3878  0.0900
     26        1.3878  0.0840
     27        1.3878  0.0860
     28        1.3878  0.0840
     29        1.3878  0.0850
     30        1.3878  0.0850
     31        1.3878  0.0850
     32        1.3878  0.0890
     33        1.3878  0.0840
     34        1.3878  0.

     46        0.8713  0.0910
     47        0.8726  0.0940
     48        [36m0.8695[0m  0.0890
     49        0.8711  0.0960
     50        0.8731  0.0910
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7136[0m  0.0900
      2        [36m1.2098[0m  0.0900
      3        [36m1.0490[0m  0.0940
      4        [36m0.9685[0m  0.0910
      5        [36m0.9468[0m  0.0940
      6        [36m0.9367[0m  0.0890
      7        0.9400  0.0920
      8        [36m0.9204[0m  0.0900
      9        [36m0.9144[0m  0.0910
     10        [36m0.9089[0m  0.0890
     11        0.9124  0.0980
     12        0.9126  0.0970
     13        0.9359  0.0960
     14        0.9265  0.0970
     15        0.9113  0.0890
     16        0.9145  0.0920
     17        [36m0.9044[0m  0.0910
     18        0.9050  0.0920
     19        [36m0.9024[0m  0.0940
     20        [36m0.9009[0m  0.0930
     21        [36m0.8958[0m  0.0940
     22        [36m0.8948[0m  0.

      9        [36m0.9464[0m  0.0820
     10        [36m0.9386[0m  0.0840
     11        [36m0.9275[0m  0.0910
     12        [36m0.9219[0m  0.0910
     13        [36m0.9155[0m  0.1130
     14        [36m0.9153[0m  0.0970
     15        [36m0.9121[0m  0.0970
     16        [36m0.9087[0m  0.0900
     17        [36m0.9054[0m  0.0920
     18        [36m0.9053[0m  0.0910
     19        [36m0.9033[0m  0.0820
     20        [36m0.9025[0m  0.0890
     21        [36m0.9016[0m  0.0870
     22        [36m0.9001[0m  0.0960
     23        [36m0.9000[0m  0.0870
     24        [36m0.8981[0m  0.0860
     25        [36m0.8977[0m  0.0890
     26        0.8982  0.0940
     27        0.8985  0.0940
     28        [36m0.8975[0m  0.0880
     29        0.8978  0.1010
     30        [36m0.8965[0m  0.0910
     31        0.8965  0.0900
     32        [36m0.8950[0m  0.0830
     33        [36m0.8937[0m  0.0870
     34        [36m0.8936[0m  0.0890
     35        [36m0.

     27        [36m1.0454[0m  0.0880
     28        1.0474  0.0880
     29        1.0485  0.0890
     30        1.0473  0.0840
     31        1.0474  0.0880
     32        [36m1.0407[0m  0.0840
     33        [36m1.0405[0m  0.0840
     34        1.0410  0.0820
     35        [36m1.0368[0m  0.0900
     36        1.0373  0.0930
     37        1.0384  0.0860
     38        [36m1.0359[0m  0.0860
     39        [36m1.0335[0m  0.0850
     40        1.0349  0.0830
     41        1.0356  0.0950
     42        1.0342  0.0940
     43        [36m1.0334[0m  0.0880
     44        [36m1.0294[0m  0.0880
     45        [36m1.0264[0m  0.0900
     46        [36m1.0242[0m  0.0930
     47        1.0249  0.0930
     48        [36m1.0156[0m  0.0860
     49        [36m1.0150[0m  0.0900
     50        1.0172  0.0890
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6648[0m  0.0990
      2        [36m1.3896[0m  0.0930
      3        [36m1.3883[0m  0.

      2        [36m1.3864[0m  0.0980
      3        [36m1.3844[0m  0.0930
      4        [36m1.3726[0m  0.0960
      5        1.3869  0.0940
      6        1.3867  0.0950
      7        1.3867  0.0900
      8        1.3867  0.0950
      9        1.3867  0.1010
     10        1.3867  0.0920
     11        1.3867  0.0980
     12        1.3867  0.0930
     13        1.3867  0.0940
     14        1.3867  0.0910
     15        1.3867  0.0980
     16        1.3867  0.0890
     17        1.3867  0.0930
     18        1.3867  0.1010
     19        1.3867  0.0980
     20        1.3867  0.0930
     21        1.3867  0.0920
     22        1.3867  0.0910
     23        1.3867  0.0920
     24        1.3867  0.0860
     25        1.3867  0.0900
     26        1.3867  0.0960
     27        1.3867  0.1010
     28        1.3867  0.0970
     29        1.3867  0.0930
     30        1.3867  0.0970
     31        1.3867  0.0940
     32        1.3867  0.0940
     33        1.3867  0.0910
     34      

     12       11.9568  0.0910
     13       11.9568  0.1200
     14       11.9568  0.0940
     15       11.9568  0.1010
     16       11.9568  0.0900
     17       11.9568  0.0970
     18       11.9568  0.1010
     19       11.9633  0.0910
     20       11.9589  0.1030
     21       11.9589  0.0950
     22       11.9589  0.0970
     23       11.9589  0.0950
     24       11.9589  0.0930
     25       11.9589  0.1000
     26       11.9589  0.0910
     27       11.9589  0.1030
     28       11.9589  0.0940
     29       11.9589  0.0910
     30       11.9589  0.0950
     31       11.9589  0.0960
     32       11.9589  0.0910
     33       11.9589  0.0870
     34       11.9589  0.0930
     35       11.9589  0.0920
     36       11.9589  0.0920
     37       [36m10.0718[0m  0.0930
     38        [36m1.3866[0m  0.0860
     39        [36m1.3865[0m  0.0910
     40        1.3866  0.0900
     41        1.3866  0.0990
     42        1.3866  0.0980
     43        1.3866  0.0950
     44      

      9        [36m1.3866[0m  0.0910
     10        [36m1.3866[0m  0.0900
     11        1.3866  0.0920
     12        1.3866  0.0970
     13        1.3866  0.1000
     14        1.3866  0.0980
     15        1.3866  0.0950
     16        1.3866  0.0850
     17        1.3866  0.0890
     18        1.3866  0.0910
     19        1.3866  0.0990
     20        1.3866  0.1000
     21        1.3866  0.0900
     22        1.3866  0.0950
     23        1.3866  0.0880
     24        1.3866  0.0930
     25        1.3866  0.0930
     26        1.3866  0.0900
     27        1.3866  0.0940
     28        1.3866  0.0900
     29        1.3866  0.0880
     30        1.3866  0.0890
     31        1.3866  0.0990
     32        1.3866  0.0980
     33        1.3866  0.0950
     34        1.3866  0.0880
     35        1.3866  0.0940
     36        1.3866  0.0960
     37        1.3866  0.0950
     38        1.3866  0.0940
     39        1.3866  0.1580
     40        1.3866  0.1020
     41        1.3866 

     13       11.9568  0.0980
     14       11.9568  0.0940
     15       11.9568  0.1000
     16       11.9568  0.0910
     17       11.9568  0.0990
     18       11.9568  0.0940
     19       11.9568  0.0880
     20       11.9568  0.0960
     21       11.9568  0.1000
     22       11.9568  0.1050
     23       11.9568  0.0970
     24       11.9568  0.0920
     25       11.9568  0.0990
     26       11.9568  0.0890
     27       11.9568  0.0940
     28       11.9568  0.0900
     29       11.9568  0.0940
     30       11.9568  0.0930
     31       11.9568  0.0920
     32       11.9568  0.0980
     33       11.9568  0.0970
     34       11.9568  0.0970
     35       11.9568  0.0930
     36       11.9568  0.0960
     37       11.9568  0.0910
     38       11.9568  0.1000
     39       11.9568  0.0990
     40       11.9568  0.0970
     41       11.9568  0.0940
     42       11.9568  0.1010
     43       11.9568  0.0920
     44       11.9568  0.0950
     45       11.9568  0.0950
     46   

     10        1.3876  0.0930
     11        1.3876  0.0970
     12        1.3876  0.0990
     13        1.3876  0.1010
     14        1.3876  0.0980
     15        1.3876  0.0850
     16        1.3876  0.0880
     17        1.3876  0.0930
     18        1.3876  0.0940
     19        1.3876  0.0970
     20        1.3876  0.0910
     21        1.3876  0.0880
     22        1.3876  0.0870
     23        1.3876  0.0980
     24        1.3876  0.0910
     25        1.3876  0.0880
     26        1.3876  0.1000
     27        1.3876  0.0980
     28        1.3876  0.0950
     29        1.3876  0.0880
     30        1.3876  0.0940
     31        1.3876  0.0930
     32        1.3876  0.0940
     33        1.3876  0.1290
     34        1.3876  0.0960
     35        1.3876  0.0970
     36        1.3876  0.0990
     37        1.3876  0.1010
     38        1.3876  0.0950
     39        1.3876  0.0880
     40        1.3876  0.0930
     41        1.3876  0.0860
     42        1.3876  0.0870
     43   

     16        5.0998  0.0910
     17        3.2474  0.1000
     18        [36m1.4860[0m  0.1020
     19        9.0584  0.1020
     20        1.6218  0.0970
     21        [36m1.3947[0m  0.0930
     22        [36m1.3874[0m  0.0930
     23        [36m1.3873[0m  0.0930
     24        1.3874  0.0960
     25        1.3874  0.0920
     26        1.3874  0.0860
     27        1.3874  0.0930
     28        1.3874  0.0890
     29        1.3874  0.0910
     30        1.3874  0.0880
     31        1.3874  0.0920
     32        1.3874  0.0940
     33        1.3874  0.0930
     34        1.3874  0.0920
     35        1.3874  0.0920
     36        1.3874  0.0890
     37        1.3874  0.0940
     38        1.3874  0.0940
     39        1.3874  0.0920
     40        1.3874  0.0870
     41        1.3874  0.0920
     42        1.3874  0.0980
     43        1.3874  0.0950
     44        1.3874  0.1570
     45        1.3874  0.1030
     46        1.3874  0.1010
     47        1.3874  0.0970
    

     18        0.9241  0.0960
     19        0.9242  0.0950
     20        0.9245  0.0970
     21        0.9261  0.0910
     22        0.9278  0.0900
     23        0.9311  0.0910
     24        0.9420  0.0910
     25        0.9415  0.0880
     26        0.9293  0.0920
     27        0.9278  0.0900
     28        0.9255  0.0930
     29        [36m0.9224[0m  0.0900
     30        [36m0.9202[0m  0.0940
     31        [36m0.9173[0m  0.0950
     32        [36m0.9153[0m  0.0940
     33        [36m0.9129[0m  0.1010
     34        [36m0.9106[0m  0.0970
     35        [36m0.9075[0m  0.0930
     36        [36m0.9045[0m  0.0930
     37        [36m0.9019[0m  0.0880
     38        [36m0.9007[0m  0.0910
     39        [36m0.8981[0m  0.0920
     40        [36m0.8960[0m  0.1000
     41        [36m0.8909[0m  0.0930
     42        0.8910  0.0910
     43        [36m0.8906[0m  0.0940
     44        0.8907  0.0920
     45        [36m0.8888[0m  0.0960
     46        [36m0.886

     41        [36m0.8702[0m  0.1000
     42        0.8749  0.1020
     43        [36m0.8673[0m  0.0940
     44        [36m0.8622[0m  0.0900
     45        0.8625  0.0960
     46        0.8624  0.0900
     47        [36m0.8540[0m  0.0950
     48        0.8556  0.0990
     49        0.8556  0.1320
     50        [36m0.8517[0m  0.0980
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m4.9556[0m  0.0890
      2        [36m1.3263[0m  0.0910
      3        [36m1.2077[0m  0.0970
      4        [36m1.0532[0m  0.0950
      5        [36m0.9634[0m  0.0970
      6        [36m0.9383[0m  0.0960
      7        [36m0.9321[0m  0.0930
      8        [36m0.9222[0m  0.0910
      9        [36m0.9182[0m  0.0940
     10        [36m0.9163[0m  0.0920
     11        [36m0.9140[0m  0.0920
     12        0.9141  0.0920
     13        [36m0.9123[0m  0.0930
     14        [36m0.9100[0m  0.0990
     15        [36m0.9081[0m  0.0910
     16        [36

     10        [36m0.9409[0m  0.0930
     11        0.9460  0.0910
     12        0.9435  0.0870
     13        0.9612  0.0920
     14        0.9786  0.0950
     15        0.9521  0.0990
     16        0.9453  0.0910
     17        0.9416  0.0960
     18        [36m0.9378[0m  0.0900
     19        [36m0.9344[0m  0.0970
     20        [36m0.9314[0m  0.0970
     21        [36m0.9295[0m  0.0900
     22        0.9297  0.0900
     23        [36m0.9276[0m  0.0910
     24        [36m0.9242[0m  0.0910
     25        [36m0.9236[0m  0.0950
     26        [36m0.9235[0m  0.1020
     27        [36m0.9196[0m  0.1040
     28        0.9206  0.1030
     29        [36m0.9187[0m  0.0960
     30        0.9189  0.0980
     31        [36m0.9174[0m  0.0890
     32        0.9174  0.0990
     33        [36m0.9142[0m  0.0960
     34        0.9150  0.1040
     35        [36m0.9136[0m  0.1140
     36        0.9142  0.1010
     37        0.9141  0.0960
     38        0.9144  0.0930
    

     49        0.9196  0.0890
     50        0.9191  0.1020
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.9690[0m  0.0870
      2        [36m1.2522[0m  0.0920
      3        [36m1.1483[0m  0.0910
      4        [36m1.0698[0m  0.0940
      5        [36m1.0427[0m  0.0920
      6        [36m1.0191[0m  0.0920
      7        [36m0.9871[0m  0.0890
      8        0.9942  0.0920
      9        [36m0.9743[0m  0.0890
     10        0.9805  0.0910
     11        [36m0.9650[0m  0.0920
     12        0.9695  0.0900
     13        [36m0.9645[0m  0.0890
     14        0.9650  0.0910
     15        [36m0.9642[0m  0.0980
     16        [36m0.9628[0m  0.0940
     17        [36m0.9625[0m  0.0880
     18        0.9627  0.0940
     19        [36m0.9612[0m  0.0890
     20        0.9612  0.0930
     21        0.9629  0.0940
     22        [36m0.9600[0m  0.0950
     23        0.9634  0.0880
     24        [36m0.9594[0m  0.0980
     25        0

      4        1.3865  0.0980
      5        1.3865  0.0950
      6        1.3865  0.0890
      7        1.3865  0.0980
      8        1.3865  0.0860
      9        1.3865  0.0850
     10        1.3865  0.0890
     11        1.3865  0.0920
     12        1.3865  0.0910
     13        1.3865  0.0940
     14        1.3865  0.0860
     15        1.3865  0.0860
     16        1.3865  0.0870
     17        1.3865  0.0940
     18        1.3865  0.0850
     19        1.3865  0.0860
     20        1.3865  0.0930
     21        1.3865  0.0900
     22        1.3865  0.0970
     23        1.3865  0.0920
     24        1.3865  0.0920
     25        1.3865  0.0890
     26        1.3865  0.0860
     27        1.3865  0.0900
     28        1.3865  0.0910
     29        1.3865  0.0890
     30        1.3865  0.0870
     31        1.3865  0.0830
     32        1.3865  0.0920
     33        1.3865  0.0920
     34        1.3865  0.0880
     35        1.3865  0.0880
     36        1.3865  0.0880
     37   

     12       11.9568  0.0920
     13       11.9568  0.0940
     14       11.9568  0.0900
     15       12.0554  0.0910
     16       11.9568  0.0950
     17       11.9568  0.0890
     18       11.9568  0.0950
     19       11.9568  0.0890
     20       11.9568  0.0910
     21       11.9568  0.0940
     22       11.9568  0.0960
     23       11.9568  0.0920
     24        [36m9.4733[0m  0.0880
     25        [36m1.3769[0m  0.0900
     26        1.3873  0.0870
     27        1.3866  0.0880
     28        1.3866  0.0940
     29        1.3865  0.0860
     30        1.3871  0.0870
     31        1.3858  0.0840
     32        [36m1.3576[0m  0.0840
     33        1.3882  0.0870
     34        1.3865  0.0840
     35        1.3865  0.0870
     36        1.3864  0.0870
     37        1.3821  0.0880
     38        [36m1.3199[0m  0.0830
     39        1.3335  0.0910
     40        1.3518  0.0960
     41        [36m1.2644[0m  0.0890
     42        1.3955  0.0870
     43        1.3866  0.

     17        1.3865  0.0950
     18        1.3865  0.0900
     19        1.3865  0.0920
     20        1.3865  0.0910
     21        1.3865  0.0860
     22        1.3865  0.0880
     23        1.3865  0.0860
     24        1.3865  0.0870
     25        1.3865  0.0930
     26        1.3865  0.0920
     27        1.3865  0.0840
     28        [36m1.3865[0m  0.0930
     29        1.3865  0.0880
     30        1.3865  0.0920
     31        1.3865  0.0840
     32        1.3865  0.0870
     33        [36m1.3865[0m  0.0840
     34        1.3865  0.0890
     35        1.3865  0.0850
     36        1.3865  0.0900
     37        1.3865  0.0930
     38        1.3865  0.0870
     39        1.3865  0.0910
     40        1.3865  0.0980
     41        1.3865  0.0980
     42        1.3865  0.0990
     43        1.3865  0.0930
     44        1.3865  0.0950
     45        1.3865  0.0950
     46        1.3865  0.0920
     47        1.3865  0.0930
     48        1.3865  0.0930
     49        1.3865 

     26       11.9568  0.1030
     27       11.9568  0.0910
     28       11.9568  0.0930
     29       11.9568  0.0870
     30       11.9568  0.0930
     31       11.9568  0.0920
     32       11.9568  0.0900
     33       11.9568  0.0930
     34       11.9568  0.0910
     35       11.9568  0.1510
     36       11.9568  0.1020
     37       11.9568  0.0910
     38       11.9568  0.0910
     39       11.9568  0.0960
     40       11.9568  0.0960
     41       11.9568  0.0890
     42       11.9568  0.1010
     43       11.9568  0.1050
     44       11.9568  0.0920
     45       11.9568  0.0900
     46       11.9568  0.0870
     47       11.9568  0.0980
     48       11.9568  0.0990
     49       11.9568  0.0980
     50       11.9568  0.0970
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9507[0m  0.0860
      2       11.9589  0.0920
      3       11.9589  0.1010
      4       [36m11.7609[0m  0.0950
      5       12.0142  0.1030
      6       11.9568 

     33        1.3881  0.0970
     34        1.3881  0.0840
     35        1.3881  0.0920
     36        1.3881  0.0870
     37        1.3881  0.0890
     38        1.3881  0.0900
     39        1.3881  0.0950
     40        1.3881  0.0830
     41        1.3881  0.0870
     42        1.3881  0.0830
     43        1.3881  0.0880
     44        1.3881  0.0990
     45        1.3881  0.0970
     46        1.3881  0.0920
     47        1.3881  0.0950
     48        1.3881  0.0950
     49        1.3881  0.0960
     50        1.3881  0.0910
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.2452[0m  0.0910
      2        [36m4.3553[0m  0.1400
      3       11.0934  0.1030
      4        9.0437  0.0920
      5        7.0468  0.0930
      6        [36m1.4033[0m  0.0900
      7        [36m1.3875[0m  0.0830
      8        1.3899  0.0880
      9        [36m1.3874[0m  0.0870
     10        [36m1.3874[0m  0.0890
     11        1.3874  0.0910
     12        1

     35        1.3880  0.0980
     36        1.3880  0.0860
     37        1.3880  0.0890
     38        1.3880  0.0910
     39        1.3880  0.0870
     40        1.3880  0.0880
     41        1.3880  0.0870
     42        1.3880  0.0900
     43        1.3880  0.0840
     44        1.3880  0.0890
     45        1.3880  0.0890
     46        1.3880  0.0960
     47        1.3880  0.0940
     48        1.3880  0.1020
     49        1.3880  0.0950
     50        1.3880  0.0870
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4018[0m  0.0700
      2        [36m1.3886[0m  0.0660
      3        [36m1.3881[0m  0.0660
      4        [36m1.3877[0m  0.0690
      5        [36m1.3874[0m  0.0670
      6        [36m1.3872[0m  0.0690
      7        [36m1.3870[0m  0.0710
      8        [36m1.3868[0m  0.0710
      9        [36m1.3866[0m  0.0720
     10        [36m1.3865[0m  0.0710
  epoch    train_loss     dur
-------  ------------  ------
      1   

      3        [36m1.3870[0m  0.0660
      4        [36m1.3864[0m  0.0660
      5        [36m1.3864[0m  0.0650
      6        [36m1.3864[0m  0.0690
      7        [36m1.3864[0m  0.0670
      8        1.3864  0.0720
      9        1.3864  0.0670
     10        1.3864  0.0740
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7582[0m  0.0650
      2        [36m1.3920[0m  0.0650
      3        [36m1.3873[0m  0.0690
      4        [36m1.3866[0m  0.0640
      5        [36m1.3864[0m  0.0640
      6        [36m1.3864[0m  0.0740
      7        [36m1.3864[0m  0.0640
      8        [36m1.3864[0m  0.0650
      9        [36m1.3864[0m  0.0720
     10        [36m1.3864[0m  0.0660
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4458[0m  0.0640
      2        [36m1.3883[0m  0.0670
      3        [36m1.3864[0m  0.0690
      4        [36m1.3863[0m  0.0700
      5        1.3864  0.0640
      6        1.38

      2        [36m1.3884[0m  0.0720
      3        [36m1.3877[0m  0.0750
      4        [36m1.3875[0m  0.0780
      5        [36m1.3875[0m  0.0710
      6        1.3875  0.0670
      7        [36m1.3875[0m  0.0720
      8        [36m1.3875[0m  0.0710
      9        [36m1.3875[0m  0.0680
     10        [36m1.3875[0m  0.0640
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7811[0m  0.0750
      2       11.9568  0.0720
      3       11.9568  0.0660
      4       11.9568  0.0700
      5       11.9568  0.0720
      6       11.9568  0.0700
      7       11.9568  0.0700
      8        [36m9.6502[0m  0.0690
      9        [36m1.3878[0m  0.0630
     10        1.3879  0.0720
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.1736[0m  0.0660
      2       11.9568  0.0750
      3       11.9568  0.0710
      4       11.9568  0.0660
      5       11.9568  0.0730
      6       11.9568  0.0770
      7       11.9568 

      3        [36m1.3568[0m  0.0680
      4        [36m1.3235[0m  0.0640
      5        [36m1.2628[0m  0.0720
      6        [36m1.1872[0m  0.0720
      7        [36m1.1127[0m  0.0660
      8        [36m1.0620[0m  0.0710
      9        [36m1.0106[0m  0.0680
     10        [36m0.9909[0m  0.0680
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.6669[0m  0.0660
      2        [36m1.3932[0m  0.0750
      3        [36m1.3912[0m  0.0650
      4        [36m1.3900[0m  0.0750
      5        [36m1.3891[0m  0.0690
      6        [36m1.3884[0m  0.0650
      7        [36m1.3879[0m  0.0650
      8        [36m1.3875[0m  0.0660
      9        [36m1.3872[0m  0.0650
     10        [36m1.3869[0m  0.0680
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.7069[0m  0.0670
      2        [36m1.3944[0m  0.0660
      3        [36m1.3926[0m  0.0680
      4        [36m1.3912[0m  0.0660
      5        [36m1.

      2       11.9589  0.0680
      3       11.9589  0.0700
      4       11.9589  0.0740
      5       11.9589  0.0760
      6       11.9589  0.0710
      7       11.9589  0.0730
      8       11.9589  0.0670
      9       11.9589  0.0700
     10       11.9589  0.0700
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8652[0m  0.0720
      2       11.9568  0.0730
      3       11.9568  0.0730
      4       11.9568  0.0690
      5       11.9568  0.0690
      6       11.9568  0.0690
      7       11.9568  0.0720
      8       11.9568  0.0690
      9       11.9568  0.0710
     10       11.9568  0.0690
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7868[0m  0.0670
      2       11.9568  0.0740
      3       11.9568  0.0680
      4       11.9568  0.0700
      5       11.9568  0.0750
      6       11.9568  0.0770
      7       11.9568  0.0690
      8       11.9568  0.0770
      9       11.9568  0.0730
     10       11.9568 

      4        [36m1.1335[0m  0.0700
      5        [36m1.0463[0m  0.0710
      6        [36m1.0115[0m  0.0670
      7        [36m0.9995[0m  0.0720
      8        [36m0.9705[0m  0.0760
      9        [36m0.9490[0m  0.0700
     10        [36m0.9430[0m  0.0730
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6539[0m  0.0680
      2        [36m1.3612[0m  0.0720
      3        [36m1.2946[0m  0.0690
      4        [36m1.2444[0m  0.0750
      5        [36m1.1826[0m  0.0720
      6        [36m1.0938[0m  0.0760
      7        [36m1.0277[0m  0.0720
      8        [36m1.0046[0m  0.0737
      9        1.0177  0.0720
     10        1.0130  0.0720
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.0328[0m  0.0730
      2        [36m1.3759[0m  0.0740
      3        [36m1.3567[0m  0.0740
      4        [36m1.3349[0m  0.0670
      5        [36m1.3132[0m  0.0700
      6        [36m1.2906[0m  0.0700
 

      2       11.9589  0.0800
      3       11.9589  0.0760
      4       11.9585  0.0740
      5        [36m2.3981[0m  0.0760
      6        [36m1.3797[0m  0.0790
      7        [36m1.3410[0m  0.0790
      8        [36m1.3313[0m  0.0810
      9        1.3919  0.0810
     10        1.3869  0.0750
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.1509[0m  0.0780
      2       11.9568  0.0840
      3       11.9568  0.0850
      4       11.9568  0.0780
      5       11.9568  0.0750
      6        [36m6.1424[0m  0.0760
      7        [36m1.3865[0m  0.0650
      8        [36m1.3864[0m  0.0680
      9        [36m1.3862[0m  0.0740
     10        [36m1.3817[0m  0.0780
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7561[0m  0.0720
      2        [36m1.3871[0m  0.0770
      3        [36m1.3865[0m  0.0750
      4        [36m1.3864[0m  0.0750
      5        [36m1.3864[0m  0.0770
      6        [36m1.386

      2        [36m1.3335[0m  0.0710
      3        [36m1.2686[0m  0.0740
      4        [36m1.2055[0m  0.0760
      5        [36m1.1430[0m  0.0700
      6        [36m1.0989[0m  0.0750
      7        [36m1.0438[0m  0.0790
      8        [36m1.0145[0m  0.0760
      9        [36m0.9913[0m  0.0790
     10        [36m0.9809[0m  0.0810
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.6120[0m  0.0770
      2        [36m1.3537[0m  0.0810
      3        [36m1.3336[0m  0.0770
      4        [36m1.3174[0m  0.0710
      5        [36m1.2971[0m  0.0780
      6        [36m1.2717[0m  0.0780
      7        [36m1.2428[0m  0.0830
      8        [36m1.2144[0m  0.0820
      9        [36m1.1878[0m  0.0820
     10        [36m1.1646[0m  0.0860
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7107[0m  0.0810
      2        [36m1.3401[0m  0.0790
      3        [36m1.2551[0m  0.0740
      4        [36m1.

      3        [36m1.3865[0m  0.0680
      4        1.3866  0.0690
      5        [36m1.3864[0m  0.0740
      6        1.3864  0.0790
      7        1.3864  0.0720
      8        1.3864  0.0710
      9        1.3864  0.0760
     10        1.3864  0.0770
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.9883[0m  0.0700
      2        [36m1.3792[0m  0.0770
      3        1.3793  0.0750
      4        1.3860  0.0720
      5        [36m1.3774[0m  0.0750
      6        1.3824  0.0690
      7        [36m1.3495[0m  0.0710
      8        [36m1.2421[0m  0.0720
      9        1.3705  0.0740
     10        1.3964  0.0740
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9005[0m  0.0680
      2       11.9568  0.0700
      3       11.9568  0.0700
      4       11.9568  0.0740
      5       11.9568  0.0790
      6       11.9568  0.0740
      7       11.9568  0.0740
      8       11.9568  0.0720
      9       11.9568  0.069

      5        [36m1.3883[0m  0.0840
      6        [36m1.3875[0m  0.0800
      7        [36m1.3875[0m  0.0810
      8        1.3875  0.0790
      9        1.3875  0.0760
     10        1.3875  0.0720
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.6837[0m  0.0810
      2        [36m1.4736[0m  0.0780
      3        1.6192  0.0770
      4        1.4844  0.0680
      5        1.6334  0.0710
      6        [36m1.4492[0m  0.1470
      7       11.8917  0.0780
      8       11.9407  0.0860
      9       11.8617  0.0750
     10       11.9617  0.0710
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8301[0m  0.0760
      2        [36m2.9442[0m  0.0660
      3        [36m2.4173[0m  0.0670
      4        9.7932  0.0720
      5       10.0586  0.0730
      6        [36m1.6165[0m  0.0780
      7        [36m1.4640[0m  0.0770
      8        9.7904  0.0790
      9        4.6134  0.0740
     10        1.5424  0.0700
 

     13        [36m1.3894[0m  0.0710
     14        [36m1.3890[0m  0.0670
     15        [36m1.3886[0m  0.0760
     16        [36m1.3883[0m  0.0700
     17        [36m1.3880[0m  0.0630
     18        [36m1.3878[0m  0.0660
     19        [36m1.3875[0m  0.0670
     20        [36m1.3874[0m  0.0660
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.9909[0m  0.0640
      2        [36m1.4054[0m  0.0660
      3        [36m1.4027[0m  0.0700
      4        [36m1.4003[0m  0.0670
      5        [36m1.3983[0m  0.0640
      6        [36m1.3965[0m  0.0660
      7        [36m1.3950[0m  0.0800
      8        [36m1.3937[0m  0.0720
      9        [36m1.3926[0m  0.0670
     10        [36m1.3916[0m  0.0710
     11        [36m1.3908[0m  0.0690
     12        [36m1.3901[0m  0.0700
     13        [36m1.3895[0m  0.0660
     14        [36m1.3890[0m  0.0650
     15        [36m1.3886[0m  0.0680
     16        [36m1.3882[0m  0.0660
    

     19        1.3862  0.0710
     20        1.3862  0.0730
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.9187[0m  0.0630
      2        [36m1.3933[0m  0.0670
      3        [36m1.3870[0m  0.0630
      4        [36m1.3865[0m  0.0660
      5        [36m1.3865[0m  0.0640
      6        [36m1.3865[0m  0.0720
      7        [36m1.3865[0m  0.0750
      8        [36m1.3865[0m  0.0710
      9        [36m1.3865[0m  0.0660
     10        [36m1.3865[0m  0.0700
     11        [36m1.3865[0m  0.0670
     12        [36m1.3865[0m  0.0720
     13        [36m1.3865[0m  0.0780
     14        [36m1.3865[0m  0.0640
     15        [36m1.3865[0m  0.0700
     16        [36m1.3865[0m  0.0700
     17        [36m1.3865[0m  0.0660
     18        [36m1.3865[0m  0.0630
     19        [36m1.3865[0m  0.0640
     20        [36m1.3865[0m  0.0720
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5967[0m  0.0630
 

      2       [36m11.9568[0m  0.0720
      3       11.9568  0.0770
      4       11.9568  0.0780
      5       11.9568  0.0720
      6       11.9568  0.0770
      7       11.9568  0.0760
      8       11.9568  0.0730
      9       11.9568  0.0690
     10       11.9568  0.0670
     11       11.9568  0.0720
     12       11.9568  0.0710
     13       11.9568  0.0740
     14       11.9568  0.0750
     15       11.9568  0.0770
     16       11.9568  0.0730
     17       11.9568  0.0770
     18       11.9568  0.0740
     19       11.9568  0.0710
     20       11.9568  0.0770
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5598[0m  0.0700
      2        [36m1.3879[0m  0.0750
      3        [36m1.3879[0m  0.0740
      4        [36m1.3876[0m  0.0680
      5        [36m1.3876[0m  0.0700
      6        1.3876  0.0750
      7        1.3876  0.0760
      8        1.3876  0.0750
      9        1.3876  0.0720
     10        1.3876  0.0690
     11        1

     12        1.3877  0.0700
     13        1.3877  0.0690
     14        1.3877  0.0700
     15        1.3877  0.0670
     16        1.3877  0.0680
     17        1.3877  0.0700
     18        1.3877  0.0650
     19        1.3877  0.0710
     20        1.3877  0.0660
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4185[0m  0.0720
      2        [36m1.3955[0m  0.0800
      3        [36m1.3880[0m  0.0750
      4        [36m1.3875[0m  0.0780
      5        1.3875  0.0680
      6        1.3875  0.0730
      7        1.3875  0.0680
      8        1.3875  0.0750
      9        1.3875  0.0760
     10        1.3875  0.0740
     11        1.3875  0.0720
     12        1.3875  0.0740
     13        1.3875  0.0800
     14        1.3875  0.0690
     15        1.3875  0.0710
     16        1.3875  0.0720
     17        1.3875  0.0680
     18        1.3875  0.0700
     19        1.3875  0.0650
     20        1.3875  0.0720
  epoch    train_loss     dur
----

      2        [36m1.3782[0m  0.0750
      3        [36m1.3464[0m  0.0710
      4        [36m1.3268[0m  0.0680
      5        [36m1.3089[0m  0.0660
      6        [36m1.2925[0m  0.0710
      7        [36m1.2730[0m  0.0680
      8        [36m1.2478[0m  0.0650
      9        [36m1.2224[0m  0.0710
     10        [36m1.2072[0m  0.0680
     11        [36m1.1912[0m  0.0640
     12        [36m1.1716[0m  0.0720
     13        [36m1.1543[0m  0.0760
     14        [36m1.1411[0m  0.0720
     15        [36m1.1316[0m  0.0740
     16        [36m1.1249[0m  0.0640
     17        [36m1.1192[0m  0.0640
     18        [36m1.1143[0m  0.0690
     19        [36m1.1069[0m  0.0710
     20        [36m1.1004[0m  0.0670
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.0742[0m  0.0690
      2        [36m1.3186[0m  0.0740
      3        [36m1.2733[0m  0.0750
      4        [36m1.2423[0m  0.0710
      5        [36m1.2155[0m  0.0680
    

      5        [36m1.3864[0m  0.0730
      6        [36m1.3864[0m  0.0750
      7        1.3864  0.0720
      8        1.3864  0.0760
      9        1.3864  0.0700
     10        [36m1.3864[0m  0.0750
     11        [36m1.3864[0m  0.0680
     12        [36m1.3864[0m  0.0720
     13        [36m1.3864[0m  0.0740
     14        [36m1.3864[0m  0.0710
     15        [36m1.3864[0m  0.0720
     16        [36m1.3864[0m  0.0740
     17        [36m1.3864[0m  0.0710
     18        [36m1.3864[0m  0.0750
     19        [36m1.3864[0m  0.0730
     20        [36m1.3864[0m  0.0710
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.9689[0m  0.0720
      2        [36m1.3895[0m  0.0710
      3        [36m1.3869[0m  0.0740
      4        [36m1.3865[0m  0.0800
      5        [36m1.3864[0m  0.0710
      6        [36m1.3864[0m  0.0760
      7        [36m1.3864[0m  0.0710
      8        [36m1.3864[0m  0.0670
      9        [36m1.3864[0m 

     13        1.3864  0.0650
     14        1.3864  0.0680
     15        1.3864  0.0730
     16        1.3864  0.0670
     17        1.3864  0.0750
     18        1.3864  0.0660
     19        1.3864  0.0690
     20        1.3864  0.0760
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6371[0m  0.0700
      2        [36m1.3907[0m  0.0710
      3        [36m1.3865[0m  0.0650
      4        [36m1.3864[0m  0.0740
      5        1.3864  0.0680
      6        1.3864  0.0660
      7        1.3864  0.0660
      8        1.3864  0.0710
      9        1.3864  0.0680
     10        1.3864  0.0700
     11        1.3864  0.0710
     12        1.3864  0.0680
     13        1.3864  0.0660
     14        1.3864  0.0640
     15        1.3864  0.0670
     16        1.3864  0.0680
     17        1.3864  0.0680
     18        1.3864  0.0710
     19        1.3864  0.0670
     20        1.3864  0.0710
  epoch    train_loss     dur
-------  ------------  ------
    

      5        1.8458  0.0760
      6        9.1137  0.0830
      7        9.6954  0.0790
      8        [36m1.3899[0m  0.0790
      9       10.8684  0.0810
     10        3.7855  0.0790
     11        7.2772  0.0770
     12        6.1225  0.0840
     13        5.0186  0.0800
     14        9.6702  0.0760
     15        1.4260  0.0810
     16        8.8624  0.0830
     17       11.8399  0.0810
     18        5.4202  0.0720
     19        1.4671  0.0760
     20        1.3900  0.0730
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8149[0m  0.0790
      2       [36m11.0928[0m  0.0850
      3       11.7483  0.0780
      4       11.8764  0.0880
      5       11.8848  0.0790
      6       [36m10.5041[0m  0.0780
      7        [36m8.6021[0m  0.0810
      8       11.5247  0.0810
      9        [36m3.2735[0m  0.0770
     10        [36m1.4021[0m  0.0800
     11        [36m1.3895[0m  0.0760
     12        1.3954  0.0760
     13        [36m1.3881[

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6621[0m  0.0710
      2        [36m1.3165[0m  0.0710
      3        [36m1.2978[0m  0.0750
      4        [36m1.2802[0m  0.0780
      5        [36m1.2620[0m  0.0800
      6        [36m1.2423[0m  0.0760
      7        [36m1.2220[0m  0.0780
      8        [36m1.2007[0m  0.0720
      9        [36m1.1794[0m  0.0670
     10        [36m1.1580[0m  0.0700
     11        [36m1.1357[0m  0.0690
     12        [36m1.1161[0m  0.0730
     13        [36m1.0973[0m  0.0680
     14        [36m1.0808[0m  0.0700
     15        [36m1.0701[0m  0.0650
     16        [36m1.0589[0m  0.0740
     17        [36m1.0456[0m  0.0700
     18        [36m1.0370[0m  0.0730
     19        [36m1.0313[0m  0.0750
     20        [36m1.0222[0m  0.0710
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.6781[0m  0.0670
      2        [36m1.3441[0m  0.0680
      3        [36m1.

     20       11.9589  0.0770
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9078[0m  0.0810
      2       11.9589  0.0780
      3       11.9589  0.0780
      4       11.9589  0.0730
      5       11.9589  0.0680
      6       11.9589  0.0780
      7       11.9589  0.0790
      8       11.9589  0.0690
      9       11.9589  0.0710
     10       11.9589  0.0750
     11       11.9589  0.0710
     12       11.9589  0.0770
     13       11.9589  0.0750
     14       11.9589  0.0680
     15       11.9589  0.0710
     16       11.9589  0.0700
     17       11.9589  0.0680
     18       11.9589  0.0720
     19       11.9589  0.0710
     20       11.9589  0.0780
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9070[0m  0.0750
      2       11.9568  0.0760
      3       11.9568  0.0730
      4       11.9568  0.0680
      5       11.9568  0.0690
      6       11.9568  0.0680
      7       11.9568  0.0750
      8       11.9568 

      7        1.3864  0.0750
      8        1.3864  0.0750
      9        1.3864  0.0710
     10        1.3864  0.0730
     11        1.3864  0.0730
     12        1.3864  0.0820
     13        1.3864  0.0710
     14        1.3864  0.0730
     15        1.3864  0.0710
     16        1.3864  0.0740
     17        1.3864  0.1150
     18        1.3864  0.0770
     19        1.3864  0.0660
     20        1.3864  0.0710
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6193[0m  0.0690
      2        [36m1.3869[0m  0.0700
      3        [36m1.3865[0m  0.0680
      4        [36m1.3864[0m  0.0650
      5        [36m1.3864[0m  0.0700
      6        [36m1.3864[0m  0.0670
      7        [36m1.3864[0m  0.0710
      8        [36m1.3864[0m  0.0690
      9        1.3864  0.0750
     10        1.3864  0.0770
     11        1.3864  0.0750
     12        1.3864  0.0690
     13        1.3864  0.0670
     14        1.3864  0.0680
     15        1.3864  0.067

      6       11.9568  0.0710
      7       11.9568  0.0760
      8       11.9568  0.0680
      9       11.9568  0.0690
     10       [36m11.7376[0m  0.0680
     11       11.9568  0.0670
     12       11.9568  0.0700
     13       11.9568  0.0740
     14       11.9568  0.0690
     15       11.9568  0.0720
     16       11.9568  0.0700
     17        [36m9.0439[0m  0.0690
     18        [36m1.3875[0m  0.0710
     19        1.3879  0.0700
     20        1.3878  0.0680
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8465[0m  0.0670
      2       [36m10.8213[0m  0.0710
      3        [36m2.3666[0m  0.0700
      4       11.9311  0.0730
      5        8.5829  0.0700
      6        2.5975  0.0680
      7       11.7727  0.0710
      8        9.6246  0.0670
      9        9.3777  0.0700
     10       11.9207  0.0710
     11        3.3276  0.0650
     12        [36m1.8976[0m  0.0710
     13        1.9085  0.0700
     14        [36m1.6853[0m  0.069

      6        [36m1.0968[0m  0.0730
      7        [36m1.0224[0m  0.0770
      8        [36m0.9830[0m  0.0730
      9        [36m0.9633[0m  0.0670
     10        0.9641  0.0780
     11        [36m0.9585[0m  0.0730
     12        [36m0.9458[0m  0.0760
     13        [36m0.9415[0m  0.0800
     14        [36m0.9357[0m  0.0720
     15        [36m0.9344[0m  0.0690
     16        [36m0.9279[0m  0.0720
     17        0.9281  0.0720
     18        [36m0.9254[0m  0.0660
     19        [36m0.9207[0m  0.0710
     20        [36m0.9200[0m  0.0720
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m3.0304[0m  0.0680
      2        [36m1.3754[0m  0.0720
      3        [36m1.3585[0m  0.0660
      4        [36m1.3341[0m  0.0690
      5        [36m1.3060[0m  0.0740
      6        [36m1.2843[0m  0.0710
      7        [36m1.2585[0m  0.0770
      8        [36m1.2308[0m  0.0680
      9        [36m1.2048[0m  0.0680
     10        [36m1.

      4       11.9568  0.0710
      5       11.9568  0.0720
      6       11.9568  0.0710
      7       11.9568  0.0710
      8       11.9568  0.0750
      9       11.9568  0.0760
     10       11.9568  0.0750
     11       11.9568  0.0780
     12       11.9568  0.0750
     13       11.9568  0.0730
     14       11.9568  0.0680
     15       11.9568  0.0690
     16       11.9568  0.0790
     17       11.9568  0.0740
     18       11.9568  0.0740
     19       11.9568  0.0700
     20       11.9568  0.0710
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.6844[0m  0.0670
      2       11.9547  0.0750
      3       11.9547  0.0690
      4       11.9547  0.0730
      5       11.9547  0.0750
      6       11.9547  0.0690
      7       11.9547  0.0780
      8       11.9547  0.0690
      9       11.9547  0.0690
     10       11.9547  0.0750
     11       11.9547  0.0710
     12       11.9547  0.0740
     13       11.9547  0.0750
     14       11.9547  0.0710
 

      2       11.9568  0.0680
      3       11.9568  0.0730
      4       [36m11.6530[0m  0.0690
      5       [36m11.6022[0m  0.0720
      6       11.9568  0.0700
      7       11.9568  0.0710
      8        [36m6.4550[0m  0.0700
      9        [36m1.3864[0m  0.0670
     10        1.3865  0.0760
     11        [36m1.3864[0m  0.0770
     12        1.3864  0.0680
     13        1.3864  0.0690
     14        1.3864  0.0660
     15        1.3864  0.0660
     16        1.3864  0.0720
     17        1.3864  0.0730
     18        1.3864  0.0680
     19        1.3864  0.0690
     20        1.3864  0.0650
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8245[0m  0.0680
      2       11.9453  0.0710
      3       11.9568  0.0670
      4       11.9568  0.0700
      5        [36m8.9543[0m  0.0670
      6        [36m1.3865[0m  0.0680
      7        [36m1.3858[0m  0.0750
      8        [36m1.3829[0m  0.0720
      9        [36m1.3672[0m  0.0670
 

     20        1.3877  0.0710
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7170[0m  0.0680
      2       11.9568  0.0760
      3       11.9568  0.0750
      4       11.9568  0.0700
      5       11.9568  0.0760
      6       11.9568  0.0680
      7       11.9568  0.0740
      8       11.9568  0.0670
      9        [36m9.1619[0m  0.0690
     10        [36m1.3922[0m  0.0700
     11        [36m1.3871[0m  0.0680
     12        1.3878  0.0710
     13        1.3880  0.0720
     14        1.3879  0.0650
     15        1.3879  0.0730
     16        1.3878  0.0690
     17        1.3878  0.0680
     18        1.3878  0.0680
     19        1.3878  0.0720
     20        1.3878  0.0700
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7841[0m  0.0710
      2        [36m3.2177[0m  0.0680
      3        8.0154  0.0700
      4        5.7064  0.0750
      5        [36m1.4594[0m  0.0670
      6        1.5418  0.0730
      7

     12        [36m1.3960[0m  0.0710
     13        [36m1.3944[0m  0.0640
     14        [36m1.3930[0m  0.0640
     15        [36m1.3919[0m  0.0660
     16        [36m1.3910[0m  0.0670
     17        [36m1.3902[0m  0.0660
     18        [36m1.3896[0m  0.0680
     19        [36m1.3890[0m  0.0670
     20        [36m1.3886[0m  0.0710
     21        [36m1.3882[0m  0.0710
     22        [36m1.3879[0m  0.0730
     23        [36m1.3877[0m  0.0670
     24        [36m1.3875[0m  0.0700
     25        [36m1.3873[0m  0.0680
     26        [36m1.3871[0m  0.0760
     27        [36m1.3870[0m  0.0630
     28        [36m1.3869[0m  0.0670
     29        [36m1.3868[0m  0.0710
     30        [36m1.3867[0m  0.0700
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4515[0m  0.0680
      2        [36m1.4047[0m  0.0640
      3        [36m1.4012[0m  0.0700
      4        [36m1.3985[0m  0.0710
      5        [36m1.3963[0m  0.0640
    

      8        [36m1.3921[0m  0.0680
      9        [36m1.3908[0m  0.0680
     10        [36m1.3899[0m  0.0660
     11        [36m1.3892[0m  0.0700
     12        [36m1.3886[0m  0.0730
     13        [36m1.3882[0m  0.0650
     14        [36m1.3878[0m  0.0680
     15        [36m1.3875[0m  0.0650
     16        [36m1.3873[0m  0.0640
     17        [36m1.3872[0m  0.0630
     18        [36m1.3870[0m  0.0660
     19        [36m1.3869[0m  0.0670
     20        [36m1.3868[0m  0.0640
     21        [36m1.3867[0m  0.0640
     22        [36m1.3867[0m  0.0710
     23        [36m1.3866[0m  0.0690
     24        [36m1.3866[0m  0.0670
     25        [36m1.3865[0m  0.0630
     26        [36m1.3865[0m  0.0620
     27        [36m1.3865[0m  0.0740
     28        [36m1.3865[0m  0.0660
     29        [36m1.3865[0m  0.0640
     30        [36m1.3864[0m  0.0660
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4284[0m  0.0620
    

      4        [36m1.3863[0m  0.0730
      5        1.3863  0.0680
      6        1.3864  0.0670
      7        1.3864  0.0640
      8        1.3864  0.0640
      9        1.3864  0.0680
     10        1.3864  0.0620
     11        1.3864  0.0680
     12        1.3864  0.0680
     13        1.3864  0.0650
     14        1.3864  0.0640
     15        1.3864  0.0630
     16        1.3864  0.0640
     17        1.3864  0.0630
     18        1.3864  0.0640
     19        1.3864  0.0690
     20        1.3864  0.0650
     21        1.3864  0.0680
     22        1.3864  0.0630
     23        1.3864  0.0630
     24        1.3864  0.0710
     25        1.3864  0.0640
     26        1.3864  0.0660
     27        1.3864  0.0700
     28        1.3864  0.0670
     29        1.3864  0.0630
     30        1.3864  0.0640
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4257[0m  0.0660
      2        [36m1.3884[0m  0.0640
      3        [36m1.3864[0m  0.0640
    

      2        [36m1.3869[0m  0.0710
      3        [36m1.3864[0m  0.0650
      4        [36m1.3864[0m  0.0670
      5        [36m1.3864[0m  0.0700
      6        [36m1.3864[0m  0.0640
      7        1.3864  0.0680
      8        1.3864  0.0700
      9        1.3864  0.0670
     10        1.3864  0.0650
     11        1.3864  0.0710
     12        1.3864  0.0640
     13        1.3864  0.0690
     14        1.3864  0.0660
     15        1.3864  0.0670
     16        1.3864  0.0690
     17        1.3864  0.0730
     18        1.3864  0.0640
     19        1.3864  0.0690
     20        1.3864  0.0680
     21        1.3864  0.1220
     22        1.3864  0.0800
     23        1.3864  0.0750
     24        1.3864  0.0640
     25        1.3864  0.0690
     26        1.3864  0.0700
     27        1.3864  0.0670
     28        1.3864  0.0630
     29        1.3864  0.0660
     30        1.3864  0.0690
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.461

     28        [36m1.3875[0m  0.0690
     29        [36m1.3875[0m  0.0650
     30        [36m1.3875[0m  0.0660
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.3915[0m  0.0690
      2        [36m1.3882[0m  0.0640
      3        1.3883  0.0680
      4        [36m1.3882[0m  0.0660
      5        [36m1.3881[0m  0.0680
      6        [36m1.3880[0m  0.0740
      7        [36m1.3880[0m  0.0640
      8        [36m1.3879[0m  0.0680
      9        [36m1.3879[0m  0.0740
     10        [36m1.3879[0m  0.0690
     11        [36m1.3879[0m  0.0730
     12        [36m1.3878[0m  0.0630
     13        [36m1.3878[0m  0.0700
     14        [36m1.3878[0m  0.0670
     15        [36m1.3878[0m  0.0660
     16        [36m1.3878[0m  0.0720
     17        [36m1.3878[0m  0.0640
     18        [36m1.3878[0m  0.0690
     19        [36m1.3878[0m  0.0670
     20        [36m1.3878[0m  0.0710
     21        [36m1.3878[0m  0.0730
     22      

     21        1.3880  0.0710
     22        1.3880  0.0670
     23        1.3880  0.0690
     24        1.3880  0.0680
     25        1.3880  0.0670
     26        1.3880  0.0730
     27        1.3880  0.0640
     28        1.3880  0.0630
     29        1.3880  0.0690
     30        1.3880  0.0720
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m5.7445[0m  0.0650
      2        9.0124  0.0800
      3       11.8927  0.0780
      4       11.8238  0.0700
      5        6.6019  0.0680
      6        [36m5.1286[0m  0.0650
      7       10.7152  0.0760
      8        [36m1.3882[0m  0.0670
      9        1.3940  0.0680
     10        [36m1.3879[0m  0.0660
     11        [36m1.3863[0m  0.0640
     12        1.3902  0.0710
     13        1.3868  0.0700
     14        [36m1.3858[0m  0.0680
     15        1.3875  0.0700
     16        1.3870  0.0630
     17        1.3873  0.0690
     18        1.3875  0.0670
     19        1.3876  0.0640
     20        1

      5        [36m1.2922[0m  0.0680
      6        [36m1.2699[0m  0.0690
      7        [36m1.2462[0m  0.0650
      8        [36m1.2188[0m  0.0710
      9        [36m1.1939[0m  0.0660
     10        [36m1.1712[0m  0.0700
     11        [36m1.1503[0m  0.0690
     12        [36m1.1303[0m  0.0680
     13        [36m1.1149[0m  0.0700
     14        [36m1.1001[0m  0.0660
     15        [36m1.0861[0m  0.0650
     16        [36m1.0561[0m  0.0700
     17        [36m1.0370[0m  0.0720
     18        [36m1.0150[0m  0.0690
     19        1.0282  0.0650
     20        [36m0.9768[0m  0.0700
     21        [36m0.9602[0m  0.0710
     22        0.9627  0.0750
     23        [36m0.9370[0m  0.0670
     24        0.9447  0.0640
     25        0.9374  0.0660
     26        [36m0.9245[0m  0.0650
     27        [36m0.9162[0m  0.0660
     28        0.9236  0.0710
     29        0.9238  0.0690
     30        [36m0.9107[0m  0.0710
  epoch    train_loss     dur
-------  -

     30        [36m1.2933[0m  0.0670
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.5635[0m  0.0740
      2        [36m1.3953[0m  0.0710
      3        [36m1.3611[0m  0.0690
      4        [36m1.3361[0m  0.0640
      5        [36m1.3143[0m  0.0740
      6        [36m1.2907[0m  0.0650
      7        [36m1.2597[0m  0.0690
      8        [36m1.2325[0m  0.0690
      9        [36m1.2179[0m  0.0650
     10        [36m1.2027[0m  0.0660
     11        [36m1.1900[0m  0.0720
     12        [36m1.1800[0m  0.0640
     13        [36m1.1688[0m  0.0700
     14        [36m1.1596[0m  0.0640
     15        [36m1.1510[0m  0.0640
     16        [36m1.1414[0m  0.0660
     17        [36m1.1345[0m  0.0650
     18        [36m1.1277[0m  0.0660
     19        [36m1.1213[0m  0.0720
     20        [36m1.1168[0m  0.0680
     21        [36m1.1118[0m  0.0750
     22        [36m1.1066[0m  0.0670
     23        [36m1.1015[0m  0.0750
    

      2        [36m1.3872[0m  0.0690
      3        [36m1.3865[0m  0.0640
      4        [36m1.3864[0m  0.0680
      5        1.3864  0.0690
      6        1.3864  0.0640
      7        1.3864  0.0670
      8        1.3864  0.0670
      9        1.3864  0.0750
     10        1.3864  0.0640
     11        1.3864  0.0680
     12        1.3864  0.0670
     13        1.3864  0.0650
     14        1.3864  0.0680
     15        1.3864  0.0650
     16        1.3864  0.0710
     17        1.3864  0.0660
     18        1.3864  0.0680
     19        1.3864  0.0720
     20        1.3864  0.0680
     21        1.3864  0.1150
     22        1.3864  0.0780
     23        1.3864  0.0780
     24        1.3864  0.0690
     25        1.3864  0.0660
     26        1.3864  0.0680
     27        1.3864  0.0700
     28        1.3864  0.0720
     29        1.3864  0.0700
     30        1.3864  0.0670
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8624[0m  0.0720
    

      3        [36m1.3688[0m  0.0650
      4        1.3875  0.0640
      5        1.3865  0.0680
      6        1.3864  0.0670
      7        1.3864  0.0640
      8        1.3864  0.0700
      9        1.3864  0.0680
     10        1.3864  0.0700
     11        1.3864  0.0700
     12        1.3864  0.0710
     13        1.3864  0.0660
     14        1.3864  0.0650
     15        1.3864  0.0740
     16        1.3864  0.0720
     17        1.3864  0.0650
     18        1.3864  0.0660
     19        1.3864  0.0670
     20        1.3864  0.0680
     21        1.3864  0.0720
     22        1.3864  0.0700
     23        1.3864  0.0690
     24        1.3864  0.0720
     25        1.3864  0.0710
     26        1.3864  0.0670
     27        1.3864  0.0660
     28        1.3864  0.0710
     29        1.3864  0.0700
     30        1.3864  0.0690
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.6117[0m  0.0660
      2       11.9568  0.0680
      3       11.9568 

     10       11.9568  0.0710
     11       11.9568  0.0680
     12       11.9568  0.0730
     13       11.9568  0.0730
     14       11.9568  0.0710
     15       11.9568  0.0670
     16       11.9568  0.0710
     17       11.9568  0.0690
     18       11.9568  0.0670
     19       11.9568  0.1230
     20       11.9568  0.0810
     21       11.9568  0.0710
     22       11.9568  0.0730
     23       11.9568  0.0670
     24       11.9568  0.0717
     25       11.9568  0.0770
     26       11.9568  0.0770
     27       11.9568  0.0740
     28       11.9568  0.0710
     29       11.9568  0.0680
     30       11.9568  0.0700
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7760[0m  0.0690
      2       11.9568  0.0750
      3       11.9568  0.0650
      4       11.9568  0.0670
      5       11.9568  0.0770
      6       11.9568  0.0710
      7       11.9568  0.0650
      8       11.9568  0.0650
      9       11.9568  0.0640
     10       11.9568  0.0710
 

     17        1.3877  0.0660
     18        1.3877  0.0810
     19        1.3877  0.0670
     20        1.3877  0.0700
     21        1.3877  0.0760
     22        1.3877  0.0700
     23        1.3877  0.0760
     24        1.3877  0.0680
     25        1.3877  0.0750
     26        1.3877  0.0850
     27        1.3877  0.0740
     28        1.3877  0.0690
     29        1.3877  0.0730
     30        1.3877  0.0700
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.6129[0m  0.0710
      2       11.6696  0.0770
      3       11.9695  0.0770
      4        [36m6.9899[0m  0.0670
      5        [36m2.0315[0m  0.0650
      6        [36m1.3886[0m  0.0710
      7        1.6215  0.0700
      8        1.4080  0.0710
      9        1.3891  0.0720
     10        [36m1.3873[0m  0.0710
     11        1.3875  0.0740
     12        1.3875  0.0670
     13        1.3875  0.0710
     14        1.3875  0.0670
     15        1.3875  0.0670
     16        1.3875  0.

      2        [36m1.3931[0m  0.0670
      3        [36m1.3879[0m  0.0690
      4        [36m1.3821[0m  0.0650
      5        [36m1.3753[0m  0.0690
      6        [36m1.3676[0m  0.0660
      7        [36m1.3564[0m  0.0710
      8        [36m1.3459[0m  0.0660
      9        [36m1.3368[0m  0.0730
     10        [36m1.3271[0m  0.0690
     11        [36m1.3167[0m  0.0680
     12        [36m1.3046[0m  0.0720
     13        [36m1.2879[0m  0.0670
     14        [36m1.2674[0m  0.0670
     15        [36m1.2437[0m  0.0670
     16        [36m1.2172[0m  0.0690
     17        [36m1.1919[0m  0.0690
     18        [36m1.1689[0m  0.0680
     19        [36m1.1538[0m  0.0650
     20        [36m1.1430[0m  0.0650
     21        [36m1.1302[0m  0.0660
     22        [36m1.1178[0m  0.0650
     23        [36m1.1043[0m  0.0760
     24        [36m1.0926[0m  0.0660
     25        1.1002  0.0680
     26        [36m1.0791[0m  0.0650
     27        [36m1.0721[0m  0.

     29        [36m0.9350[0m  0.0770
     30        [36m0.9349[0m  0.0710
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m3.1332[0m  0.0680
      2        [36m1.3919[0m  0.0670
      3        [36m1.3904[0m  0.0670
      4        [36m1.3896[0m  0.0660
      5        [36m1.3889[0m  0.0710
      6        [36m1.3884[0m  0.0650
      7        [36m1.3879[0m  0.0660
      8        [36m1.3876[0m  0.0690
      9        [36m1.3873[0m  0.0690
     10        [36m1.3869[0m  0.0800
     11        [36m1.3863[0m  0.0710
     12        [36m1.3810[0m  0.0670
     13        [36m1.3710[0m  0.0660
     14        [36m1.3599[0m  0.0640
     15        [36m1.3467[0m  0.0730
     16        [36m1.3329[0m  0.0680
     17        [36m1.3160[0m  0.1110
     18        [36m1.2941[0m  0.0770
     19        [36m1.2671[0m  0.0780
     20        [36m1.2374[0m  0.0840
     21        [36m1.2094[0m  0.0650
     22        [36m1.1879[0m  0.0720
    

     12       11.9568  0.0700
     13       11.9568  0.0720
     14       11.9568  0.0740
     15       11.9568  0.0810
     16       11.9568  0.0770
     17       11.9568  0.0680
     18       11.9568  0.0710
     19       11.9568  0.0680
     20       11.9568  0.0710
     21       11.9568  0.0780
     22       11.9568  0.0760
     23       11.9568  0.0710
     24       11.9568  0.0680
     25       11.9568  0.0710
     26       11.9568  0.0740
     27       11.9568  0.0700
     28       11.9568  0.0740
     29       11.9568  0.0720
     30       11.9568  0.0730
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7132[0m  0.0650
      2        [36m1.3888[0m  0.0700
      3        [36m1.3869[0m  0.0650
      4        [36m1.3865[0m  0.0640
      5        [36m1.3865[0m  0.0740
      6        [36m1.3864[0m  0.0690
      7        [36m1.3864[0m  0.0720
      8        [36m1.3864[0m  0.0670
      9        [36m1.3864[0m  0.0710
     10        [36

     19        1.3864  0.0730
     20        1.3864  0.0670
     21        1.3864  0.0680
     22        1.3864  0.0730
     23        1.3864  0.0650
     24        1.3864  0.0670
     25        1.3864  0.0710
     26        1.3864  0.0680
     27        1.3864  0.0720
     28        1.3864  0.0660
     29        1.3864  0.0660
     30        1.3864  0.0660
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6801[0m  0.0640
      2        [36m1.3869[0m  0.0730
      3        [36m1.3864[0m  0.0710
      4        [36m1.3864[0m  0.0640
      5        [36m1.3864[0m  0.0700
      6        1.3864  0.0640
      7        1.3864  0.0650
      8        1.3864  0.0650
      9        1.3864  0.0670
     10        1.3864  0.0680
     11        1.3864  0.0740
     12        1.3864  0.0650
     13        1.3864  0.0690
     14        1.3864  0.0740
     15        1.3864  0.0660
     16        1.3864  0.0660
     17        1.3864  0.0660
     18        1.3864  0.

  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7913[0m  0.0730
      2       11.9547  0.0790
      3       11.9547  0.0720
      4       11.9547  0.0680
      5       11.9547  0.0700
      6       11.9547  0.0770
      7       11.9547  0.0700
      8       11.9547  0.0660
      9        [36m5.8506[0m  0.0720
     10        [36m1.3892[0m  0.0700
     11        [36m1.3881[0m  0.0650
     12        [36m1.3880[0m  0.0780
     13        1.3880  0.0670
     14        1.3880  0.0710
     15        1.3880  0.0670
     16        1.3880  0.0710
     17        1.3880  0.0650
     18        1.3880  0.0650
     19        1.3880  0.0700
     20        1.3880  0.0730
     21        1.3880  0.0640
     22        1.3880  0.0660
     23        1.3880  0.0720
     24        1.3880  0.0740
     25        1.3880  0.0710
     26        1.3880  0.0710
     27        1.3880  0.0680
     28        1.3880  0.0710
     29        1.3880  0.0690
     30        1.3880  0.

      5        [36m1.3935[0m  0.0750
      6        [36m1.3902[0m  0.0720
      7        [36m1.3885[0m  0.0680
      8        [36m1.3877[0m  0.0720
      9        1.3877  0.0690
     10        1.3877  0.0700
     11        1.3877  0.0720
     12        1.3877  0.0690
     13        1.3877  0.0680
     14        1.3877  0.0640
     15        1.3877  0.0670
     16        1.3877  0.0720
     17        1.3877  0.0680
     18        1.3877  0.0690
     19        1.3877  0.0690
     20        1.3877  0.0760
     21        1.3877  0.0660
     22        1.3877  0.0710
     23        1.3877  0.0720
     24        1.3877  0.0720
     25        1.3877  0.0730
     26        1.3877  0.0730
     27        1.3877  0.0640
     28        1.3877  0.0720
     29        1.3877  0.0730
     30        1.3877  0.0670
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7589[0m  0.0770
      2       [36m11.5332[0m  0.0720
      3        [36m6.0351[0m  0.0710
      4

     10        [36m0.9756[0m  0.0650
     11        [36m0.9708[0m  0.0660
     12        [36m0.9570[0m  0.0670
     13        [36m0.9356[0m  0.0710
     14        [36m0.9255[0m  0.0690
     15        [36m0.9206[0m  0.1020
     16        [36m0.9205[0m  0.0730
     17        [36m0.9170[0m  0.0690
     18        [36m0.9128[0m  0.0680
     19        0.9162  0.0730
     20        [36m0.9119[0m  0.0720
     21        [36m0.9090[0m  0.0670
     22        [36m0.9085[0m  0.0710
     23        [36m0.9066[0m  0.0700
     24        [36m0.9052[0m  0.0730
     25        [36m0.9035[0m  0.0660
     26        0.9045  0.0730
     27        [36m0.9029[0m  0.0710
     28        [36m0.9021[0m  0.0730
     29        [36m0.9014[0m  0.0700
     30        0.9019  0.0650
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.8191[0m  0.0650
      2        [36m1.3570[0m  0.0760
      3        [36m1.3247[0m  0.0730
      4        [36m1.2912[0m 

      5        [36m1.0734[0m  0.0740
      6        [36m1.0515[0m  0.0740
      7        [36m1.0308[0m  0.0690
      8        [36m1.0006[0m  0.0710
      9        [36m0.9791[0m  0.0750
     10        0.9864  0.0660
     11        [36m0.9729[0m  0.0700
     12        [36m0.9689[0m  0.0710
     13        [36m0.9658[0m  0.0650
     14        [36m0.9603[0m  0.0750
     15        [36m0.9594[0m  0.0670
     16        [36m0.9554[0m  0.0680
     17        [36m0.9532[0m  0.0730
     18        [36m0.9484[0m  0.0700
     19        [36m0.9472[0m  0.0710
     20        [36m0.9468[0m  0.0720
     21        [36m0.9439[0m  0.0680
     22        [36m0.9437[0m  0.0750
     23        [36m0.9431[0m  0.0690
     24        [36m0.9403[0m  0.0740
     25        0.9421  0.0730
     26        [36m0.9402[0m  0.0660
     27        [36m0.9402[0m  0.0680
     28        [36m0.9398[0m  0.0670
     29        [36m0.9382[0m  0.0670
     30        0.9392  0.0710
  epoch    tr

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.0029[0m  0.0650
      2        [36m1.3875[0m  0.0710
      3        [36m1.3864[0m  0.0700
      4        [36m1.3864[0m  0.0680
      5        1.3864  0.0680
      6        1.3864  0.0700
      7        1.3864  0.0640
      8        1.3864  0.0700
      9        1.3864  0.0670
     10        1.3864  0.0670
     11        1.3864  0.0790
     12        1.3864  0.0750
     13        1.3864  0.0710
     14        1.3864  0.0680
     15        1.3864  0.0690
     16        1.3864  0.0660
     17        1.3864  0.0680
     18        1.3864  0.0670
     19        1.3864  0.0670
     20        1.3864  0.0650
     21        1.3864  0.0680
     22        1.3864  0.0650
     23        1.3864  0.0700
     24        1.3864  0.0680
     25        1.3864  0.0660
     26        1.3864  0.0650
     27        1.3864  0.0690
     28        1.3864  0.0690
     29        1.3864  0.0780
     30        1.3864  0.0720
  ep

      3        [36m1.3864[0m  0.0690
      4        1.3864  0.0680
      5        1.3864  0.0720
      6        1.3864  0.0690
      7        1.3864  0.0680
      8        1.3864  0.0690
      9        1.3864  0.0690
     10        1.3864  0.0690
     11        1.3864  0.0650
     12        1.3864  0.0700
     13        1.3864  0.0730
     14        1.3864  0.0710
     15        1.3864  0.0660
     16        1.3864  0.0690
     17        1.3864  0.0760
     18        1.3864  0.0710
     19        1.3864  0.0680
     20        1.3864  0.0730
     21        1.3864  0.0730
     22        1.3864  0.0710
     23        1.3864  0.0740
     24        1.3864  0.0730
     25        1.3864  0.0670
     26        1.3864  0.0670
     27        1.3864  0.0690
     28        1.3864  0.0710
     29        1.3864  0.0760
     30        1.3864  0.0680
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9180[0m  0.0790
      2       11.9568  0.0750
      3       11.9568 

     13        1.3877  0.0670
     14        1.3877  0.0730
     15        1.3877  0.0690
     16        1.3876  0.0740
     17        1.3876  0.0690
     18        1.3876  0.0690
     19        1.3876  0.0740
     20        1.3876  0.0680
     21        1.3876  0.0690
     22        1.3876  0.0690
     23        1.3876  0.0650
     24        1.3876  0.0670
     25        1.3876  0.0730
     26        1.3876  0.0660
     27        1.3876  0.0660
     28        1.3876  0.0660
     29        1.3876  0.0730
     30        1.3876  0.0660
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.5951[0m  0.0720
      2       11.9547  0.0690
      3       11.9547  0.0770
      4       11.9547  0.0690
      5       11.9547  0.0680
      6       11.9547  0.0740
      7       11.9547  0.0780
      8       11.9547  0.0680
      9       11.9547  0.0790
     10       11.9547  0.0730
     11       11.9547  0.0700
     12       11.9547  0.0710
     13       11.9547  0.0710
 

     13        [36m1.3876[0m  0.0710
     14        1.3878  0.0690
     15        1.3878  0.0710
     16        1.3878  0.0650
     17        1.3878  0.0720
     18        1.3878  0.0660
     19        1.3878  0.0770
     20        1.3878  0.0720
     21        1.3878  0.0750
     22        1.3878  0.0750
     23        1.3878  0.0720
     24        1.3878  0.0700
     25        1.3878  0.0690
     26        1.3878  0.0650
     27        1.3878  0.0720
     28        1.3878  0.0650
     29        1.3878  0.0750
     30        1.3878  0.0690
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6848[0m  0.0660
      2        [36m1.4072[0m  0.0720
      3        [36m1.4043[0m  0.0710
      4        [36m1.4018[0m  0.0630
      5        [36m1.3997[0m  0.0630
      6        [36m1.3978[0m  0.0620
      7        [36m1.3962[0m  0.0650
      8        [36m1.3948[0m  0.0670
      9        [36m1.3936[0m  0.0620
     10        [36m1.3926[0m  0.0690
 

     30        [36m1.3864[0m  0.0690
     31        [36m1.3864[0m  0.0670
     32        [36m1.3864[0m  0.0680
     33        [36m1.3864[0m  0.0690
     34        [36m1.3864[0m  0.0660
     35        [36m1.3864[0m  0.0670
     36        [36m1.3864[0m  0.0630
     37        [36m1.3863[0m  0.0680
     38        [36m1.3863[0m  0.0720
     39        [36m1.3863[0m  0.0720
     40        [36m1.3863[0m  0.0670
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5874[0m  0.0700
      2        [36m1.4168[0m  0.0640
      3        [36m1.4124[0m  0.0670
      4        [36m1.4085[0m  0.0730
      5        [36m1.4053[0m  0.0720
      6        [36m1.4025[0m  0.0660
      7        [36m1.4001[0m  0.0690
      8        [36m1.3980[0m  0.0620
      9        [36m1.3963[0m  0.0690
     10        [36m1.3948[0m  0.0660
     11        [36m1.3935[0m  0.0740
     12        [36m1.3925[0m  0.0700
     13        [36m1.3915[0m  0.0680
    

     33        [36m1.3864[0m  0.0660
     34        [36m1.3864[0m  0.0650
     35        [36m1.3864[0m  0.0650
     36        [36m1.3864[0m  0.0720
     37        [36m1.3864[0m  0.0730
     38        [36m1.3864[0m  0.0650
     39        [36m1.3864[0m  0.0680
     40        [36m1.3864[0m  0.0640
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.0169[0m  0.0650
      2        [36m1.3867[0m  0.0710
      3        [36m1.3866[0m  0.0640
      4        [36m1.3864[0m  0.0700
      5        [36m1.3864[0m  0.0640
      6        [36m1.3863[0m  0.0750
      7        [36m1.3863[0m  0.0660
      8        [36m1.3863[0m  0.0630
      9        [36m1.3863[0m  0.1060
     10        1.3863  0.0750
     11        1.3863  0.0700
     12        1.3863  0.0660
     13        1.3863  0.0680
     14        1.3863  0.0650
     15        1.3863  0.0680
     16        1.3863  0.0670
     17        1.3863  0.0640
     18        1.3863  0.0650
     19

      4        [36m1.3863[0m  0.0640
      5        1.3864  0.0700
      6        1.3864  0.0680
      7        1.3864  0.0700
      8        1.3864  0.0690
      9        1.3864  0.0620
     10        1.3864  0.0640
     11        1.3864  0.0660
     12        1.3864  0.0700
     13        1.3864  0.0780
     14        1.3864  0.0670
     15        1.3864  0.0710
     16        1.3864  0.0700
     17        1.3864  0.0630
     18        1.3864  0.0680
     19        1.3864  0.0690
     20        1.3864  0.0660
     21        1.3864  0.0660
     22        1.3864  0.0650
     23        1.3864  0.0660
     24        1.3864  0.0650
     25        1.3864  0.0660
     26        1.3864  0.0660
     27        1.3864  0.0760
     28        1.3864  0.0660
     29        1.3864  0.0660
     30        1.3864  0.0700
     31        1.3864  0.0630
     32        1.3864  0.0680
     33        1.3864  0.0640
     34        1.3864  0.0710
     35        1.3864  0.0690
     36        1.3864  0.0700
 

      7        [36m1.2740[0m  0.0630
      8        1.3813  0.0710
      9        1.3913  0.0650
     10        1.3866  0.0640
     11        1.3864  0.0730
     12        1.3864  0.0660
     13        1.3864  0.0630
     14        1.3864  0.0690
     15        1.3864  0.0670
     16        1.3864  0.0660
     17        1.3864  0.0690
     18        1.3864  0.0660
     19        1.3864  0.0680
     20        1.3864  0.0640
     21        1.3864  0.0630
     22        1.3864  0.0640
     23        1.3864  0.0630
     24        1.3864  0.0670
     25        1.3864  0.0650
     26        1.3864  0.0750
     27        1.3864  0.0680
     28        1.3864  0.0740
     29        1.3864  0.0670
     30        1.3864  0.0760
     31        1.3864  0.0660
     32        1.3864  0.0670
     33        1.3864  0.0660
     34        1.3864  0.0630
     35        1.3864  0.0670
     36        1.3864  0.0630
     37        1.3864  0.0700
     38        1.3864  0.0690
     39        1.3864  0.0650
 

      2        [36m1.3881[0m  0.0710
      3        [36m1.3864[0m  0.0660
      4        [36m1.3864[0m  0.0650
      5        [36m1.3864[0m  0.0650
      6        [36m1.3864[0m  0.0740
      7        1.3864  0.0680
      8        1.3864  0.0670
      9        1.3864  0.0660
     10        1.3864  0.0630
     11        1.3864  0.0690
     12        1.3864  0.0660
     13        1.3864  0.0660
     14        1.3864  0.0660
     15        1.3864  0.0640
     16        1.3864  0.0680
     17        1.3864  0.0710
     18        1.3864  0.0720
     19        1.3864  0.0640
     20        1.3864  0.0660
     21        1.3864  0.0690
     22        1.3864  0.0670
     23        1.3864  0.0640
     24        1.3864  0.0630
     25        1.3864  0.0690
     26        1.3864  0.0670
     27        1.3864  0.0690
     28        1.3864  0.0690
     29        1.3864  0.0700
     30        1.3864  0.0660
     31        1.3864  0.0710
     32        1.3864  0.0740
     33        1.3864  0.

      5        1.3877  0.0630
      6        1.3877  0.0770
      7        1.3877  0.0780
      8        1.3877  0.0700
      9        1.3877  0.0640
     10        1.3877  0.0690
     11        1.3877  0.0630
     12        1.3877  0.0760
     13        1.3877  0.0650
     14        1.3877  0.0640
     15        1.3877  0.0750
     16        1.3877  0.0680
     17        1.3877  0.0660
     18        1.3877  0.0730
     19        1.3877  0.0670
     20        1.3877  0.0680
     21        1.3877  0.0720
     22        1.3877  0.0680
     23        1.3877  0.0650
     24        1.3877  0.0670
     25        1.3877  0.0650
     26        1.3877  0.0640
     27        1.3877  0.0710
     28        1.3877  0.0640
     29        1.3877  0.0690
     30        1.3877  0.0670
     31        1.3877  0.0660
     32        1.3877  0.0680
     33        1.3877  0.0640
     34        1.3877  0.0670
     35        1.3877  0.0680
     36        1.3877  0.0670
     37        1.3877  0.0660
     38   

      7        [36m1.3878[0m  0.0720
      8        [36m1.3878[0m  0.0640
      9        [36m1.3878[0m  0.0660
     10        [36m1.3878[0m  0.0630
     11        [36m1.3878[0m  0.0670
     12        [36m1.3878[0m  0.0650
     13        [36m1.3878[0m  0.0650
     14        [36m1.3878[0m  0.0680
     15        [36m1.3878[0m  0.0710
     16        [36m1.3878[0m  0.0670
     17        [36m1.3878[0m  0.0800
     18        1.3878  0.0760
     19        1.3878  0.0770
     20        1.3878  0.0800
     21        1.3878  0.0720
     22        1.3878  0.0700
     23        1.3878  0.0720
     24        1.3878  0.0710
     25        1.3878  0.0700
     26        1.3878  0.0640
     27        1.3878  0.0700
     28        1.3878  0.0660
     29        1.3878  0.0770
     30        1.3878  0.0630
     31        1.3878  0.0630
     32        1.3878  0.0640
     33        1.3878  0.0650
     34        1.3878  0.0670
     35        1.3878  0.0690
     36        1.3878  0.0620
 

     15        [36m1.3877[0m  0.0690
     16        [36m1.3875[0m  0.0640
     17        [36m1.3873[0m  0.0680
     18        [36m1.3871[0m  0.0670
     19        [36m1.3870[0m  0.0670
     20        [36m1.3868[0m  0.0680
     21        [36m1.3868[0m  0.0730
     22        [36m1.3867[0m  0.0740
     23        [36m1.3866[0m  0.0730
     24        [36m1.3866[0m  0.0630
     25        [36m1.3865[0m  0.0630
     26        [36m1.3865[0m  0.0640
     27        [36m1.3864[0m  0.0700
     28        [36m1.3864[0m  0.0630
     29        [36m1.3864[0m  0.0730
     30        [36m1.3864[0m  0.0630
     31        [36m1.3863[0m  0.0640
     32        [36m1.3863[0m  0.0740
     33        [36m1.3863[0m  0.0640
     34        [36m1.3863[0m  0.0640
     35        [36m1.3863[0m  0.0670
     36        [36m1.3863[0m  0.0670
     37        [36m1.3863[0m  0.0710
     38        [36m1.3863[0m  0.0640
     39        [36m1.3862[0m  0.0660
     40        1.3862  0.

     25        [36m1.1636[0m  0.0710
     26        [36m1.1433[0m  0.0640
     27        [36m1.1243[0m  0.0650
     28        [36m1.1088[0m  0.0660
     29        [36m1.0952[0m  0.0680
     30        [36m1.0851[0m  0.0650
     31        [36m1.0772[0m  0.0700
     32        [36m1.0698[0m  0.0660
     33        [36m1.0658[0m  0.0630
     34        [36m1.0625[0m  0.0740
     35        [36m1.0600[0m  0.0680
     36        [36m1.0560[0m  0.0680
     37        [36m1.0508[0m  0.0650
     38        [36m1.0399[0m  0.0680
     39        1.0447  0.0650
     40        1.0424  0.0640
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5835[0m  0.0670
      2        [36m1.3883[0m  0.0740
      3        [36m1.3866[0m  0.0670
      4        [36m1.3757[0m  0.0680
      5        [36m1.3554[0m  0.0670
      6        [36m1.3278[0m  0.0660
      7        [36m1.2871[0m  0.0700
      8        [36m1.2423[0m  0.0650
      9        [36m1.

     34        [36m1.0686[0m  0.0640
     35        [36m1.0659[0m  0.0670
     36        [36m1.0634[0m  0.0760
     37        [36m1.0615[0m  0.0730
     38        [36m1.0580[0m  0.0830
     39        [36m1.0539[0m  0.0750
     40        1.0540  0.0660
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.8974[0m  0.0630
      2        [36m1.3850[0m  0.0660
      3        [36m1.3696[0m  0.0700
      4        [36m1.3549[0m  0.0630
      5        [36m1.3394[0m  0.0640
      6        [36m1.3228[0m  0.0700
      7        [36m1.3039[0m  0.0700
      8        [36m1.2809[0m  0.0670
      9        [36m1.2535[0m  0.0700
     10        [36m1.2242[0m  0.0630
     11        [36m1.1976[0m  0.0710
     12        [36m1.1767[0m  0.0650
     13        [36m1.1590[0m  0.0700
     14        [36m1.1444[0m  0.0760
     15        [36m1.1325[0m  0.0760
     16        [36m1.1226[0m  0.0720
     17        [36m1.1152[0m  0.0680
     18      

      5        [36m1.3864[0m  0.0650
      6        [36m1.3864[0m  0.0640
      7        [36m1.3864[0m  0.0680
      8        [36m1.3864[0m  0.0680
      9        [36m1.3864[0m  0.0680
     10        [36m1.3864[0m  0.0690
     11        1.3864  0.0640
     12        1.3864  0.0710
     13        [36m1.3864[0m  0.0730
     14        1.3864  0.0670
     15        [36m1.3864[0m  0.0670
     16        1.3864  0.0640
     17        [36m1.3864[0m  0.0740
     18        1.3864  0.0690
     19        1.3864  0.0670
     20        1.3864  0.0650
     21        1.3864  0.0700
     22        1.3864  0.0660
     23        1.3864  0.0670
     24        1.3864  0.0730
     25        1.3864  0.0700
     26        1.3864  0.0640
     27        1.3864  0.0640
     28        1.3864  0.0640
     29        1.3864  0.0650
     30        1.3864  0.0670
     31        1.3864  0.0630
     32        1.3864  0.0630
     33        1.3864  0.0630
     34        1.3864  0.0660
     35        1.38

     10        [36m1.3864[0m  0.0650
     11        [36m1.3864[0m  0.0630
     12        [36m1.3864[0m  0.0640
     13        [36m1.3864[0m  0.0680
     14        [36m1.3864[0m  0.0740
     15        [36m1.3864[0m  0.0640
     16        [36m1.3864[0m  0.0690
     17        [36m1.3864[0m  0.0650
     18        [36m1.3864[0m  0.0680
     19        [36m1.3864[0m  0.0740
     20        [36m1.3864[0m  0.0670
     21        [36m1.3864[0m  0.0670
     22        [36m1.3864[0m  0.0670
     23        [36m1.3864[0m  0.0700
     24        [36m1.3864[0m  0.0690
     25        [36m1.3864[0m  0.0680
     26        [36m1.3864[0m  0.0650
     27        [36m1.3864[0m  0.0660
     28        [36m1.3864[0m  0.0670
     29        [36m1.3864[0m  0.0730
     30        [36m1.3864[0m  0.0680
     31        [36m1.3864[0m  0.0680
     32        [36m1.3864[0m  0.0630
     33        [36m1.3864[0m  0.0710
     34        [36m1.3864[0m  0.0630
     35        [36m1.386

      9        1.3864  0.0630
     10        1.3864  0.0640
     11        1.3864  0.0670
     12        1.3864  0.0630
     13        1.3864  0.0640
     14        1.3864  0.0720
     15        1.3864  0.0650
     16        1.3864  0.0670
     17        1.3864  0.0690
     18        1.3864  0.0740
     19        1.3864  0.0710
     20        1.3864  0.0690
     21        1.3864  0.0700
     22        1.3864  0.0670
     23        1.3864  0.0640
     24        1.3864  0.0630
     25        1.3864  0.0650
     26        1.3864  0.0650
     27        1.3864  0.0670
     28        1.3864  0.0640
     29        1.3864  0.0710
     30        1.3864  0.0660
     31        1.3864  0.0630
     32        1.3864  0.0680
     33        1.3864  0.0650
     34        1.3864  0.0660
     35        1.3864  0.0650
     36        1.3864  0.0650
     37        1.3864  0.0640
     38        1.3864  0.0670
     39        1.3864  0.0640
     40        1.3864  0.0670
  epoch    train_loss     dur
-------  -

     27       11.9568  0.0740
     28       11.9568  0.0740
     29       11.9568  0.0670
     30       11.9568  0.0710
     31       11.9568  0.0750
     32       11.9568  0.0670
     33       11.9568  0.0670
     34       11.9568  0.0750
     35       11.9568  0.0770
     36       11.9568  0.0740
     37       11.9568  0.0670
     38       11.9568  0.0670
     39       11.9568  0.0720
     40       11.9568  0.0680
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5316[0m  0.0630
      2        [36m1.3891[0m  0.0640
      3        [36m1.3881[0m  0.0710
      4        [36m1.3880[0m  0.0700
      5        1.3880  0.0760
      6        1.3880  0.0630
      7        1.3880  0.0670
      8        1.3880  0.0640
      9        1.3880  0.0640
     10        1.3880  0.0680
     11        1.3880  0.0700
     12        1.3880  0.0640
     13        1.3880  0.0650
     14        1.3880  0.0660
     15        1.3880  0.0670
     16        1.3880  0.0710
    

     40        1.3880  0.0670
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.6394[0m  0.0660
      2        [36m1.3922[0m  0.0700
      3        1.4295  0.0690
      4        1.4419  0.0660
      5        5.8369  0.0650
      6       10.0373  0.0710
      7        [36m1.3905[0m  0.0670
      8        3.2979  0.0730
      9        3.3496  0.0630
     10        1.9393  0.0660
     11        6.1677  0.0700
     12        1.4069  0.0700
     13        1.5275  0.0660
     14       11.1830  0.0690
     15        5.9449  0.0680
     16       11.9292  0.0750
     17        4.2036  0.0650
     18        5.8386  0.0650
     19        7.7683  0.0660
     20        1.7821  0.0680
     21        [36m1.3875[0m  0.0660
     22        1.3876  0.0640
     23        1.3877  0.0640
     24        1.3877  0.0670
     25        1.3877  0.0640
     26        1.3877  0.0650
     27        1.3877  0.0640
     28        1.3877  0.0670
     29        1.3877  0.0640
    

     34        [36m0.8976[0m  0.0640
     35        0.8985  0.0640
     36        0.9000  0.0650
     37        0.8992  0.0650
     38        [36m0.8952[0m  0.0710
     39        0.9031  0.0700
     40        [36m0.8948[0m  0.0640
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.0420[0m  0.0630
      2        [36m1.3728[0m  0.0640
      3        [36m1.3562[0m  0.0650
      4        [36m1.3296[0m  0.0650
      5        [36m1.3126[0m  0.0670
      6        [36m1.2973[0m  0.0650
      7        [36m1.2879[0m  0.0650
      8        [36m1.2765[0m  0.0640
      9        [36m1.2535[0m  0.0640
     10        [36m1.2448[0m  0.0650
     11        [36m1.2366[0m  0.0650
     12        [36m1.2265[0m  0.0630
     13        [36m1.2202[0m  0.0630
     14        [36m1.2053[0m  0.0670
     15        [36m1.1927[0m  0.0640
     16        [36m1.1896[0m  0.0710
     17        [36m1.1791[0m  0.0640
     18        [36m1.1681[0m  0.0720
 

      2        [36m1.2916[0m  0.0680
      3        [36m1.2427[0m  0.0650
      4        [36m1.1616[0m  0.0650
      5        [36m1.0690[0m  0.0680
      6        [36m1.0374[0m  0.0650
      7        [36m0.9938[0m  0.0720
      8        [36m0.9811[0m  0.0700
      9        [36m0.9644[0m  0.0640
     10        [36m0.9559[0m  0.0660
     11        [36m0.9536[0m  0.0670
     12        0.9736  0.0650
     13        0.9688  0.0670
     14        [36m0.9391[0m  0.0680
     15        0.9441  0.0690
     16        [36m0.9289[0m  0.0690
     17        0.9340  0.0650
     18        [36m0.9247[0m  0.0710
     19        [36m0.9246[0m  0.0750
     20        [36m0.9200[0m  0.0710
     21        [36m0.9190[0m  0.0650
     22        [36m0.9168[0m  0.0730
     23        [36m0.9145[0m  0.0680
     24        [36m0.9092[0m  0.0680
     25        0.9126  0.0700
     26        0.9110  0.0680
     27        [36m0.9083[0m  0.0710
     28        0.9095  0.0680
     29   

     14        [36m1.1682[0m  0.0730
     15        [36m1.1543[0m  0.0660
     16        [36m1.1422[0m  0.0720
     17        [36m1.1325[0m  0.0640
     18        [36m1.1236[0m  0.0670
     19        [36m1.1165[0m  0.0660
     20        [36m1.1095[0m  0.0670
     21        [36m1.1040[0m  0.0650
     22        [36m1.1006[0m  0.0710
     23        [36m1.0943[0m  0.0640
     24        [36m1.0902[0m  0.0740
     25        [36m1.0854[0m  0.0710
     26        [36m1.0829[0m  0.0670
     27        [36m1.0794[0m  0.0670
     28        [36m1.0751[0m  0.0660
     29        [36m1.0727[0m  0.0720
     30        [36m1.0702[0m  0.0680
     31        [36m1.0676[0m  0.0710
     32        [36m1.0654[0m  0.0650
     33        [36m1.0653[0m  0.0660
     34        [36m1.0636[0m  0.0680
     35        [36m1.0596[0m  0.0670
     36        1.0602  0.0720
     37        1.0612  0.0660
     38        [36m1.0564[0m  0.0710
     39        [36m1.0542[0m  0.0700
    

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7814[0m  0.0640
      2        [36m1.3832[0m  0.0690
      3        1.3873  0.0710
      4        1.3863  0.0750
      5        1.3875  0.0760
      6        1.3872  0.0730
      7        1.3864  0.0690
      8        1.3864  0.0690
      9        1.3864  0.0710
     10        1.3864  0.0670
     11        1.3864  0.0670
     12        1.3864  0.0740
     13        1.3864  0.0650
     14        1.3864  0.0710
     15        1.3864  0.0640
     16        1.3864  0.0700
     17        1.3864  0.0690
     18        1.3864  0.0670
     19        1.3864  0.0640
     20        1.3864  0.0650
     21        1.3864  0.0640
     22        1.3864  0.0690
     23        1.3864  0.0670
     24        1.3864  0.0680
     25        1.3864  0.0710
     26        1.3864  0.0680
     27        1.3864  0.0710
     28        1.3864  0.0760
     29        1.3864  0.0710
     30        1.3864  0.0750
     31        1.3864 

     15       11.9568  0.0680
     16       11.9568  0.0730
     17       11.9568  0.0720
     18       11.9568  0.0740
     19       11.9568  0.0690
     20       11.9568  0.0650
     21       11.9568  0.0720
     22       11.9568  0.0650
     23       11.9568  0.0690
     24       11.9568  0.0650
     25       11.9568  0.0680
     26       11.9568  0.0670
     27       11.9568  0.0640
     28       11.9568  0.0640
     29       11.9568  0.0680
     30       11.9568  0.0740
     31       11.9568  0.0760
     32       11.9567  0.0710
     33        [36m5.7859[0m  0.0650
     34        [36m1.3872[0m  0.0680
     35        [36m1.3865[0m  0.0750
     36        [36m1.3864[0m  0.0740
     37        1.3865  0.0710
     38        1.3865  0.0640
     39        1.3865  0.0680
     40        1.3865  0.0700
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.0977[0m  0.0680
      2        [36m1.3837[0m  0.0640
      3        1.3865  0.0650
      4        1

     28       11.9568  0.0720
     29       11.9568  0.0680
     30       11.9568  0.0790
     31       11.9568  0.0740
     32       11.9568  0.0680
     33       11.9568  0.0700
     34       11.9568  0.0700
     35       11.9568  0.0680
     36       11.9568  0.0670
     37       11.9568  0.0770
     38       11.9568  0.0700
     39       11.9568  0.0700
     40       11.9568  0.0690
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8789[0m  0.0660
      2       11.9547  0.0710
      3       11.9547  0.0750
      4       11.9547  0.0660
      5       11.9547  0.0800
      6       11.9547  0.0680
      7       11.9547  0.0720
      8       11.9547  0.0680
      9       11.9547  0.0670
     10       11.9547  0.0690
     11       11.9547  0.0710
     12       11.9547  0.0670
     13       11.9547  0.0720
     14       11.9547  0.0690
     15       11.9547  0.0750
     16       11.9547  0.0770
     17       11.9547  0.0670
     18       11.9547  0.0670
 

      3       11.9547  0.0690
      4       11.9547  0.0680
      5       11.9547  0.0670
      6       11.9547  0.0690
      7       11.9547  0.0750
      8       11.7803  0.0660
      9       11.9568  0.0710
     10       11.9568  0.0700
     11       11.9568  0.0730
     12       11.9568  0.0740
     13       11.9568  0.0660
     14        [36m9.6528[0m  0.0710
     15        [36m1.3877[0m  0.0670
     16        [36m1.3877[0m  0.0640
     17        [36m1.3875[0m  0.0660
     18        [36m1.3875[0m  0.0670
     19        1.3875  0.0650
     20        1.3875  0.0680
     21        1.3875  0.0650
     22        1.3875  0.0720
     23        1.3875  0.0640
     24        1.3875  0.0650
     25        1.3875  0.0650
     26        1.3875  0.0730
     27        1.3875  0.0660
     28        1.3875  0.0660
     29        1.3875  0.0640
     30        1.3875  0.0690
     31        1.3875  0.0720
     32        1.3875  0.0650
     33        1.3875  0.0750
     34        1.3875  0.

     13        1.4971  0.0650
     14        3.2980  0.0690
     15        4.2099  0.0710
     16        [36m1.3873[0m  0.0650
     17        1.3879  0.0680
     18        1.3883  0.0660
     19        1.3878  0.0650
     20        1.3877  0.0640
     21        1.3877  0.0680
     22        1.3877  0.0670
     23        1.3877  0.0650
     24        1.3877  0.0670
     25        1.3877  0.0640
     26        1.3877  0.0650
     27        1.3877  0.0680
     28        1.3877  0.0650
     29        1.3877  0.0710
     30        1.3877  0.0660
     31        1.3877  0.0640
     32        1.3877  0.0660
     33        1.3877  0.0680
     34        1.3877  0.0680
     35        1.3877  0.0690
     36        1.3877  0.0690
     37        1.3877  0.0650
     38        1.3877  0.0710
     39        1.3877  0.0640
     40        1.3877  0.0710
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9169[0m  0.0680
      2        [36m2.5034[0m  0.0680
      3      

     38        [36m0.9049[0m  0.0650
     39        [36m0.9016[0m  0.0680
     40        [36m0.8988[0m  0.0660
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.0455[0m  0.0680
      2        [36m1.1220[0m  0.0680
      3        [36m1.0146[0m  0.0640
      4        [36m1.0034[0m  0.0660
      5        [36m0.9889[0m  0.0690
      6        [36m0.9778[0m  0.0660
      7        [36m0.9730[0m  0.0710
      8        [36m0.9523[0m  0.0690
      9        [36m0.9427[0m  0.0740
     10        [36m0.9394[0m  0.0650
     11        [36m0.9358[0m  0.0660
     12        [36m0.9334[0m  0.0640
     13        [36m0.9309[0m  0.0710
     14        [36m0.9289[0m  0.0650
     15        0.9290  0.0710
     16        0.9342  0.0710
     17        0.9425  0.0770
     18        0.9396  0.0690
     19        [36m0.9271[0m  0.0680
     20        [36m0.9224[0m  0.0650
     21        [36m0.9224[0m  0.0670
     22        [36m0.9199[0m  0.0640
 

      6        [36m1.3852[0m  0.0700
      7        [36m1.3811[0m  0.0670
      8        [36m1.3710[0m  0.0680
      9        [36m1.3639[0m  0.0710
     10        [36m1.3593[0m  0.0710
     11        [36m1.3539[0m  0.0680
     12        [36m1.3390[0m  0.0650
     13        [36m1.2649[0m  0.0710
     14        [36m1.1616[0m  0.0710
     15        [36m1.0787[0m  0.0680
     16        [36m1.0543[0m  0.0710
     17        [36m1.0121[0m  0.0650
     18        [36m1.0059[0m  0.0660
     19        [36m0.9905[0m  0.0650
     20        [36m0.9846[0m  0.0640
     21        [36m0.9665[0m  0.0720
     22        [36m0.9564[0m  0.0650
     23        [36m0.9525[0m  0.0680
     24        [36m0.9431[0m  0.0690
     25        [36m0.9389[0m  0.0660
     26        [36m0.9348[0m  0.0770
     27        [36m0.9331[0m  0.0650
     28        [36m0.9293[0m  0.0650
     29        [36m0.9262[0m  0.0710
     30        0.9281  0.0720
     31        0.9274  0.0640
    

     22        [36m0.9410[0m  0.0640
     23        [36m0.9407[0m  0.0730
     24        [36m0.9401[0m  0.0680
     25        [36m0.9388[0m  0.0640
     26        0.9391  0.0700
     27        [36m0.9383[0m  0.0650
     28        [36m0.9377[0m  0.0680
     29        [36m0.9376[0m  0.0670
     30        0.9381  0.0700
     31        0.9376  0.0650
     32        [36m0.9373[0m  0.0650
     33        0.9374  0.0720
     34        0.9376  0.0650
     35        [36m0.9373[0m  0.0700
     36        0.9376  0.0640
     37        0.9377  0.0640
     38        [36m0.9373[0m  0.0680
     39        0.9377  0.0680
     40        0.9377  0.0720
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.9402[0m  0.0710
      2       11.9568  0.0670
      3       11.9568  0.0680
      4       11.9568  0.0670
      5       11.9568  0.0670
      6       11.9568  0.0710
      7       11.9568  0.0750
      8       11.9568  0.0690
      9       11.9568  0.0740
 

     23       11.9540  0.0720
     24        [36m2.3936[0m  0.0640
     25        [36m1.3863[0m  0.0740
     26        1.3864  0.0700
     27        1.3865  0.0670
     28        1.3865  0.0720
     29        1.3865  0.0670
     30        1.3864  0.0690
     31        1.3864  0.0640
     32        1.3864  0.0640
     33        1.3864  0.0710
     34        1.3864  0.0640
     35        1.3864  0.0650
     36        1.3864  0.0670
     37        1.3864  0.0710
     38        1.3864  0.0660
     39        1.3864  0.0730
     40        1.3864  0.0650
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8173[0m  0.0770
      2       11.9568  0.0720
      3       11.9568  0.0700
      4       11.9568  0.0700
      5       11.9568  0.0680
      6       11.9568  0.0710
      7       11.9568  0.0720
      8       11.9568  0.0670
      9       11.9568  0.0670
     10       11.9568  0.0710
     11       11.9568  0.0670
     12       11.9568  0.0710
     13      

     36        1.3864  0.0650
     37        1.3864  0.0640
     38        1.3864  0.0660
     39        1.3864  0.0680
     40        1.3864  0.0680
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.6920[0m  0.0710
      2       11.9547  0.0670
      3       11.9547  0.0660
      4       11.9547  0.0670
      5        [36m5.0877[0m  0.0710
      6        [36m1.3775[0m  0.0640
      7        [36m1.3383[0m  0.0710
      8        [36m1.2994[0m  0.0680
      9        1.3739  0.0730
     10        1.3893  0.0670
     11        1.3866  0.0680
     12        1.3864  0.0670
     13        1.3864  0.0680
     14        1.3864  0.0650
     15        1.3864  0.0630
     16        1.3864  0.0740
     17        1.3864  0.0710
     18        1.3864  0.0660
     19        1.3864  0.0747
     20        1.3864  0.0780
     21        1.3864  0.0710
     22        1.3864  0.0640
     23        1.3864  0.0680
     24        1.3864  0.0700
     25        1.3864  0.

      8       11.9568  0.0690
      9       11.9568  0.0740
     10       11.9568  0.0680
     11       11.9568  0.0730
     12       11.9568  0.0760
     13       11.9568  0.0670
     14       11.9568  0.0740
     15       11.9568  0.0710
     16       11.9568  0.0680
     17       11.9568  0.0670
     18       11.9568  0.0710
     19       11.9568  0.0670
     20       11.9568  0.0690
     21       11.9568  0.0670
     22       11.9568  0.0680
     23       11.9568  0.0670
     24       11.9568  0.0700
     25       11.9568  0.0680
     26       11.9568  0.0690
     27       11.9568  0.0710
     28       11.9568  0.0670
     29       11.9568  0.0670
     30       11.9568  0.0730
     31       11.9568  0.0700
     32       11.9568  0.0680
     33       11.9568  0.0730
     34       11.9568  0.0760
     35       11.9568  0.0720
     36       11.9568  0.0720
     37       11.9568  0.0710
     38       11.9568  0.0710
     39       11.9568  0.0690
     40       11.9568  0.0720
  epoch   

     21        1.3878  0.0720
     22        1.3878  0.0700
     23        1.3878  0.0720
     24        1.3878  0.0670
     25        1.3878  0.0800
     26        1.3878  0.0670
     27        1.3878  0.0670
     28        1.3878  0.0730
     29        1.3878  0.0640
     30        1.3878  0.0700
     31        1.3878  0.0750
     32        1.3878  0.0700
     33        1.3878  0.0720
     34        1.3878  0.0740
     35        1.3878  0.0720
     36        1.3878  0.0690
     37        1.3878  0.0660
     38        1.3878  0.0690
     39        1.3878  0.0660
     40        1.3878  0.0710
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7548[0m  0.0740
      2       [36m10.7722[0m  0.0710
      3       11.8475  0.0750
      4       11.8442  0.0850
      5       11.9233  0.0830
      6        [36m8.2791[0m  0.0700
      7        [36m1.7820[0m  0.0670
      8       11.5028  0.0740
      9        [36m1.5732[0m  0.0700
     10       10.5462  0.

     24        [36m1.3866[0m  0.0650
     25        [36m1.3865[0m  0.0660
     26        [36m1.3865[0m  0.0700
     27        [36m1.3864[0m  0.0710
     28        [36m1.3864[0m  0.0720
     29        [36m1.3863[0m  0.0650
     30        [36m1.3863[0m  0.0640
     31        [36m1.3863[0m  0.0700
     32        [36m1.3863[0m  0.0690
     33        [36m1.3863[0m  0.0690
     34        [36m1.3862[0m  0.0680
     35        [36m1.3862[0m  0.0660
     36        [36m1.3862[0m  0.0670
     37        [36m1.3862[0m  0.0670
     38        [36m1.3862[0m  0.0670
     39        [36m1.3862[0m  0.0660
     40        [36m1.3862[0m  0.0630
     41        [36m1.3862[0m  0.0680
     42        [36m1.3862[0m  0.0690
     43        [36m1.3862[0m  0.0690
     44        [36m1.3862[0m  0.0640
     45        [36m1.3862[0m  0.0630
     46        [36m1.3862[0m  0.0670
     47        [36m1.3862[0m  0.0640
     48        [36m1.3862[0m  0.0630
     49        [36m1.386

     36        1.0042  0.0670
     37        1.0090  0.0700
     38        1.0100  0.0630
     39        [36m0.9969[0m  0.0630
     40        1.0012  0.0670
     41        [36m0.9943[0m  0.0660
     42        0.9955  0.0690
     43        0.9985  0.0630
     44        [36m0.9846[0m  0.0710
     45        0.9913  0.0650
     46        [36m0.9824[0m  0.0698
     47        0.9851  0.0690
     48        1.0021  0.0660
     49        [36m0.9668[0m  0.0670
     50        0.9724  0.0690
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.5293[0m  0.0690
      2        [36m1.4210[0m  0.0690
      3        [36m1.4164[0m  0.0650
      4        [36m1.4124[0m  0.0660
      5        [36m1.4088[0m  0.0660
      6        [36m1.4057[0m  0.0710
      7        [36m1.4030[0m  0.0670
      8        [36m1.4007[0m  0.0710
      9        [36m1.3987[0m  0.0650
     10        [36m1.3969[0m  0.0650
     11        [36m1.3954[0m  0.0660
     12        

     43        [36m1.3863[0m  0.0720
     44        [36m1.3863[0m  0.0630
     45        [36m1.3863[0m  0.0700
     46        [36m1.3863[0m  0.0660
     47        [36m1.3863[0m  0.0640
     48        1.3863  0.0670
     49        [36m1.3863[0m  0.0680
     50        1.3863  0.0720
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.7155[0m  0.0630
      2        [36m1.3933[0m  0.0670
      3        [36m1.3922[0m  0.0700
      4        [36m1.3913[0m  0.0630
      5        [36m1.3905[0m  0.0750
      6        [36m1.3898[0m  0.0730
      7        [36m1.3893[0m  0.0690
      8        [36m1.3888[0m  0.0670
      9        [36m1.3884[0m  0.0660
     10        [36m1.3881[0m  0.0680
     11        [36m1.3878[0m  0.1060
     12        [36m1.3876[0m  0.0780
     13        [36m1.3874[0m  0.0760
     14        [36m1.3873[0m  0.0660
     15        [36m1.3871[0m  0.0650
     16        [36m1.3870[0m  0.0680
     17        [36m1.

     50        [36m1.2169[0m  0.0680
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4214[0m  0.0740
      2        [36m1.3910[0m  0.0670
      3        [36m1.3897[0m  0.0680
      4        [36m1.3647[0m  0.0650
      5        [36m1.3195[0m  0.0670
      6        [36m1.2763[0m  0.0710
      7        [36m1.2380[0m  0.0650
      8        [36m1.2062[0m  0.0760
      9        [36m1.1811[0m  0.0690
     10        [36m1.1599[0m  0.0630
     11        [36m1.1443[0m  0.0690
     12        [36m1.1312[0m  0.0670
     13        [36m1.1210[0m  0.0700
     14        [36m1.1136[0m  0.0690
     15        [36m1.1068[0m  0.0660
     16        [36m1.1006[0m  0.0650
     17        [36m1.0955[0m  0.0630
     18        [36m1.0918[0m  0.0660
     19        [36m1.0842[0m  0.0650
     20        [36m1.0808[0m  0.0680
     21        [36m1.0768[0m  0.0680
     22        [36m1.0733[0m  0.0720
     23        [36m1.0697[0m  0.0650
    

     31        1.3864  0.0640
     32        1.3864  0.0630
     33        1.3864  0.0660
     34        1.3864  0.0630
     35        1.3864  0.0680
     36        1.3864  0.0740
     37        1.3864  0.0690
     38        1.3864  0.0730
     39        1.3864  0.0720
     40        1.3864  0.0710
     41        1.3864  0.0640
     42        1.3864  0.0670
     43        1.3864  0.0650
     44        1.3864  0.0640
     45        1.3864  0.0720
     46        1.3864  0.0700
     47        1.3864  0.0660
     48        1.3864  0.0690
     49        1.3864  0.0680
     50        1.3864  0.0670
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8611[0m  0.0680
      2       11.9568  0.0680
      3       11.9568  0.0750
      4       11.9568  0.0670
      5       11.9568  0.0700
      6       11.9568  0.0730
      7       11.9568  0.0690
      8       11.9568  0.0710
      9       11.9568  0.0690
     10       11.9568  0.0750
     11       11.9568  0.0670
 

     15       11.9568  0.0690
     16       11.9568  0.0720
     17       11.9568  0.0700
     18       11.9568  0.0750
     19       11.9568  0.0680
     20       11.9568  0.0710
     21       11.9568  0.0690
     22       11.9568  0.0710
     23       11.9568  0.0780
     24       11.9568  0.0740
     25       11.9568  0.0710
     26       11.9568  0.0650
     27       11.9568  0.0650
     28       11.9568  0.0700
     29       11.9568  0.0910
     30       11.9568  0.0650
     31       11.9568  0.0810
     32       11.9568  0.0780
     33       11.9568  0.0770
     34       11.9567  0.0770
     35        [36m3.0207[0m  0.0750
     36        [36m1.3874[0m  0.0790
     37        [36m1.3866[0m  0.0730
     38        [36m1.3864[0m  0.0720
     39        [36m1.3864[0m  0.0650
     40        [36m1.3864[0m  0.0680
     41        [36m1.3864[0m  0.0700
     42        [36m1.3864[0m  0.0730
     43        [36m1.3864[0m  0.0690
     44        1.3864  0.0790
     45        [36

      2        [36m1.3866[0m  0.0710
      3        [36m1.3865[0m  0.0640
      4        [36m1.3864[0m  0.0650
      5        [36m1.3864[0m  0.0740
      6        [36m1.3864[0m  0.0640
      7        [36m1.3864[0m  0.0670
      8        1.3864  0.0750
      9        1.3864  0.0650
     10        1.3864  0.0640
     11        1.3864  0.0670
     12        1.3864  0.0650
     13        1.3864  0.0700
     14        1.3864  0.0700
     15        1.3864  0.0720
     16        1.3864  0.0720
     17        1.3864  0.0700
     18        1.3864  0.0740
     19        1.3864  0.0680
     20        1.3864  0.0640
     21        1.3864  0.0640
     22        1.3864  0.0680
     23        1.3864  0.0700
     24        1.3864  0.0630
     25        1.3864  0.0660
     26        1.3864  0.0670
     27        1.3864  0.0700
     28        1.3864  0.0650
     29        1.3864  0.0680
     30        1.3864  0.0680
     31        1.3864  0.0650
     32        1.3864  0.0670
     33        1

  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8275[0m  0.0750
      2       11.9589  0.0770
      3       11.9589  0.0750
      4       11.9589  0.0720
      5       11.9589  0.0670
      6       11.9589  0.0690
      7       11.9589  0.0670
      8       11.9589  0.0660
      9       11.9589  0.0710
     10       11.9589  0.0680
     11       11.9589  0.0700
     12       11.9589  0.0690
     13       11.9589  0.0730
     14       11.9589  0.0720
     15       11.9589  0.0730
     16       11.9589  0.0750
     17       11.9589  0.0790
     18       11.9589  0.0710
     19       11.9589  0.0740
     20       11.9589  0.0720
     21       11.9589  0.0730
     22       11.9589  0.0720
     23       11.9589  0.0790
     24       11.9589  0.0700
     25       11.9589  0.0720
     26       11.9589  0.0780
     27       11.9589  0.0670
     28       11.9589  0.0720
     29       11.9589  0.0680
     30       11.9589  0.0730
     31       11.9589  0.0780
 

     36        1.3876  0.0680
     37        1.3876  0.0640
     38        1.3876  0.0710
     39        1.3876  0.0750
     40        1.3876  0.0690
     41        1.3876  0.0760
     42        1.3876  0.0650
     43        1.3876  0.0660
     44        1.3876  0.0710
     45        1.3876  0.0660
     46        1.3876  0.0660
     47        1.3876  0.0650
     48        1.3876  0.0640
     49        1.3876  0.0670
     50        1.3876  0.0700
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7037[0m  0.0740
      2       11.9568  0.0930
      3       11.9568  0.0760
      4       11.9568  0.0760
      5       11.9568  0.0820
      6       11.9568  0.0750
      7       11.9568  0.0800
      8       11.9568  0.0740
      9       11.9568  0.0920
     10       11.9568  0.0930
     11        [36m7.4596[0m  0.0870
     12        [36m1.3872[0m  0.0730
     13        1.3876  0.0940
     14        1.3876  0.0720
     15        1.3875  0.0710
     16      

     41        1.3877  0.0640
     42        1.3877  0.0740
     43        1.3877  0.0760
     44        1.3877  0.0670
     45        1.3877  0.0630
     46        1.3877  0.0650
     47        1.3877  0.0640
     48        1.3877  0.0730
     49        1.3877  0.0660
     50        1.3877  0.0650
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m9.5094[0m  0.0690
      2        [36m1.6466[0m  0.0620
      3        1.9328  0.0620
      4        [36m1.3916[0m  0.0690
      5        7.6436  0.0730
      6       11.9615  0.0730
      7       11.4448  0.0700
      8        7.5317  0.0710
      9       10.4735  0.0730
     10        4.8700  0.0650
     11        2.7438  0.0690
     12        8.5861  0.0720
     13        2.2773  0.0760
     14       11.7672  0.0750
     15        1.4236  0.0730
     16        1.7646  0.0660
     17        [36m1.3876[0m  0.0670
     18        1.3880  0.0710
     19        [36m1.3875[0m  0.0650
     20        [36m1.386

     27        [36m1.1840[0m  0.0660
     28        [36m1.1722[0m  0.0750
     29        [36m1.1592[0m  0.0780
     30        [36m1.1411[0m  0.0670
     31        [36m1.1167[0m  0.0650
     32        [36m1.0990[0m  0.0680
     33        [36m1.0735[0m  0.0660
     34        [36m1.0133[0m  0.0650
     35        [36m0.9711[0m  0.0680
     36        0.9745  0.0710
     37        0.9770  0.0680
     38        [36m0.9621[0m  0.0710
     39        [36m0.9597[0m  0.0650
     40        0.9603  0.0630
     41        0.9682  0.0770
     42        0.9834  0.0650
     43        0.9702  0.0680
     44        [36m0.9422[0m  0.0650
     45        0.9512  0.0650
     46        0.9482  0.0640
     47        0.9434  0.0740
     48        [36m0.9408[0m  0.0700
     49        [36m0.9390[0m  0.0660
     50        [36m0.9382[0m  0.0650
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m3.4064[0m  0.0670
      2        [36m1.3845[0m  0.0700
      3

     39        [36m0.9121[0m  0.0700
     40        [36m0.9116[0m  0.0770
     41        [36m0.9115[0m  0.0680
     42        [36m0.9108[0m  0.0690
     43        0.9109  0.0650
     44        [36m0.9108[0m  0.0650
     45        [36m0.9098[0m  0.0680
     46        [36m0.9097[0m  0.0690
     47        [36m0.9094[0m  0.1300
     48        0.9098  0.0750
     49        0.9101  0.0720
     50        0.9115  0.0760
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.4695[0m  0.0670
      2        [36m1.3961[0m  0.0710
      3        [36m1.3578[0m  0.0750
      4        [36m1.2954[0m  0.0720
      5        [36m1.2387[0m  0.0710
      6        [36m1.1431[0m  0.0740
      7        [36m1.0450[0m  0.0660
      8        [36m0.9874[0m  0.0680
      9        1.0025  0.0660
     10        [36m0.9739[0m  0.0690
     11        [36m0.9544[0m  0.0690
     12        [36m0.9396[0m  0.0650
     13        [36m0.9385[0m  0.0710
     14   

      3        [36m1.3872[0m  0.0700
      4        [36m1.3868[0m  0.0660
      5        [36m1.3862[0m  0.0710
      6        [36m1.3848[0m  0.0700
      7        [36m1.3755[0m  0.0730
      8        [36m1.3518[0m  0.0650
      9        [36m1.3289[0m  0.0690
     10        [36m1.3088[0m  0.0680
     11        [36m1.2855[0m  0.0760
     12        [36m1.2610[0m  0.0780
     13        [36m1.2353[0m  0.0740
     14        [36m1.2100[0m  0.0730
     15        [36m1.1894[0m  0.0690
     16        [36m1.1721[0m  0.0760
     17        [36m1.1595[0m  0.0750
     18        [36m1.1507[0m  0.0680
     19        [36m1.1453[0m  0.0650
     20        [36m1.1350[0m  0.0680
     21        [36m1.1287[0m  0.0670
     22        [36m1.1224[0m  0.0660
     23        [36m1.1173[0m  0.0730
     24        [36m1.1119[0m  0.0650
     25        [36m1.1072[0m  0.0660
     26        [36m1.1022[0m  0.0650
     27        [36m1.0973[0m  0.0680
     28        [36m1.094

     12        [36m1.1753[0m  0.0730
     13        [36m1.1560[0m  0.0690
     14        [36m1.1424[0m  0.0690
     15        [36m1.1319[0m  0.0730
     16        [36m1.1247[0m  0.0650
     17        [36m1.1187[0m  0.0720
     18        [36m1.1161[0m  0.0660
     19        [36m1.1094[0m  0.0740
     20        [36m1.1054[0m  0.0680
     21        [36m1.0991[0m  0.0730
     22        [36m1.0958[0m  0.0650
     23        [36m1.0913[0m  0.0790
     24        [36m1.0894[0m  0.1260
     25        [36m1.0864[0m  0.0750
     26        [36m1.0836[0m  0.0710
     27        [36m1.0811[0m  0.0680
     28        [36m1.0791[0m  0.0680
     29        [36m1.0767[0m  0.0750
     30        [36m1.0730[0m  0.0660
     31        [36m1.0708[0m  0.0690
     32        1.0713  0.0640
     33        [36m1.0670[0m  0.0680
     34        1.0671  0.0650
     35        [36m1.0656[0m  0.0700
     36        [36m1.0642[0m  0.0720
     37        [36m1.0627[0m  0.0710
    

      6        1.3864  0.0640
      7        1.3864  0.0640
      8        1.3863  0.0730
      9        1.3863  0.0720
     10        1.3863  0.0710
     11        1.3863  0.0670
     12        1.3863  0.0650
     13        1.3863  0.0700
     14        1.3863  0.0660
     15        1.3863  0.0720
     16        1.3863  0.0650
     17        1.3863  0.0650
     18        1.3863  0.0700
     19        1.3863  0.0780
     20        1.3863  0.0730
     21        1.3863  0.0700
     22        1.3863  0.0660
     23        1.3863  0.0670
     24        1.3863  0.0690
     25        1.3863  0.0660
     26        1.3863  0.0720
     27        1.3863  0.0700
     28        1.3863  0.0690
     29        1.3863  0.0730
     30        1.3863  0.0700
     31        1.3863  0.0700
     32        1.3863  0.0770
     33        1.3863  0.0720
     34        1.3863  0.0650
     35        1.3863  0.0650
     36        1.3863  0.0650
     37        1.3863  0.0710
     38        1.3863  0.0770
     39   

      5        [36m1.3864[0m  0.0740
      6        [36m1.3864[0m  0.0670
      7        [36m1.3864[0m  0.0690
      8        [36m1.3864[0m  0.0670
      9        [36m1.3864[0m  0.0730
     10        [36m1.3864[0m  0.0690
     11        [36m1.3864[0m  0.0680
     12        [36m1.3864[0m  0.0730
     13        1.3864  0.0710
     14        1.3864  0.0700
     15        [36m1.3864[0m  0.0670
     16        [36m1.3864[0m  0.0690
     17        1.3864  0.0650
     18        1.3864  0.0750
     19        1.3864  0.0690
     20        1.3864  0.0670
     21        1.3864  0.0690
     22        1.3864  0.0660
     23        1.3864  0.0710
     24        1.3864  0.0720
     25        1.3864  0.0660
     26        1.3864  0.0660
     27        1.3864  0.0670
     28        1.3864  0.0740
     29        1.3864  0.0660
     30        1.3864  0.0700
     31        1.3864  0.0710
     32        1.3864  0.0700
     33        1.3864  0.0740
     34        1.3864  0.0720
     35   

      4       11.9568  0.0710
      5        [36m7.0775[0m  0.0650
      6        [36m1.3871[0m  0.0710
      7        [36m1.3862[0m  0.0730
      8        [36m1.3858[0m  0.0650
      9        [36m1.3766[0m  0.0680
     10        [36m1.3186[0m  0.0750
     11        1.3990  0.0670
     12        1.3873  0.0740
     13        1.3864  0.0710
     14        1.3864  0.0780
     15        1.3864  0.0710
     16        1.3864  0.0730
     17        1.3864  0.0710
     18        1.3864  0.0660
     19        1.3864  0.0680
     20        1.3864  0.0720
     21        1.3864  0.0650
     22        1.3864  0.0640
     23        1.3864  0.0710
     24        1.3864  0.0650
     25        1.3864  0.0730
     26        1.3864  0.0670
     27        1.3864  0.0690
     28        1.3864  0.0670
     29        1.3864  0.0670
     30        1.3864  0.0660
     31        1.3864  0.0670
     32        1.3864  0.0660
     33        1.3864  0.0680
     34        1.3864  0.0670
     35        1

     13       11.9568  0.0730
     14       11.9568  0.0720
     15       11.9568  0.0700
     16       11.9568  0.0720
     17       11.9568  0.0730
     18       11.9568  0.0690
     19       11.9568  0.0690
     20       11.9568  0.0700
     21       11.9568  0.0720
     22       11.9568  0.0720
     23       11.9568  0.0680
     24       11.9568  0.0670
     25       11.9568  0.0670
     26       11.9568  0.0740
     27       11.9568  0.0750
     28       11.9568  0.0690
     29       11.9568  0.0720
     30       11.9568  0.0670
     31       11.9568  0.0760
     32       11.9568  0.0680
     33       11.9568  0.0680
     34       11.9568  0.0770
     35       11.9568  0.0800
     36       11.9568  0.0700
     37       11.9568  0.0740
     38       11.9568  0.0720
     39       11.9568  0.0730
     40       11.9568  0.0670
     41       11.9568  0.0690
     42       11.9568  0.0690
     43       11.9568  0.0770
     44       11.9568  0.0780
     45       11.9568  0.0700
     46   

     13        1.3878  0.0770
     14        1.3878  0.0730
     15        1.3878  0.0760
     16        1.3878  0.0720
     17        1.3878  0.0710
     18        1.3878  0.0800
     19        1.3878  0.0720
     20        1.3878  0.0750
     21        1.3878  0.0770
     22        1.3878  0.0770
     23        1.3878  0.0700
     24        1.3878  0.0770
     25        1.3878  0.0730
     26        1.3878  0.0710
     27        1.3878  0.0720
     28        1.3878  0.0780
     29        1.3878  0.0780
     30        1.3878  0.0670
     31        1.3878  0.0720
     32        1.3878  0.0730
     33        1.3878  0.0680
     34        1.3878  0.0720
     35        1.3878  0.0741
     36        1.3878  0.0760
     37        1.3878  0.0680
     38        1.3878  0.0680
     39        1.3878  0.0680
     40        1.3878  0.0710
     41        1.3878  0.0740
     42        1.3878  0.0750
     43        1.3878  0.0750
     44        1.3878  0.0730
     45        1.3878  0.0730
     46   

     16        1.3882  0.0660
     17        [36m1.3877[0m  0.0640
     18        1.3884  0.0690
     19        [36m1.3877[0m  0.0701
     20        1.3878  0.0750
     21        1.3878  0.0670
     22        1.3878  0.0710
     23        1.3878  0.0680
     24        1.3878  0.0680
     25        1.3878  0.0730
     26        1.3878  0.0680
     27        1.3878  0.0740
     28        1.3878  0.0670
     29        1.3878  0.0680
     30        1.3878  0.0745
     31        1.3878  0.0680
     32        1.3878  0.0748
     33        1.3878  0.0680
     34        1.3878  0.0670
     35        1.3878  0.0700
     36        1.3878  0.0700
     37        1.3878  0.0690
     38        1.3878  0.0670
     39        1.3878  0.0680
     40        1.3878  0.0680
     41        1.3878  0.0735
     42        1.3878  0.0710
     43        1.3878  0.0690
     44        1.3878  0.0680
     45        1.3878  0.0699
     46        1.3878  0.0670
     47        1.3878  0.0690
     48        1.3878 

     34        [36m0.8677[0m  0.0710
     35        [36m0.8652[0m  0.0740
     36        [36m0.8635[0m  0.0720
     37        0.8660  0.0750
     38        0.8699  0.0690
     39        0.8651  0.0690
     40        0.8676  0.0730
     41        0.8663  0.0780
     42        [36m0.8625[0m  0.0710
     43        [36m0.8594[0m  0.0730
     44        [36m0.8526[0m  0.0710
     45        0.8567  0.0740
     46        0.8542  0.0690
     47        [36m0.8494[0m  0.0750
     48        [36m0.8467[0m  0.0700
     49        0.8500  0.0680
     50        0.8467  0.0690
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.6443[0m  0.0700
      2        [36m1.2981[0m  0.0700
      3        [36m1.1755[0m  0.0710
      4        [36m1.0915[0m  0.0720
      5        [36m1.0557[0m  0.0730
      6        [36m1.0179[0m  0.0650
      7        [36m1.0084[0m  0.0710
      8        [36m0.9985[0m  0.0680
      9        [36m0.9869[0m  0.0720
     10

  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.0996[0m  0.0700
      2        [36m1.2887[0m  0.0670
      3        [36m1.2120[0m  0.0690
      4        [36m1.0969[0m  0.0760
      5        [36m1.0204[0m  0.0715
      6        [36m0.9820[0m  0.0705
      7        [36m0.9745[0m  0.0685
      8        [36m0.9546[0m  0.0736
      9        [36m0.9479[0m  0.0680
     10        [36m0.9424[0m  0.0690
     11        [36m0.9368[0m  0.0670
     12        [36m0.9351[0m  0.0690
     13        0.9382  0.0710
     14        0.9452  0.0720
     15        0.9399  0.0780
     16        0.9429  0.0730
     17        0.9737  0.0750
     18        0.9656  0.0720
     19        0.9390  0.0690
     20        0.9383  0.0690
     21        0.9384  0.0680
     22        0.9389  0.0720
     23        0.9389  0.0920
     24        [36m0.9295[0m  0.0730
     25        [36m0.9245[0m  0.0720
     26        0.9280  0.0720
     27        [36m0.9240[0m  0.

     24        [36m0.9456[0m  0.0688
     25        [36m0.9440[0m  0.0700
     26        0.9452  0.0680
     27        [36m0.9438[0m  0.0700
     28        [36m0.9418[0m  0.0660
     29        [36m0.9416[0m  0.0760
     30        0.9419  0.0670
     31        [36m0.9409[0m  0.0720
     32        [36m0.9406[0m  0.0670
     33        0.9421  0.0710
     34        0.9410  0.0720
     35        [36m0.9399[0m  0.0660
     36        0.9407  0.0770
     37        0.9401  0.0710
     38        0.9402  0.0710
     39        0.9402  0.0730
     40        0.9404  0.0700
     41        0.9400  0.0700
     42        [36m0.9398[0m  0.0760
     43        [36m0.9392[0m  0.0750
     44        0.9394  0.0660
     45        0.9394  0.0660
     46        [36m0.9384[0m  0.0690
     47        [36m0.9376[0m  0.0730
     48        0.9386  0.0800
     49        0.9378  0.0710
     50        0.9379  0.0670
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m1.

      8       11.9568  0.0795
      9       11.9568  0.0730
     10       11.9568  0.0710
     11       11.9568  0.0790
     12       11.9568  0.0760
     13       11.9568  0.0710
     14       11.9568  0.0727
     15       11.9568  0.0710
     16       11.9568  0.0750
     17       11.9568  0.0740
     18       11.9568  0.0780
     19       11.9568  0.0720
     20       11.9568  0.0720
     21       11.9568  0.0780
     22       11.9568  0.0710
     23       11.9568  0.0720
     24       11.9568  0.0770
     25       11.9568  0.0770
     26       11.9568  0.0730
     27       11.9568  0.0770
     28       11.9568  0.0760
     29       11.9568  0.0790
     30       11.9568  0.0720
     31       11.9568  0.0750
     32       11.9568  0.0740
     33       11.9568  0.0720
     34       11.9568  0.0780
     35       11.9568  0.0710
     36       11.9568  0.0770
     37       11.9568  0.0730
     38       11.9568  0.0680
     39       11.9568  0.0730
     40       11.9568  0.0760
     41   

     14        [36m1.3864[0m  0.0680
     15        [36m1.3864[0m  0.0730
     16        [36m1.3863[0m  0.0740
     17        [36m1.3863[0m  0.0660
     18        [36m1.3863[0m  0.0710
     19        1.3863  0.0680
     20        1.3863  0.0760
     21        [36m1.3863[0m  0.0760
     22        [36m1.3863[0m  0.0880
     23        [36m1.3859[0m  0.0710
     24        [36m1.3809[0m  0.0770
     25        [36m1.3558[0m  0.0750
     26        [36m1.2871[0m  0.0700
     27        1.3880  0.0660
     28        1.3903  0.0690
     29        1.3866  0.0690
     30        1.3864  0.0670
     31        1.3864  0.0700
     32        1.3864  0.0780
     33        1.3864  0.0740
     34        1.3864  0.0740
     35        1.3864  0.0700
     36        1.3864  0.0680
     37        1.3864  0.0690
     38        1.3864  0.0710
     39        1.3864  0.0710
     40        1.3864  0.0670
     41        1.3864  0.0690
     42        1.3864  0.0740
     43        1.3864  0.0730
 

     11        1.3864  0.0700
     12        1.3864  0.0670
     13        1.3864  0.0723
     14        1.3864  0.0660
     15        1.3864  0.0660
     16        1.3864  0.0680
     17        1.3864  0.0660
     18        1.3864  0.0700
     19        1.3864  0.0790
     20        1.3864  0.0750
     21        1.3864  0.0650
     22        1.3864  0.0760
     23        1.3864  0.0680
     24        1.3864  0.0750
     25        1.3864  0.0660
     26        1.3864  0.0700
     27        1.3864  0.0710
     28        1.3864  0.0750
     29        1.3864  0.0710
     30        1.3864  0.0670
     31        1.3864  0.0690
     32        1.3864  0.0710
     33        1.3864  0.0720
     34        1.3864  0.0720
     35        1.3864  0.0760
     36        1.3864  0.0720
     37        1.3864  0.0710
     38        1.3864  0.0690
     39        1.3864  0.0680
     40        1.3864  0.0740
     41        1.3864  0.0700
     42        1.3864  0.0650
     43        1.3864  0.0720
     44   

     22       11.9568  0.0780
     23       11.9568  0.0840
     24       11.9568  0.0790
     25       11.9568  0.0720
     26       11.9568  0.0780
     27       11.9568  0.0720
     28       11.9568  0.0760
     29       11.9568  0.0750
     30       11.9568  0.0740
     31       11.9568  0.0720
     32       11.9568  0.0760
     33       11.9568  0.0710
     34       11.9568  0.0720
     35       11.9568  0.0760
     36       11.9568  0.0770
     37       11.9568  0.0750
     38       11.9568  0.0730
     39       11.9568  0.0800
     40       11.9568  0.0720
     41       11.9568  0.0720
     42       11.9568  0.0730
     43       11.9568  0.0680
     44       11.9568  0.0690
     45       11.9568  0.0760
     46       11.9568  0.0731
     47       11.9568  0.0690
     48       11.9568  0.0750
     49       11.9568  0.0720
     50       11.9568  0.0820
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8956[0m  0.0704
      2       11.9568  0.0720
 

     32        1.3875  0.0660
     33        1.3875  0.0750
     34        1.3875  0.0760
     35        1.3875  0.0710
     36        1.3875  0.0680
     37        1.3875  0.0720
     38        1.3875  0.0690
     39        1.3875  0.0680
     40        1.3875  0.0750
     41        1.3875  0.0680
     42        1.3875  0.0750
     43        1.3875  0.0650
     44        1.3875  0.0680
     45        1.3875  0.0720
     46        1.3875  0.0650
     47        1.3875  0.0690
     48        1.3875  0.0680
     49        1.3875  0.0670
     50        1.3875  0.0760
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.6855[0m  0.0690
      2       11.9568  0.0820
      3       11.9568  0.0770
      4       11.9568  0.0740
      5       11.9568  0.0780
      6       11.9568  0.0765
      7       11.9568  0.0690
      8        [36m9.5460[0m  0.0720
      9        [36m1.4120[0m  0.0745
     10        [36m1.3879[0m  0.0720
     11        1.3881  0.0730
    

     32        1.3875  0.0750
     33        1.3875  0.0720
     34        1.3875  0.0670
     35        1.3875  0.0660
     36        1.3875  0.0700
     37        1.3875  0.0750
     38        1.3875  0.0750
     39        1.3875  0.0710
     40        1.3875  0.0730
     41        1.3875  0.0770
     42        1.3875  0.0790
     43        1.3875  0.0720
     44        1.3875  0.0720
     45        1.3875  0.0740
     46        1.3875  0.0660
     47        1.3875  0.0730
     48        1.3875  0.0683
     49        1.3875  0.0730
     50        1.3875  0.0680
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.7731[0m  0.0730
      2       [36m11.7135[0m  0.0810
      3        [36m5.2932[0m  0.0680
      4        5.5776  0.0700
      5        9.6484  0.0670
      6        [36m1.5743[0m  0.0680
      7       11.9505  0.0810
      8        3.5832  0.0720
      9        1.8968  0.0730
     10        7.3265  0.0730
     11       11.1984  0.0740
    

     19        0.9208  0.0740
     20        0.9233  0.0730
     21        0.9218  0.0690
     22        [36m0.9146[0m  0.0700
     23        [36m0.9080[0m  0.0680
     24        [36m0.9079[0m  0.0730
     25        [36m0.9046[0m  0.0740
     26        [36m0.9020[0m  0.0720
     27        [36m0.9009[0m  0.0700
     28        [36m0.8994[0m  0.0640
     29        [36m0.8973[0m  0.0690
     30        [36m0.8957[0m  0.0720
     31        [36m0.8948[0m  0.0850
     32        [36m0.8928[0m  0.0770
     33        [36m0.8917[0m  0.0690
     34        [36m0.8913[0m  0.0650
     35        [36m0.8885[0m  0.0720
     36        [36m0.8884[0m  0.0700
     37        [36m0.8880[0m  0.0700
     38        0.8883  0.0730
     39        [36m0.8869[0m  0.0750
     40        [36m0.8850[0m  0.0720
     41        0.8854  0.0680
     42        [36m0.8831[0m  0.0690
     43        [36m0.8817[0m  0.0670
     44        0.8822  0.0720
     45        0.8817  0.0710
     46   

     35        [36m0.9986[0m  0.0690
     36        0.9992  0.0650
     37        1.0003  0.0660
     38        [36m0.9966[0m  0.0650
     39        [36m0.9960[0m  0.0670
     40        [36m0.9942[0m  0.0740
     41        [36m0.9910[0m  0.0690
     42        [36m0.9891[0m  0.0700
     43        [36m0.9868[0m  0.0660
     44        [36m0.9845[0m  0.0660
     45        0.9859  0.0660
     46        0.9854  0.0650
     47        [36m0.9800[0m  0.0660
     48        [36m0.9734[0m  0.0660
     49        [36m0.9687[0m  0.0690
     50        [36m0.9674[0m  0.0700
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m10.9070[0m  0.0640
      2        [36m1.6441[0m  0.0710
      3        [36m1.3684[0m  0.0710
      4        [36m1.3198[0m  0.0650
      5        [36m1.2703[0m  0.0690
      6        [36m1.2029[0m  0.0650
      7        [36m1.1352[0m  0.0680
      8        [36m1.0796[0m  0.0670
      9        [36m1.0419[0m  0.0720
 

      2        [36m1.3229[0m  0.0690
      3        [36m1.2864[0m  0.0670
      4        [36m1.2509[0m  0.0660
      5        [36m1.2174[0m  0.0720
      6        [36m1.1750[0m  0.0690
      7        [36m1.0923[0m  0.0750
      8        [36m1.0399[0m  0.0740
      9        [36m1.0223[0m  0.0720
     10        [36m0.9876[0m  0.0720
     11        [36m0.9825[0m  0.0680
     12        [36m0.9748[0m  0.0760
     13        [36m0.9668[0m  0.0760
     14        [36m0.9589[0m  0.0730
     15        [36m0.9529[0m  0.0680
     16        [36m0.9512[0m  0.0740
     17        [36m0.9472[0m  0.0730
     18        [36m0.9409[0m  0.0690
     19        [36m0.9399[0m  0.0650
     20        [36m0.9360[0m  0.0670
     21        [36m0.9316[0m  0.0650
     22        0.9370  0.0650
     23        [36m0.9301[0m  0.0690
     24        [36m0.9297[0m  0.0650
     25        [36m0.9292[0m  0.0700
     26        0.9325  0.0690
     27        0.9299  0.0660
     28      

     22        1.3864  0.0660
     23        1.3864  0.0670
     24        1.3864  0.0710
     25        1.3864  0.0650
     26        1.3864  0.0670
     27        1.3864  0.0670
     28        1.3864  0.0710
     29        1.3864  0.0650
     30        1.3864  0.0710
     31        1.3864  0.0740
     32        1.3864  0.0720
     33        1.3864  0.0690
     34        1.3864  0.0720
     35        1.3864  0.0710
     36        1.3864  0.0650
     37        1.3864  0.0710
     38        1.3864  0.0670
     39        1.3864  0.0660
     40        1.3864  0.0740
     41        1.3864  0.0640
     42        1.3864  0.0650
     43        1.3864  0.0690
     44        1.3864  0.0650
     45        1.3864  0.0670
     46        1.3864  0.0680
     47        1.3864  0.0710
     48        1.3864  0.0640
     49        1.3864  0.0690
     50        1.3864  0.0650
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.0243[0m  0.0750
      2        [36m1.3871[0m 

     23       11.9589  0.0680
     24       11.9589  0.0920
     25       11.9589  0.0710
     26       11.9589  0.0710
     27       11.9589  0.0720
     28       11.9589  0.0690
     29       11.9589  0.0810
     30       11.9589  0.0680
     31       11.9589  0.0710
     32       11.9589  0.0690
     33       11.9589  0.0730
     34       11.9589  0.0700
     35       11.9589  0.0800
     36       11.9589  0.0710
     37       11.9589  0.0680
     38       11.9589  0.0720
     39       11.9589  0.0690
     40       11.9589  0.0680
     41       11.9589  0.0710
     42       11.9589  0.0710
     43       11.9589  0.0740
     44       11.9589  0.0690
     45       11.9589  0.0740
     46       11.9589  0.0720
     47       11.9589  0.0810
     48       11.9589  0.0720
     49       11.9589  0.0720
     50       11.9589  0.0690
  epoch    train_loss     dur
-------  ------------  ------
      1        [36m2.9320[0m  0.0680
      2        [36m1.3868[0m  0.0720
      3        [36m1.

     26        1.3864  0.0760
     27        1.3864  0.0680
     28        1.3864  0.0680
     29        1.3864  0.0710
     30        1.3864  0.0730
     31        1.3864  0.0730
     32        1.3864  0.0730
     33        1.3864  0.0690
     34        1.3864  0.0690
     35        1.3864  0.0690
     36        1.3864  0.0710
     37        1.3864  0.0700
     38        1.3864  0.0740
     39        1.3864  0.0670
     40        1.3864  0.0720
     41        1.3864  0.0650
     42        1.3864  0.0720
     43        1.3864  0.0690
     44        1.3864  0.0720
     45        1.3864  0.0710
     46        1.3864  0.0690
     47        1.3864  0.0750
     48        1.3864  0.0660
     49        1.3864  0.0780
     50        1.3864  0.0690
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.3626[0m  0.0780
      2       11.9589  0.0750
      3       11.9589  0.0750
      4       11.9589  0.0670
      5        [36m9.9994[0m  0.0690
      6        [36m1.

     29       11.9568  0.0760
     30       11.9568  0.0810
     31       11.9568  0.0700
     32       11.9568  0.0780
     33       11.9568  0.0670
     34       11.9568  0.0690
     35       11.9568  0.0700
     36       11.9568  0.0750
     37       11.9568  0.0780
     38       11.9568  0.0700
     39       11.9568  0.0710
     40       11.9568  0.0750
     41       11.9568  0.0720
     42       11.9568  0.0690
     43       11.9568  0.0670
     44       11.9568  0.0690
     45       11.9568  0.0690
     46       11.9568  0.0750
     47       11.9568  0.0740
     48       11.9568  0.0670
     49       11.9568  0.0710
     50       11.9568  0.0750
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.6511[0m  0.0700
      2       11.9547  0.0690
      3       11.9547  0.0710
      4       11.9547  0.0710
      5       11.9547  0.0740
      6       11.9547  0.0710
      7       11.9547  0.0710
      8       11.9547  0.0710
      9       11.9547  0.0670
 

     26        1.3880  0.0720
     27        1.3880  0.0720
     28        1.3880  0.0730
     29        1.3880  0.0730
     30        1.3880  0.0730
     31        1.3880  0.0760
     32        1.3880  0.0710
     33        1.3880  0.0730
     34        1.3880  0.0750
     35        1.3880  0.0780
     36        1.3880  0.0750
     37        1.3880  0.0710
     38        1.3880  0.0770
     39        1.3880  0.0730
     40        1.3880  0.0760
     41        1.3880  0.0740
     42        1.3880  0.0690
     43        1.3880  0.0700
     44        1.3880  0.0770
     45        1.3880  0.0730
     46        1.3880  0.0770
     47        1.3880  0.0800
     48        1.3880  0.0700
     49        1.3880  0.0750
     50        1.3880  0.0730
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8571[0m  0.0740
      2       11.9568  0.0730
      3       11.9568  0.0760
      4       11.9568  0.0790
      5       11.9568  0.0730
      6       11.9568  0.0750
 

     29        1.3880  0.0760
     30        1.3880  0.0650
     31        1.3880  0.0700
     32        1.3880  0.0680
     33        1.3880  0.0660
     34        1.3880  0.0720
     35        1.3880  0.0650
     36        1.3880  0.0710
     37        1.3880  0.0740
     38        1.3880  0.0730
     39        1.3880  0.0670
     40        1.3880  0.0660
     41        1.3880  0.0680
     42        1.3880  0.0660
     43        1.3880  0.0690
     44        1.3880  0.0740
     45        1.3880  0.0710
     46        1.3880  0.0780
     47        1.3880  0.0700
     48        1.3880  0.0690
     49        1.3880  0.0650
     50        1.3880  0.0720
  epoch    train_loss     dur
-------  ------------  ------
      1       [36m11.8554[0m  0.0680
      2        [36m2.9084[0m  0.0710
      3        [36m1.8287[0m  0.0660
      4        [36m1.6243[0m  0.0700
      5        [36m1.4036[0m  0.0690
      6        [36m1.3966[0m  0.0750
      7        [36m1.3937[0m  0.0680
      8

In [None]:
from skorch.callbacks import EarlyStopping

In [12]:
net_final = NeuralNetClassifier(
    MLP_network,
    optimizer=torch.optim.SGD,
    optimizer__momentum=0.9, # momentum set to commonly used value to save CPU time
    batch_size=128, 
    max_epochs=50, 
    module__hidden_dim=20,
    optimizer__lr=0.001,
    optimizer__weight_decay=0.01
)

In [13]:
net_final.fit(X_train, y_train)

  epoch    train_loss    valid_acc    valid_loss     dur
-------  ------------  -----------  ------------  ------
      1        [36m2.2165[0m       [32m0.2768[0m        [35m1.3603[0m  0.1090
      2        [36m1.3335[0m       [32m0.3797[0m        [35m1.3036[0m  0.1140
      3        [36m1.2100[0m       [32m0.4912[0m        [35m1.1024[0m  0.1140
      4        [36m1.0894[0m       [32m0.5499[0m        [35m0.9972[0m  0.1071
      5        [36m0.9912[0m       [32m0.5717[0m        [35m0.9339[0m  0.1128
      6        [36m0.9732[0m       0.5595        [35m0.9309[0m  0.1160
      7        [36m0.9538[0m       [32m0.5840[0m        [35m0.9117[0m  0.1150
      8        [36m0.9421[0m       [32m0.5915[0m        [35m0.8982[0m  0.1210
      9        [36m0.9337[0m       [32m0.5947[0m        [35m0.8940[0m  0.1230
     10        [36m0.9290[0m       [32m0.5963[0m        [35m0.8908[0m  0.1130
     11        [36m0.9269[0m       0.5877        [35

<class 'skorch.classifier.NeuralNetClassifier'>[initialized](
  module_=MLP_network(
    (hidden1): Linear(in_features=11, out_features=20, bias=True)
    (hidden2): Linear(in_features=20, out_features=20, bias=True)
    (output): Linear(in_features=20, out_features=4, bias=True)
  ),
)

In [14]:
net_final.score(X_test, y_test)

0.606769537083126