In [1]:
%load_ext autoreload
%autoreload 2

In [2]:
import json
import numpy as np
from torch.utils.data import Dataset, DataLoader
import glob
import wandb
import os
import torch.optim as optimizers

In [3]:
import dfs_code
from torch_geometric.data import InMemoryDataset, Data
import pickle
import torch
import torch.nn as nn
import tqdm
import copy
import pandas as pd
#torch.multiprocessing.set_sharing_strategy('file_system') # this is important on local machine
#def set_worker_sharing_strategy(worker_id: int) -> None:
#    torch.multiprocessing.set_sharing_strategy('file_system')

In [4]:
import sys
sys.path = ['../../src'] + sys.path
from dfs_transformer import EarlyStopping, DFSCodeSeq2SeqFC

2021-08-27 14:51:47.921619: W tensorflow/stream_executor/platform/default/dso_loader.cc:64] Could not load dynamic library 'libcudart.so.11.0'; dlerror: libcudart.so.11.0: cannot open shared object file: No such file or directory
2021-08-27 14:51:47.921648: I tensorflow/stream_executor/cuda/cudart_stub.cc:29] Ignore above cudart dlerror if you do not have a GPU set up on your machine.


In [5]:
wandb.init(project='chembl', entity='chrisxx')

config = wandb.config
config.n_atoms = 118
config.n_bonds = 4
config.emb_dim = 120
config.nhead = 12
config.nlayers = 6
config.max_nodes = 400
config.max_edges = 600
config.dim_feedforward = 2048
config.lr = 0.0001038
config.n_epochs = 10000
config.lr_adjustment_period = 500
config.patience = 5
config.factor = 0.96
config.minimal_lr = 6e-8
config.batch_size = 200
config.valid_patience = 10000
config.valid_minimal_improvement=0.00
config.model_dir = '../../models/chembl/better_transformer/medium/'
config.data_dir = "/mnt/project/chembl/ChEMBL100_noH/"
config.num_workers = 0
config.prefetch_factor = 2
config.persistent_workers = False
config.load_last = True


[34m[1mwandb[0m: Currently logged in as: [33mchrisxx[0m (use `wandb login --relogin` to force relogin)
[34m[1mwandb[0m: wandb version 0.12.1 is available!  To upgrade, please run:
[34m[1mwandb[0m:  $ pip install wandb --upgrade
2021-08-27 14:52:01.617056: W tensorflow/stream_executor/platform/default/dso_loader.cc:64] Could not load dynamic library 'libcudart.so.11.0'; dlerror: libcudart.so.11.0: cannot open shared object file: No such file or directory
2021-08-27 14:52:01.617082: I tensorflow/stream_executor/cuda/cudart_stub.cc:29] Ignore above cudart dlerror if you do not have a GPU set up on your machine.


In [6]:
os.makedirs(config.model_dir, exist_ok=True)

In [7]:
torch.multiprocessing.get_all_sharing_strategies()

{'file_descriptor', 'file_system'}

In [8]:
path = config.data_dir

In [9]:
class ChEMBL(InMemoryDataset):
    def __init__(self, fname):
        super().__init__()
        self.data, self.slices = torch.load(fname)

class ChEMBL100NoH(Dataset):
    """ChEMBL dataset of molecules and minimal DFS codes."""
    # create data structure that says which id is in which file...
    def __init__(self, path="/home/wendlerc/leq100_timeout60_sanity",
                       graph_pattern="/home/wendlerc/ChEMBL/preprocessedNoHs_split%d.pt", 
                       csv_file="/home/wendlerc/ChEMBL/small_molecules.csv", 
                       idx_max=64,
                       transform=None):
        self.path = path
        self.fnames = glob.glob(path+"CHEMBL*.pkl")
        self.data = []
        self.csv_file = csv_file
        self.path = path
        self.graph_pattern = graph_pattern 
        self.idx_max = idx_max
        self.prepare()
        
        
    def prepare(self):
        codes_all = {}
        for i in tqdm.tqdm(range(self.idx_max)):
            with open(self.path+"/%d/min_dfs_codes_split%d.json"%(i+1, i), 'r') as f:
                codes = json.load(f)
                for key, val in codes.items():
                    codes_all[key] = val
        graph_pattern = self.graph_pattern
        df = pd.read_csv(self.csv_file, delimiter=';', low_memory=False)
        chembl2smiles = {cid:smiles for cid, smiles in zip(df['ChEMBL ID'], df['Smiles'])}
        for i in range(self.idx_max):
            dataset = ChEMBL(graph_pattern%i)
            print(i)
            for data in tqdm.tqdm(dataset):
                if data.name in codes_all:
                    code = codes_all[data.name]
                    d = {'x':data.x.numpy(),
                          'z':data.z.numpy(),
                          'edge_attr': data.edge_attr.numpy(),
                          'edge_index': data.edge_index.numpy(),
                          'name':data.name,
                          'min_dfs_code': np.asarray(code['min_dfs_code']),
                          'min_dfs_index': np.asarray(code['dfs_index']),
                          'smiles': chembl2smiles[data.name]}
                    data_ = Data(x=torch.tensor(d['x']),
                                z=torch.tensor(d['z']),
                                edge_attr=torch.tensor(d['edge_attr']),
                                edge_index=torch.tensor(d['edge_index'], dtype=torch.long),
                                name=d['name'],
                                min_dfs_code=torch.tensor(d['min_dfs_code']),
                                min_dfs_index=torch.tensor(d['min_dfs_index'], dtype=torch.long),
                                smiles=d['smiles'])
                    self.data += [data_]   
            del dataset
        
    def __len__(self):
        return len(self.data)

    def __getitem__(self, idx):
        return self.data[idx]

In [10]:
def collate_fn(dlist):
    x_batch = [] 
    z_batch = []
    edge_attr_batch = []
    rnd_code_batch = []
    min_code_batch = []
    for d in dlist:
        rnd_code, rnd_index = dfs_code.rnd_dfs_code_from_torch_geometric(d, 
                                                                         d.z.numpy().tolist(), 
                                                                         np.argmax(d.edge_attr.numpy(), axis=1))
        x_batch += [d.x]
        z_batch += [d.z]#[nn.functional.one_hot(d.z, 118)]#118 elements in periodic table
        edge_attr_batch += [d.edge_attr]
        rnd_code_batch += [torch.tensor(rnd_code)]
        min_code_batch += [d.min_dfs_code]
    return rnd_code_batch, x_batch, z_batch, edge_attr_batch, min_code_batch

In [11]:
ngpu=1
device = torch.device('cuda:0' if (torch.cuda.is_available() and ngpu > 0) else 'cpu')

In [12]:
dataset = ChEMBL100NoH(idx_max=64)

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 64/64 [02:33<00:00,  2.39s/it]


0


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5490.06it/s]


1


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5371.88it/s]


2


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5405.25it/s]


3


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5324.63it/s]


4


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5249.85it/s]


5


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5330.35it/s]


6


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5298.16it/s]


7


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5311.49it/s]


8


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5258.13it/s]


9


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5241.57it/s]


10


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5308.66it/s]


11


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5297.09it/s]


12


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5274.55it/s]


13


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5232.34it/s]


14


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5265.50it/s]


15


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5321.01it/s]


16


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5319.72it/s]


17


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5286.59it/s]


18


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5314.85it/s]


19


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5229.61it/s]


20


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5306.18it/s]


21


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5273.69it/s]


22


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5304.13it/s]


23


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5229.97it/s]


24


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5189.12it/s]


25


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5212.08it/s]


26


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5285.83it/s]


27


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5272.14it/s]


28


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5291.02it/s]


29


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5300.79it/s]


30


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:37<00:00, 801.15it/s]


31


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5442.89it/s]


32


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5346.90it/s]


33


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 4996.16it/s]


34


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5096.97it/s]


35


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:06<00:00, 4939.16it/s]


36


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:06<00:00, 4717.69it/s]


37


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5137.43it/s]


38


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5375.77it/s]


39


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5197.06it/s]


40


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5227.81it/s]


41


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5258.04it/s]


42


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5194.32it/s]


43


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5209.20it/s]


44


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5232.57it/s]


45


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5092.89it/s]


46


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5199.93it/s]


47


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5210.95it/s]


48


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5219.11it/s]


49


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5272.14it/s]


50


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5288.11it/s]


51


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5063.16it/s]


52


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5117.22it/s]


53


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5270.23it/s]


54


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5257.19it/s]


55


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5292.99it/s]


56


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5244.73it/s]


57


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5242.99it/s]


58


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5257.16it/s]


59


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5149.49it/s]


60


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5247.64it/s]


61


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5255.08it/s]


62


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5254.39it/s]


63


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5257.97it/s]


In [13]:
loader = DataLoader(dataset, batch_size=config.batch_size, shuffle=True, pin_memory=False, collate_fn=collate_fn,
                   num_workers=config.num_workers, prefetch_factor=config.prefetch_factor, 
                    persistent_workers=config.persistent_workers)

In [14]:
to_cuda = lambda T: [t.to(device) for t in T]

In [15]:
model = DFSCodeSeq2SeqFC(n_atoms=config.n_atoms,
                         n_bonds=config.n_bonds, 
                         emb_dim=config.emb_dim, 
                         nhead=config.nhead, 
                         nlayers=config.nlayers, 
                         max_nodes=config.max_nodes, 
                         max_edges=config.max_edges,
                         atom_encoder=nn.Embedding(config.n_atoms, config.emb_dim), 
                         bond_encoder=nn.Linear(config.n_bonds, config.emb_dim))

In [16]:
if config.load_last:
    model.load_state_dict(torch.load(config.model_dir+'checkpoint.pt'))

In [17]:
optim = optimizers.Adam(model.parameters(), lr=config.lr)

#lr_scheduler = optimizers.lr_scheduler.ReduceLROnPlateau(optim, mode='min', verbose=True, patience=config.patience, factor=config.factor)
lr_scheduler = optimizers.lr_scheduler.ExponentialLR(optim, gamma=config.factor)

early_stopping = EarlyStopping(patience=config.valid_patience, delta=config.valid_minimal_improvement,
                              path=config.model_dir+'checkpoint.pt')
bce = torch.nn.BCEWithLogitsLoss()
ce = torch.nn.CrossEntropyLoss(ignore_index=-1)
softmax = nn.Softmax(dim=2)

In [18]:
model.to(device)

DFSCodeSeq2SeqFC(
  (encoder): DFSCodeEncoder(
    (emb_dfs): PositionalEncoding(
      (dropout): Dropout(p=0, inplace=False)
    )
    (emb_seq): PositionalEncoding(
      (dropout): Dropout(p=0.1, inplace=False)
    )
    (emb_atom): Embedding(118, 120)
    (emb_bond): Linear(in_features=4, out_features=120, bias=True)
    (mixer): Linear(in_features=600, out_features=600, bias=True)
    (enc): TransformerEncoder(
      (layers): ModuleList(
        (0): TransformerEncoderLayer(
          (self_attn): MultiheadAttention(
            (out_proj): NonDynamicallyQuantizableLinear(in_features=600, out_features=600, bias=True)
          )
          (linear1): Linear(in_features=600, out_features=2048, bias=True)
          (dropout): Dropout(p=0.1, inplace=False)
          (linear2): Linear(in_features=2048, out_features=600, bias=True)
          (norm1): LayerNorm((600,), eps=1e-05, elementwise_affine=True)
          (norm2): LayerNorm((600,), eps=1e-05, elementwise_affine=True)
         

In [None]:
try:
    for epoch in range(config.n_epochs):  
        epoch_loss = 0
        pbar = tqdm.tqdm(loader)
        for i, data in enumerate(pbar):
            optim.zero_grad()
            rndc, x, z, eattr, minc = data
            rndc = to_cuda(rndc)
            z = to_cuda(z)
            eattr = to_cuda(eattr)
            minc = to_cuda(minc)
            #prepare labels
            minc = [torch.cat((c, (-1)*torch.ones((1, 8), dtype=torch.long, device=device)), dim=0) for c in minc]
            minc_seq = nn.utils.rnn.pad_sequence(minc, padding_value=-1)
            
            #prediction
            dfs1, dfs2, atm1, atm2, bnd, eos = model(rndc, z, eattr)
            eos_label = (minc_seq[:,:,0] == (-1))
            loss = ce(torch.reshape(dfs1, (-1, config.max_nodes)), minc_seq[:, :, 0].view(-1)) 
            loss += ce(torch.reshape(dfs2, (-1, config.max_nodes)), minc_seq[:, :, 1].view(-1))
            loss += ce(torch.reshape(atm1, (-1, config.n_atoms)), minc_seq[:, :, 2].view(-1))
            loss += ce(torch.reshape(bnd, (-1, config.n_bonds)), minc_seq[:, :, 3].view(-1))
            loss += ce(torch.reshape(atm2, (-1, config.n_atoms)), minc_seq[:, :, 4].view(-1))
            loss += bce(eos, torch.unsqueeze(eos_label.float(), -1))
            
            loss.backward()
            torch.nn.utils.clip_grad_norm_(model.parameters(), 0.5)
            optim.step()
            epoch_loss = (epoch_loss*i + loss.item())/(i+1)
            
            curr_lr = list(optim.param_groups)[0]['lr']
            wandb.log({'loss':epoch_loss, 
                   'learning rate':curr_lr})
            pbar.set_description('Epoch %d: CE %2.6f'%(epoch+1, epoch_loss))
            
            if i % config.lr_adjustment_period == 0:
                early_stopping(epoch_loss, model)
                
        lr_scheduler.step()#(epoch_loss)
        
        if early_stopping.early_stop:
            break

        if curr_lr < config.minimal_lr:
            break

except KeyboardInterrupt:
    torch.save(model.state_dict(), config.model_dir+'_keyboardinterrupt.pt')
    print('keyboard interrupt caught')


Epoch 1: CE 0.760323:   5%|█████████                                                                                                                                                                    | 501/9541 [05:22<1:35:00,  1.59it/s]

EarlyStopping counter: 1 out of 10000


Epoch 1: CE 0.762238:  10%|██████████████████                                                                                                                                                          | 1001/9541 [10:43<1:29:15,  1.59it/s]

EarlyStopping counter: 2 out of 10000


Epoch 1: CE 0.763062:  16%|███████████████████████████                                                                                                                                                 | 1501/9541 [16:05<1:24:51,  1.58it/s]

EarlyStopping counter: 3 out of 10000


Epoch 1: CE 0.763855:  21%|████████████████████████████████████                                                                                                                                        | 2001/9541 [21:26<1:20:51,  1.55it/s]

EarlyStopping counter: 4 out of 10000


Epoch 1: CE 0.762676:  26%|█████████████████████████████████████████████                                                                                                                               | 2501/9541 [26:48<1:11:15,  1.65it/s]

EarlyStopping counter: 5 out of 10000


Epoch 1: CE 0.763033:  31%|██████████████████████████████████████████████████████                                                                                                                      | 3001/9541 [32:08<1:10:46,  1.54it/s]

EarlyStopping counter: 6 out of 10000


Epoch 1: CE 0.762825:  37%|███████████████████████████████████████████████████████████████                                                                                                             | 3501/9541 [37:28<1:01:36,  1.63it/s]

EarlyStopping counter: 7 out of 10000


Epoch 1: CE 0.762844:  42%|████████████████████████████████████████████████████████████████████████▏                                                                                                   | 4001/9541 [42:49<1:00:28,  1.53it/s]

EarlyStopping counter: 8 out of 10000


Epoch 1: CE 0.762978:  47%|██████████████████████████████████████████████████████████████████████████████████                                                                                            | 4501/9541 [48:12<52:37,  1.60it/s]

EarlyStopping counter: 9 out of 10000


Epoch 1: CE 0.762752:  52%|███████████████████████████████████████████████████████████████████████████████████████████▏                                                                                  | 5001/9541 [53:31<49:35,  1.53it/s]

EarlyStopping counter: 10 out of 10000


Epoch 1: CE 0.762901:  58%|████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                         | 5501/9541 [58:51<42:21,  1.59it/s]

EarlyStopping counter: 11 out of 10000


Epoch 1: CE 0.762965:  63%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                               | 6001/9541 [1:04:12<38:10,  1.55it/s]

EarlyStopping counter: 12 out of 10000


Epoch 1: CE 0.763414:  68%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                      | 6501/9541 [1:09:33<32:34,  1.56it/s]

EarlyStopping counter: 13 out of 10000


Epoch 1: CE 0.763630:  73%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                             | 7001/9541 [1:14:51<26:36,  1.59it/s]

EarlyStopping counter: 14 out of 10000


Epoch 1: CE 0.763700:  79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                    | 7501/9541 [1:20:14<21:27,  1.58it/s]

EarlyStopping counter: 15 out of 10000


Epoch 1: CE 0.763805:  84%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                           | 8001/9541 [1:25:35<16:01,  1.60it/s]

EarlyStopping counter: 16 out of 10000


Epoch 1: CE 0.763860:  89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:30:55<11:21,  1.53it/s]

EarlyStopping counter: 17 out of 10000


Epoch 1: CE 0.763514:  94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:36:14<05:57,  1.51it/s]

EarlyStopping counter: 18 out of 10000


Epoch 1: CE 0.763625: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:41:35<00:25,  1.60it/s]

EarlyStopping counter: 19 out of 10000


Epoch 1: CE 0.763586: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:42:00<00:00,  1.56it/s]
Epoch 2: CE 0.740016:   5%|█████████                                                                                                                                                                    | 501/9541 [05:23<1:37:52,  1.54it/s]

EarlyStopping counter: 1 out of 10000


Epoch 2: CE 0.745290:  10%|██████████████████                                                                                                                                                          | 1001/9541 [10:44<1:28:35,  1.61it/s]

EarlyStopping counter: 2 out of 10000


Epoch 2: CE 0.748395:  16%|███████████████████████████                                                                                                                                                 | 1501/9541 [16:05<1:28:20,  1.52it/s]

EarlyStopping counter: 3 out of 10000


Epoch 2: CE 0.748356:  21%|████████████████████████████████████                                                                                                                                        | 2001/9541 [21:27<1:25:06,  1.48it/s]

EarlyStopping counter: 4 out of 10000


Epoch 2: CE 0.748320:  26%|█████████████████████████████████████████████                                                                                                                               | 2501/9541 [26:48<1:11:36,  1.64it/s]

EarlyStopping counter: 5 out of 10000


Epoch 2: CE 0.748913:  31%|██████████████████████████████████████████████████████                                                                                                                      | 3001/9541 [32:08<1:12:59,  1.49it/s]

EarlyStopping counter: 6 out of 10000


Epoch 2: CE 0.749206:  37%|███████████████████████████████████████████████████████████████                                                                                                             | 3501/9541 [37:29<1:04:20,  1.56it/s]

EarlyStopping counter: 7 out of 10000


Epoch 2: CE 0.750141:  42%|████████████████████████████████████████████████████████████████████████▏                                                                                                   | 4001/9541 [42:49<1:00:09,  1.53it/s]

EarlyStopping counter: 8 out of 10000


Epoch 2: CE 0.750013:  47%|██████████████████████████████████████████████████████████████████████████████████                                                                                            | 4501/9541 [48:10<55:01,  1.53it/s]

EarlyStopping counter: 9 out of 10000


Epoch 2: CE 0.750229:  52%|███████████████████████████████████████████████████████████████████████████████████████████▏                                                                                  | 5001/9541 [53:30<45:57,  1.65it/s]

EarlyStopping counter: 10 out of 10000


Epoch 2: CE 0.750630:  58%|████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                         | 5501/9541 [58:50<43:51,  1.54it/s]

EarlyStopping counter: 11 out of 10000


Epoch 2: CE 0.750945:  63%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                               | 6001/9541 [1:04:11<38:35,  1.53it/s]

EarlyStopping counter: 12 out of 10000


Epoch 2: CE 0.750934:  68%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                      | 6501/9541 [1:09:30<30:10,  1.68it/s]

EarlyStopping counter: 13 out of 10000


Epoch 2: CE 0.750960:  73%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                             | 7001/9541 [1:14:50<28:20,  1.49it/s]

EarlyStopping counter: 14 out of 10000


Epoch 2: CE 0.751226:  79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                    | 7501/9541 [1:20:09<21:03,  1.61it/s]

EarlyStopping counter: 15 out of 10000


Epoch 2: CE 0.751502:  84%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                           | 8001/9541 [1:25:29<15:54,  1.61it/s]

EarlyStopping counter: 16 out of 10000


Epoch 2: CE 0.751405:  89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:30:49<11:01,  1.57it/s]

EarlyStopping counter: 17 out of 10000


Epoch 2: CE 0.751283:  94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:36:10<05:30,  1.63it/s]

EarlyStopping counter: 18 out of 10000


Epoch 2: CE 0.751364: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:41:29<00:24,  1.66it/s]

EarlyStopping counter: 19 out of 10000


Epoch 2: CE 0.751311: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:41:54<00:00,  1.56it/s]
Epoch 3: CE 0.706178:   0%|                                                                                                                                                                               | 1/9541 [00:00<2:03:38,  1.29it/s]

EarlyStopping counter: 20 out of 10000


Epoch 3: CE 0.742876:   5%|█████████                                                                                                                                                                    | 501/9541 [05:19<1:38:25,  1.53it/s]

EarlyStopping counter: 21 out of 10000


Epoch 3: CE 0.740297:  10%|██████████████████                                                                                                                                                          | 1001/9541 [10:37<1:32:40,  1.54it/s]

EarlyStopping counter: 22 out of 10000


Epoch 3: CE 0.741473:  16%|███████████████████████████                                                                                                                                                 | 1501/9541 [15:56<1:25:40,  1.56it/s]

EarlyStopping counter: 23 out of 10000


Epoch 3: CE 0.741057:  21%|████████████████████████████████████                                                                                                                                        | 2001/9541 [21:13<1:17:40,  1.62it/s]

EarlyStopping counter: 24 out of 10000


Epoch 3: CE 0.741030:  26%|█████████████████████████████████████████████                                                                                                                               | 2501/9541 [26:31<1:09:30,  1.69it/s]

EarlyStopping counter: 25 out of 10000


Epoch 3: CE 0.739959:  31%|██████████████████████████████████████████████████████                                                                                                                      | 3001/9541 [31:50<1:10:05,  1.56it/s]

EarlyStopping counter: 26 out of 10000


Epoch 3: CE 0.741205:  37%|███████████████████████████████████████████████████████████████                                                                                                             | 3501/9541 [37:10<1:04:24,  1.56it/s]

EarlyStopping counter: 27 out of 10000


Epoch 3: CE 0.740268:  42%|████████████████████████████████████████████████████████████████████████▉                                                                                                     | 4001/9541 [42:31<58:10,  1.59it/s]

EarlyStopping counter: 28 out of 10000


Epoch 3: CE 0.739333:  47%|██████████████████████████████████████████████████████████████████████████████████                                                                                            | 4501/9541 [47:51<50:31,  1.66it/s]

EarlyStopping counter: 29 out of 10000


Epoch 3: CE 0.740163:  52%|███████████████████████████████████████████████████████████████████████████████████████████▏                                                                                  | 5001/9541 [53:11<47:21,  1.60it/s]

EarlyStopping counter: 30 out of 10000


Epoch 3: CE 0.739859:  58%|████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                         | 5501/9541 [58:31<44:48,  1.50it/s]

EarlyStopping counter: 31 out of 10000


Epoch 3: CE 0.739828:  63%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                               | 6001/9541 [1:03:50<35:19,  1.67it/s]

EarlyStopping counter: 32 out of 10000


Epoch 3: CE 0.739385:  68%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                      | 6501/9541 [1:09:09<32:29,  1.56it/s]

EarlyStopping counter: 33 out of 10000


Epoch 3: CE 0.739206:  73%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                             | 7001/9541 [1:14:28<28:05,  1.51it/s]

EarlyStopping counter: 34 out of 10000


Epoch 3: CE 0.739041:  79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                    | 7501/9541 [1:19:46<22:16,  1.53it/s]

EarlyStopping counter: 35 out of 10000


Epoch 3: CE 0.738530:  84%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                           | 8001/9541 [1:25:04<16:42,  1.54it/s]

EarlyStopping counter: 36 out of 10000


Epoch 3: CE 0.738509:  89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:30:21<11:16,  1.54it/s]

EarlyStopping counter: 37 out of 10000


Epoch 3: CE 0.738587:  94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:35:39<05:35,  1.61it/s]

EarlyStopping counter: 38 out of 10000


Epoch 3: CE 0.738510: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:40:57<00:25,  1.54it/s]

EarlyStopping counter: 39 out of 10000


Epoch 3: CE 0.738465: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:41:22<00:00,  1.57it/s]
Epoch 4: CE 0.728862:   5%|█████████                                                                                                                                                                    | 501/9541 [05:23<1:33:54,  1.60it/s]

EarlyStopping counter: 1 out of 10000


Epoch 4: CE 0.728473:  10%|██████████████████                                                                                                                                                          | 1001/9541 [10:43<1:35:55,  1.48it/s]

EarlyStopping counter: 2 out of 10000


Epoch 4: CE 0.728277:  16%|███████████████████████████                                                                                                                                                 | 1501/9541 [16:04<1:25:18,  1.57it/s]

EarlyStopping counter: 3 out of 10000


Epoch 4: CE 0.726808:  21%|████████████████████████████████████                                                                                                                                        | 2001/9541 [21:23<1:18:49,  1.59it/s]

EarlyStopping counter: 4 out of 10000


Epoch 4: CE 0.726377:  26%|█████████████████████████████████████████████                                                                                                                               | 2501/9541 [26:45<1:20:07,  1.46it/s]

EarlyStopping counter: 5 out of 10000


Epoch 4: CE 0.726212:  31%|██████████████████████████████████████████████████████                                                                                                                      | 3001/9541 [32:05<1:12:57,  1.49it/s]

EarlyStopping counter: 6 out of 10000


Epoch 4: CE 0.725944:  37%|███████████████████████████████████████████████████████████████                                                                                                             | 3501/9541 [37:25<1:08:18,  1.47it/s]

EarlyStopping counter: 7 out of 10000


Epoch 4: CE 0.726245:  42%|████████████████████████████████████████████████████████████████████████▉                                                                                                     | 4001/9541 [42:42<59:22,  1.56it/s]

EarlyStopping counter: 8 out of 10000


Epoch 4: CE 0.726379:  47%|██████████████████████████████████████████████████████████████████████████████████                                                                                            | 4501/9541 [48:01<54:00,  1.56it/s]

EarlyStopping counter: 9 out of 10000


Epoch 4: CE 0.726359:  52%|███████████████████████████████████████████████████████████████████████████████████████████▏                                                                                  | 5001/9541 [53:23<50:07,  1.51it/s]

EarlyStopping counter: 10 out of 10000


Epoch 4: CE 0.726106:  58%|████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                         | 5501/9541 [59:06<44:40,  1.51it/s]

EarlyStopping counter: 11 out of 10000


Epoch 4: CE 0.725946:  63%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                               | 6001/9541 [1:04:30<38:40,  1.53it/s]

EarlyStopping counter: 12 out of 10000


Epoch 4: CE 0.726209:  68%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                      | 6501/9541 [1:09:55<30:12,  1.68it/s]

EarlyStopping counter: 13 out of 10000


Epoch 4: CE 0.725973:  73%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                             | 7001/9541 [1:15:20<28:17,  1.50it/s]

EarlyStopping counter: 14 out of 10000


Epoch 4: CE 0.726073:  79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                    | 7501/9541 [1:20:45<24:37,  1.38it/s]

EarlyStopping counter: 15 out of 10000


Epoch 4: CE 0.725991:  84%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                           | 8001/9541 [1:26:09<17:00,  1.51it/s]

EarlyStopping counter: 16 out of 10000


Epoch 4: CE 0.726275:  89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:31:36<11:25,  1.52it/s]

EarlyStopping counter: 17 out of 10000


Epoch 4: CE 0.726636:  94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:37:03<06:07,  1.47it/s]

EarlyStopping counter: 18 out of 10000


Epoch 4: CE 0.726336: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:42:27<00:25,  1.59it/s]

EarlyStopping counter: 19 out of 10000


Epoch 4: CE 0.726288: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:42:53<00:00,  1.55it/s]
Epoch 5: CE 0.893171:   0%|                                                                                                                                                                               | 1/9541 [00:00<2:17:58,  1.15it/s]

EarlyStopping counter: 20 out of 10000


Epoch 5: CE 0.712061:   5%|█████████                                                                                                                                                                    | 501/9541 [05:25<1:38:59,  1.52it/s]

EarlyStopping counter: 21 out of 10000


Epoch 5: CE 0.712998:  10%|██████████████████                                                                                                                                                          | 1001/9541 [10:49<1:39:06,  1.44it/s]

EarlyStopping counter: 22 out of 10000


Epoch 5: CE 0.713396:  16%|███████████████████████████                                                                                                                                                 | 1501/9541 [16:15<1:23:43,  1.60it/s]

EarlyStopping counter: 23 out of 10000


Epoch 5: CE 0.712857:  21%|████████████████████████████████████                                                                                                                                        | 2001/9541 [21:40<1:19:36,  1.58it/s]

EarlyStopping counter: 24 out of 10000


Epoch 5: CE 0.711312:  26%|█████████████████████████████████████████████                                                                                                                               | 2501/9541 [27:04<1:16:22,  1.54it/s]

EarlyStopping counter: 25 out of 10000


Epoch 5: CE 0.711555:  31%|██████████████████████████████████████████████████████                                                                                                                      | 3001/9541 [32:28<1:08:22,  1.59it/s]

EarlyStopping counter: 26 out of 10000


Epoch 5: CE 0.711650:  37%|███████████████████████████████████████████████████████████████                                                                                                             | 3501/9541 [37:53<1:05:56,  1.53it/s]

EarlyStopping counter: 27 out of 10000


Epoch 5: CE 0.712353:  42%|████████████████████████████████████████████████████████████████████████▉                                                                                                     | 4001/9541 [43:14<54:38,  1.69it/s]

EarlyStopping counter: 28 out of 10000


Epoch 5: CE 0.712667:  47%|██████████████████████████████████████████████████████████████████████████████████                                                                                            | 4501/9541 [48:35<55:24,  1.52it/s]

EarlyStopping counter: 29 out of 10000


Epoch 5: CE 0.712983:  52%|███████████████████████████████████████████████████████████████████████████████████████████▏                                                                                  | 5001/9541 [53:58<45:12,  1.67it/s]

EarlyStopping counter: 30 out of 10000


Epoch 5: CE 0.712436:  58%|████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                         | 5501/9541 [59:23<44:05,  1.53it/s]

EarlyStopping counter: 31 out of 10000


Epoch 5: CE 0.712557:  63%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                               | 6001/9541 [1:04:47<38:19,  1.54it/s]

EarlyStopping counter: 32 out of 10000


Epoch 5: CE 0.712402:  68%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                      | 6501/9541 [1:10:09<34:46,  1.46it/s]

EarlyStopping counter: 33 out of 10000


Epoch 5: CE 0.712652:  73%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                             | 7001/9541 [1:15:33<29:01,  1.46it/s]

EarlyStopping counter: 34 out of 10000


Epoch 5: CE 0.712767:  79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                    | 7501/9541 [1:20:57<23:18,  1.46it/s]

EarlyStopping counter: 35 out of 10000


Epoch 5: CE 0.713159:  84%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                           | 8001/9541 [1:26:19<16:47,  1.53it/s]

EarlyStopping counter: 36 out of 10000


Epoch 5: CE 0.712768:  89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:31:42<11:01,  1.57it/s]

EarlyStopping counter: 37 out of 10000


Epoch 5: CE 0.712834:  94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:37:04<05:35,  1.61it/s]

EarlyStopping counter: 38 out of 10000


Epoch 5: CE 0.712855: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:42:28<00:25,  1.55it/s]

EarlyStopping counter: 39 out of 10000


Epoch 5: CE 0.712752: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:42:54<00:00,  1.55it/s]
Epoch 6: CE 0.702207:   5%|█████████                                                                                                                                                                    | 501/9541 [05:25<1:39:08,  1.52it/s]

EarlyStopping counter: 1 out of 10000


Epoch 6: CE 0.701421:  10%|██████████████████                                                                                                                                                          | 1001/9541 [10:51<1:35:40,  1.49it/s]

EarlyStopping counter: 2 out of 10000


Epoch 6: CE 0.701840:  16%|███████████████████████████                                                                                                                                                 | 1501/9541 [16:15<1:28:34,  1.51it/s]

EarlyStopping counter: 3 out of 10000


Epoch 6: CE 0.702911:  21%|████████████████████████████████████                                                                                                                                        | 2001/9541 [21:38<1:23:57,  1.50it/s]

EarlyStopping counter: 4 out of 10000


Epoch 6: CE 0.702542:  26%|█████████████████████████████████████████████                                                                                                                               | 2501/9541 [27:03<1:15:12,  1.56it/s]

EarlyStopping counter: 5 out of 10000


Epoch 6: CE 0.702604:  31%|██████████████████████████████████████████████████████                                                                                                                      | 3001/9541 [32:24<1:09:41,  1.56it/s]

EarlyStopping counter: 6 out of 10000


Epoch 6: CE 0.703245:  37%|███████████████████████████████████████████████████████████████                                                                                                             | 3501/9541 [37:49<1:06:34,  1.51it/s]

EarlyStopping counter: 7 out of 10000


Epoch 6: CE 0.703467:  42%|████████████████████████████████████████████████████████████████████████▏                                                                                                   | 4001/9541 [43:15<1:02:31,  1.48it/s]

EarlyStopping counter: 8 out of 10000


Epoch 6: CE 0.703200:  47%|██████████████████████████████████████████████████████████████████████████████████                                                                                            | 4501/9541 [48:39<52:21,  1.60it/s]

EarlyStopping counter: 9 out of 10000


Epoch 6: CE 0.703483:  52%|███████████████████████████████████████████████████████████████████████████████████████████▏                                                                                  | 5001/9541 [54:06<49:21,  1.53it/s]

EarlyStopping counter: 10 out of 10000


Epoch 6: CE 0.703316:  58%|████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                         | 5501/9541 [59:29<42:42,  1.58it/s]

EarlyStopping counter: 11 out of 10000


Epoch 6: CE 0.703245:  63%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                               | 6001/9541 [1:04:53<38:04,  1.55it/s]

EarlyStopping counter: 12 out of 10000


Epoch 6: CE 0.702799:  68%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                      | 6501/9541 [1:10:19<34:11,  1.48it/s]

EarlyStopping counter: 13 out of 10000


Epoch 6: CE 0.702439:  73%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                             | 7001/9541 [1:15:45<27:10,  1.56it/s]

EarlyStopping counter: 14 out of 10000


Epoch 6: CE 0.702510:  79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                    | 7501/9541 [1:21:12<23:36,  1.44it/s]

EarlyStopping counter: 15 out of 10000


Epoch 6: CE 0.702386:  84%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                           | 8001/9541 [1:26:40<16:10,  1.59it/s]

EarlyStopping counter: 16 out of 10000


Epoch 6: CE 0.702211:  89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:08<11:00,  1.58it/s]

EarlyStopping counter: 17 out of 10000


Epoch 6: CE 0.701885:  94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:37:33<06:07,  1.47it/s]

EarlyStopping counter: 18 out of 10000


Epoch 6: CE 0.701837: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:42:59<00:27,  1.48it/s]

EarlyStopping counter: 19 out of 10000


Epoch 6: CE 0.701764: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:24<00:00,  1.54it/s]
Epoch 7: CE 0.688189:   0%|                                                                                                                                                                               | 1/9541 [00:00<2:17:43,  1.15it/s]

EarlyStopping counter: 20 out of 10000


Epoch 7: CE 0.686330:   5%|█████████                                                                                                                                                                    | 501/9541 [05:25<1:34:54,  1.59it/s]

EarlyStopping counter: 21 out of 10000


Epoch 7: CE 0.688645:  10%|██████████████████                                                                                                                                                          | 1001/9541 [10:50<1:38:29,  1.45it/s]

EarlyStopping counter: 22 out of 10000


Epoch 7: CE 0.689395:  16%|███████████████████████████                                                                                                                                                 | 1501/9541 [16:17<1:31:32,  1.46it/s]

EarlyStopping counter: 23 out of 10000


Epoch 7: CE 0.687761:  21%|████████████████████████████████████                                                                                                                                        | 2001/9541 [21:42<1:16:28,  1.64it/s]

EarlyStopping counter: 24 out of 10000


Epoch 7: CE 0.689451:  26%|█████████████████████████████████████████████                                                                                                                               | 2501/9541 [27:08<1:17:22,  1.52it/s]

EarlyStopping counter: 25 out of 10000


Epoch 7: CE 0.688590:  31%|██████████████████████████████████████████████████████                                                                                                                      | 3001/9541 [32:36<1:16:14,  1.43it/s]

EarlyStopping counter: 26 out of 10000


Epoch 7: CE 0.688457:  37%|███████████████████████████████████████████████████████████████                                                                                                             | 3501/9541 [38:03<1:04:48,  1.55it/s]

EarlyStopping counter: 27 out of 10000


Epoch 7: CE 0.688364:  42%|████████████████████████████████████████████████████████████████████████▉                                                                                                     | 4001/9541 [43:29<59:49,  1.54it/s]

EarlyStopping counter: 28 out of 10000


Epoch 7: CE 0.689171:  47%|██████████████████████████████████████████████████████████████████████████████████                                                                                            | 4501/9541 [48:56<56:11,  1.49it/s]

EarlyStopping counter: 29 out of 10000


Epoch 7: CE 0.689826:  52%|███████████████████████████████████████████████████████████████████████████████████████████▏                                                                                  | 5001/9541 [54:21<48:09,  1.57it/s]

EarlyStopping counter: 30 out of 10000


Epoch 7: CE 0.689121:  58%|████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                         | 5501/9541 [59:48<42:11,  1.60it/s]

EarlyStopping counter: 31 out of 10000


Epoch 7: CE 0.689142:  63%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                               | 6001/9541 [1:05:15<37:38,  1.57it/s]

EarlyStopping counter: 32 out of 10000


Epoch 7: CE 0.689700:  68%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                      | 6501/9541 [1:10:39<33:37,  1.51it/s]

EarlyStopping counter: 33 out of 10000


Epoch 7: CE 0.689454:  73%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                             | 7001/9541 [1:16:05<26:40,  1.59it/s]

EarlyStopping counter: 34 out of 10000


Epoch 7: CE 0.689178:  79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                    | 7501/9541 [1:21:31<23:01,  1.48it/s]

EarlyStopping counter: 35 out of 10000


Epoch 7: CE 0.689442:  84%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                           | 8001/9541 [1:26:58<16:45,  1.53it/s]

EarlyStopping counter: 36 out of 10000


Epoch 7: CE 0.689381:  89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:23<10:08,  1.71it/s]

EarlyStopping counter: 37 out of 10000


Epoch 7: CE 0.689318:  94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:37:48<06:05,  1.48it/s]

EarlyStopping counter: 38 out of 10000


Epoch 7: CE 0.689628: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:13<00:25,  1.58it/s]

EarlyStopping counter: 39 out of 10000


Epoch 7: CE 0.689563: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:39<00:00,  1.53it/s]
Epoch 8: CE 0.670203:   0%|                                                                                                                                                                               | 1/9541 [00:00<1:58:42,  1.34it/s]

EarlyStopping counter: 40 out of 10000


Epoch 8: CE 0.677699:   5%|█████████                                                                                                                                                                    | 501/9541 [05:26<1:35:37,  1.58it/s]

EarlyStopping counter: 41 out of 10000


Epoch 8: CE 0.677542:  10%|██████████████████                                                                                                                                                          | 1001/9541 [10:52<1:34:03,  1.51it/s]

EarlyStopping counter: 42 out of 10000


Epoch 8: CE 0.678974:  16%|███████████████████████████                                                                                                                                                 | 1501/9541 [16:18<1:26:45,  1.54it/s]

EarlyStopping counter: 43 out of 10000


Epoch 8: CE 0.679883:  21%|████████████████████████████████████                                                                                                                                        | 2001/9541 [21:44<1:23:20,  1.51it/s]

EarlyStopping counter: 44 out of 10000


Epoch 8: CE 0.679938:  26%|█████████████████████████████████████████████                                                                                                                               | 2501/9541 [27:10<1:16:15,  1.54it/s]

EarlyStopping counter: 45 out of 10000


Epoch 8: CE 0.678752:  31%|██████████████████████████████████████████████████████                                                                                                                      | 3001/9541 [32:37<1:12:04,  1.51it/s]

EarlyStopping counter: 46 out of 10000


Epoch 8: CE 0.678103:  37%|███████████████████████████████████████████████████████████████                                                                                                             | 3501/9541 [38:04<1:07:49,  1.48it/s]

EarlyStopping counter: 47 out of 10000


Epoch 8: CE 0.677267:  42%|████████████████████████████████████████████████████████████████████████▏                                                                                                   | 4001/9541 [43:30<1:01:07,  1.51it/s]

EarlyStopping counter: 48 out of 10000


Epoch 8: CE 0.677928:  47%|██████████████████████████████████████████████████████████████████████████████████                                                                                            | 4501/9541 [48:54<55:30,  1.51it/s]

EarlyStopping counter: 49 out of 10000


Epoch 8: CE 0.677961:  52%|███████████████████████████████████████████████████████████████████████████████████████████▏                                                                                  | 5001/9541 [54:19<50:08,  1.51it/s]

EarlyStopping counter: 50 out of 10000


Epoch 8: CE 0.678146:  58%|████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                         | 5501/9541 [59:42<44:03,  1.53it/s]

EarlyStopping counter: 51 out of 10000


Epoch 8: CE 0.678317:  63%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                               | 6001/9541 [1:05:07<40:20,  1.46it/s]

EarlyStopping counter: 52 out of 10000


Epoch 8: CE 0.678892:  68%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                      | 6501/9541 [1:10:45<32:45,  1.55it/s]

EarlyStopping counter: 53 out of 10000


Epoch 8: CE 0.679333:  73%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                             | 7001/9541 [1:16:11<28:16,  1.50it/s]

EarlyStopping counter: 54 out of 10000


Epoch 8: CE 0.679588:  79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                    | 7501/9541 [1:21:39<22:16,  1.53it/s]

EarlyStopping counter: 55 out of 10000


Epoch 8: CE 0.679816:  84%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                           | 8001/9541 [1:27:04<17:37,  1.46it/s]

EarlyStopping counter: 56 out of 10000


Epoch 8: CE 0.679509:  89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:31<11:20,  1.53it/s]

EarlyStopping counter: 57 out of 10000


Epoch 8: CE 0.679591:  94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:37:56<05:37,  1.60it/s]

EarlyStopping counter: 58 out of 10000


Epoch 8: CE 0.679599: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:25<00:26,  1.51it/s]

EarlyStopping counter: 59 out of 10000


Epoch 8: CE 0.679592: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:51<00:00,  1.53it/s]
Epoch 9: CE 0.670240:   5%|█████████                                                                                                                                                                    | 501/9541 [05:27<1:39:21,  1.52it/s]

EarlyStopping counter: 1 out of 10000


Epoch 9: CE 0.669759:  10%|██████████████████                                                                                                                                                          | 1001/9541 [10:53<1:30:45,  1.57it/s]

EarlyStopping counter: 2 out of 10000


Epoch 9: CE 0.666675:  16%|███████████████████████████                                                                                                                                                 | 1501/9541 [16:20<1:29:55,  1.49it/s]

EarlyStopping counter: 3 out of 10000


Epoch 9: CE 0.666796:  21%|████████████████████████████████████                                                                                                                                        | 2001/9541 [21:47<1:19:59,  1.57it/s]

EarlyStopping counter: 4 out of 10000


Epoch 9: CE 0.668251:  26%|█████████████████████████████████████████████                                                                                                                               | 2501/9541 [27:14<1:18:26,  1.50it/s]

EarlyStopping counter: 5 out of 10000


Epoch 9: CE 0.668696:  31%|██████████████████████████████████████████████████████                                                                                                                      | 3001/9541 [32:40<1:12:08,  1.51it/s]

EarlyStopping counter: 6 out of 10000


Epoch 9: CE 0.668537:  37%|███████████████████████████████████████████████████████████████                                                                                                             | 3501/9541 [38:07<1:04:58,  1.55it/s]

EarlyStopping counter: 7 out of 10000


Epoch 9: CE 0.668395:  42%|████████████████████████████████████████████████████████████████████████▉                                                                                                     | 4001/9541 [43:33<58:32,  1.58it/s]

EarlyStopping counter: 8 out of 10000


Epoch 9: CE 0.668563:  47%|██████████████████████████████████████████████████████████████████████████████████                                                                                            | 4501/9541 [49:00<54:44,  1.53it/s]

EarlyStopping counter: 9 out of 10000


Epoch 9: CE 0.668284:  52%|███████████████████████████████████████████████████████████████████████████████████████████▏                                                                                  | 5001/9541 [54:25<48:36,  1.56it/s]

EarlyStopping counter: 10 out of 10000


Epoch 9: CE 0.668720:  58%|████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                         | 5501/9541 [59:51<42:56,  1.57it/s]

EarlyStopping counter: 11 out of 10000


Epoch 9: CE 0.668638:  63%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                               | 6001/9541 [1:05:16<38:12,  1.54it/s]

EarlyStopping counter: 12 out of 10000


Epoch 9: CE 0.668985:  68%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                      | 6501/9541 [1:10:43<32:20,  1.57it/s]

EarlyStopping counter: 13 out of 10000


Epoch 9: CE 0.669124:  73%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                             | 7001/9541 [1:16:09<27:41,  1.53it/s]

EarlyStopping counter: 14 out of 10000


Epoch 9: CE 0.668710:  79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                    | 7501/9541 [1:21:36<23:43,  1.43it/s]

EarlyStopping counter: 15 out of 10000


Epoch 9: CE 0.668876:  84%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                           | 8001/9541 [1:27:01<17:06,  1.50it/s]

EarlyStopping counter: 16 out of 10000


Epoch 9: CE 0.668983:  89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:29<11:30,  1.51it/s]

EarlyStopping counter: 17 out of 10000


Epoch 9: CE 0.669233:  94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:37:53<06:07,  1.47it/s]

EarlyStopping counter: 18 out of 10000


Epoch 9: CE 0.669558: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:18<00:26,  1.51it/s]

EarlyStopping counter: 19 out of 10000


Epoch 9: CE 0.669590: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:44<00:00,  1.53it/s]
Epoch 10: CE 0.700050:   0%|                                                                                                                                                                              | 1/9541 [00:00<2:03:05,  1.29it/s]

EarlyStopping counter: 20 out of 10000


Epoch 10: CE 0.661800:   5%|█████████                                                                                                                                                                   | 501/9541 [05:26<1:38:46,  1.53it/s]

EarlyStopping counter: 21 out of 10000


Epoch 10: CE 0.661158:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [10:50<1:30:57,  1.56it/s]

EarlyStopping counter: 22 out of 10000


Epoch 10: CE 0.660830:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:15<1:28:17,  1.52it/s]

EarlyStopping counter: 23 out of 10000


Epoch 10: CE 0.662066:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:43<1:23:51,  1.50it/s]

EarlyStopping counter: 24 out of 10000


Epoch 10: CE 0.661486:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:08<1:15:06,  1.56it/s]

EarlyStopping counter: 25 out of 10000


Epoch 10: CE 0.661098:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:34<1:08:42,  1.59it/s]

EarlyStopping counter: 26 out of 10000


Epoch 10: CE 0.661067:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [38:00<1:04:04,  1.57it/s]

EarlyStopping counter: 27 out of 10000


Epoch 10: CE 0.661082:  42%|███████████████████████████████████████████████████████████████████████▋                                                                                                   | 4001/9541 [43:28<1:04:25,  1.43it/s]

EarlyStopping counter: 28 out of 10000


Epoch 10: CE 0.661606:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [48:55<55:38,  1.51it/s]

EarlyStopping counter: 29 out of 10000


Epoch 10: CE 0.660875:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:21<48:15,  1.57it/s]

EarlyStopping counter: 30 out of 10000


Epoch 10: CE 0.660561:  58%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                         | 5501/9541 [59:46<45:02,  1.49it/s]

EarlyStopping counter: 31 out of 10000


Epoch 10: CE 0.660809:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:13<38:10,  1.55it/s]

EarlyStopping counter: 32 out of 10000


Epoch 10: CE 0.660647:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:10:38<33:59,  1.49it/s]

EarlyStopping counter: 33 out of 10000


Epoch 10: CE 0.661591:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:07<27:51,  1.52it/s]

EarlyStopping counter: 34 out of 10000


Epoch 10: CE 0.662164:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:21:32<21:08,  1.61it/s]

EarlyStopping counter: 35 out of 10000


Epoch 10: CE 0.662529:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:26:58<17:22,  1.48it/s]

EarlyStopping counter: 36 out of 10000


Epoch 10: CE 0.662415:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:25<11:06,  1.56it/s]

EarlyStopping counter: 37 out of 10000


Epoch 10: CE 0.661989:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:37:50<05:46,  1.56it/s]

EarlyStopping counter: 38 out of 10000


Epoch 10: CE 0.662156: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:15<00:27,  1.45it/s]

EarlyStopping counter: 39 out of 10000


Epoch 10: CE 0.662123: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:41<00:00,  1.53it/s]
Epoch 11: CE 0.713343:   0%|                                                                                                                                                                              | 1/9541 [00:00<2:10:18,  1.22it/s]

EarlyStopping counter: 40 out of 10000


Epoch 11: CE 0.648976:   5%|█████████                                                                                                                                                                   | 501/9541 [05:26<1:39:16,  1.52it/s]

EarlyStopping counter: 41 out of 10000


Epoch 11: CE 0.652084:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [10:52<1:33:50,  1.52it/s]

EarlyStopping counter: 42 out of 10000


Epoch 11: CE 0.652246:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:20<1:26:59,  1.54it/s]

EarlyStopping counter: 43 out of 10000


Epoch 11: CE 0.653395:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:46<1:21:13,  1.55it/s]

EarlyStopping counter: 44 out of 10000


Epoch 11: CE 0.651988:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:11<1:15:34,  1.55it/s]

EarlyStopping counter: 45 out of 10000


Epoch 11: CE 0.652093:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:38<1:10:48,  1.54it/s]

EarlyStopping counter: 46 out of 10000


Epoch 11: CE 0.651904:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [38:03<1:02:15,  1.62it/s]

EarlyStopping counter: 47 out of 10000


Epoch 11: CE 0.653224:  42%|████████████████████████████████████████████████████████████████████████▌                                                                                                    | 4001/9541 [43:28<57:54,  1.59it/s]

EarlyStopping counter: 48 out of 10000


Epoch 11: CE 0.653095:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [48:56<55:11,  1.52it/s]

EarlyStopping counter: 49 out of 10000


Epoch 11: CE 0.653266:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:20<46:23,  1.63it/s]

EarlyStopping counter: 50 out of 10000


Epoch 11: CE 0.652960:  58%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                         | 5501/9541 [59:46<43:23,  1.55it/s]

EarlyStopping counter: 51 out of 10000


Epoch 11: CE 0.652941:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:12<40:14,  1.47it/s]

EarlyStopping counter: 52 out of 10000


Epoch 11: CE 0.652985:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:10:40<32:28,  1.56it/s]

EarlyStopping counter: 53 out of 10000


Epoch 11: CE 0.653039:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:05<27:32,  1.54it/s]

EarlyStopping counter: 54 out of 10000


Epoch 11: CE 0.653137:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:21:31<21:51,  1.56it/s]

EarlyStopping counter: 55 out of 10000


Epoch 11: CE 0.653385:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:26:56<16:34,  1.55it/s]

EarlyStopping counter: 56 out of 10000


Epoch 11: CE 0.653605:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:22<11:35,  1.50it/s]

EarlyStopping counter: 57 out of 10000


Epoch 11: CE 0.653469:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:37:49<05:40,  1.59it/s]

EarlyStopping counter: 58 out of 10000


Epoch 11: CE 0.653421: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:15<00:27,  1.44it/s]

EarlyStopping counter: 59 out of 10000


Epoch 11: CE 0.653491: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:42<00:00,  1.53it/s]
Epoch 12: CE 0.803409:   0%|                                                                                                                                                                              | 1/9541 [00:00<2:00:53,  1.32it/s]

EarlyStopping counter: 60 out of 10000


Epoch 12: CE 0.647618:   5%|█████████                                                                                                                                                                   | 501/9541 [05:25<1:40:12,  1.50it/s]

EarlyStopping counter: 61 out of 10000


Epoch 12: CE 0.644934:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [10:51<1:28:25,  1.61it/s]

EarlyStopping counter: 62 out of 10000


Epoch 12: CE 0.644047:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:17<1:26:06,  1.56it/s]

EarlyStopping counter: 63 out of 10000


Epoch 12: CE 0.644646:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:43<1:21:41,  1.54it/s]

EarlyStopping counter: 64 out of 10000


Epoch 12: CE 0.644153:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:08<1:16:54,  1.53it/s]

EarlyStopping counter: 65 out of 10000


Epoch 12: CE 0.644674:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:35<1:11:22,  1.53it/s]

EarlyStopping counter: 66 out of 10000


Epoch 12: CE 0.644989:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [38:02<1:06:40,  1.51it/s]

EarlyStopping counter: 67 out of 10000


Epoch 12: CE 0.644766:  42%|████████████████████████████████████████████████████████████████████████▌                                                                                                    | 4001/9541 [43:28<59:49,  1.54it/s]

EarlyStopping counter: 68 out of 10000


Epoch 12: CE 0.644655:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [48:55<55:32,  1.51it/s]

EarlyStopping counter: 69 out of 10000


Epoch 12: CE 0.644337:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:22<46:35,  1.62it/s]

EarlyStopping counter: 70 out of 10000


Epoch 12: CE 0.644770:  58%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                         | 5501/9541 [59:49<44:33,  1.51it/s]

EarlyStopping counter: 71 out of 10000


Epoch 12: CE 0.644677:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:16<38:48,  1.52it/s]

EarlyStopping counter: 72 out of 10000


Epoch 12: CE 0.645113:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:10:42<32:50,  1.54it/s]

EarlyStopping counter: 73 out of 10000


Epoch 12: CE 0.645044:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:08<28:38,  1.48it/s]

EarlyStopping counter: 74 out of 10000


Epoch 12: CE 0.645466:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:21:48<22:06,  1.54it/s]

EarlyStopping counter: 75 out of 10000


Epoch 12: CE 0.645288:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:27:13<16:19,  1.57it/s]

EarlyStopping counter: 76 out of 10000


Epoch 12: CE 0.645262:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:40<10:56,  1.58it/s]

EarlyStopping counter: 77 out of 10000


Epoch 12: CE 0.645553:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:38:05<05:50,  1.54it/s]

EarlyStopping counter: 78 out of 10000


Epoch 12: CE 0.645614: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:30<00:25,  1.54it/s]

EarlyStopping counter: 79 out of 10000


Epoch 12: CE 0.645701: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:57<00:00,  1.53it/s]
Epoch 13: CE 0.713295:   0%|                                                                                                                                                                              | 1/9541 [00:00<1:57:09,  1.36it/s]

EarlyStopping counter: 80 out of 10000


Epoch 13: CE 0.635263:   5%|█████████                                                                                                                                                                   | 501/9541 [05:26<1:35:02,  1.59it/s]

EarlyStopping counter: 81 out of 10000


Epoch 13: CE 0.634821:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [10:50<1:36:27,  1.48it/s]

EarlyStopping counter: 82 out of 10000


Epoch 13: CE 0.634284:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:17<1:31:27,  1.47it/s]

EarlyStopping counter: 83 out of 10000


Epoch 13: CE 0.635561:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:41<1:20:35,  1.56it/s]

EarlyStopping counter: 84 out of 10000


Epoch 13: CE 0.635528:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:07<1:16:32,  1.53it/s]

EarlyStopping counter: 85 out of 10000


Epoch 13: CE 0.635768:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:32<1:11:54,  1.52it/s]

EarlyStopping counter: 86 out of 10000


Epoch 13: CE 0.635475:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [38:00<1:10:31,  1.43it/s]

EarlyStopping counter: 87 out of 10000


Epoch 13: CE 0.635537:  42%|███████████████████████████████████████████████████████████████████████▋                                                                                                   | 4001/9541 [43:26<1:04:26,  1.43it/s]

EarlyStopping counter: 88 out of 10000


Epoch 13: CE 0.635833:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [48:53<55:37,  1.51it/s]

EarlyStopping counter: 89 out of 10000


Epoch 13: CE 0.635804:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:19<51:12,  1.48it/s]

EarlyStopping counter: 90 out of 10000


Epoch 13: CE 0.635707:  58%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                         | 5501/9541 [59:48<42:46,  1.57it/s]

EarlyStopping counter: 91 out of 10000


Epoch 13: CE 0.636136:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:16<37:35,  1.57it/s]

EarlyStopping counter: 92 out of 10000


Epoch 13: CE 0.636045:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:10:43<34:33,  1.47it/s]

EarlyStopping counter: 93 out of 10000


Epoch 13: CE 0.635923:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:11<26:24,  1.60it/s]

EarlyStopping counter: 94 out of 10000


Epoch 13: CE 0.635650:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:21:39<21:49,  1.56it/s]

EarlyStopping counter: 95 out of 10000


Epoch 13: CE 0.635970:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:27:07<16:08,  1.59it/s]

EarlyStopping counter: 96 out of 10000


Epoch 13: CE 0.635887:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:34<11:25,  1.52it/s]

EarlyStopping counter: 97 out of 10000


Epoch 13: CE 0.635968:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:38:03<06:02,  1.49it/s]

EarlyStopping counter: 98 out of 10000


Epoch 13: CE 0.636196: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:29<00:25,  1.57it/s]

EarlyStopping counter: 99 out of 10000


Epoch 13: CE 0.636186: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:55<00:00,  1.53it/s]
Epoch 14: CE 0.632498:   0%|                                                                                                                                                                              | 1/9541 [00:00<2:04:18,  1.28it/s]

EarlyStopping counter: 100 out of 10000


Epoch 14: CE 0.630432:   5%|█████████                                                                                                                                                                   | 501/9541 [05:27<1:34:24,  1.60it/s]

EarlyStopping counter: 101 out of 10000


Epoch 14: CE 0.631551:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [10:53<1:34:12,  1.51it/s]

EarlyStopping counter: 102 out of 10000


Epoch 14: CE 0.630515:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:19<1:25:46,  1.56it/s]

EarlyStopping counter: 103 out of 10000


Epoch 14: CE 0.631551:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:46<1:19:36,  1.58it/s]

EarlyStopping counter: 104 out of 10000


Epoch 14: CE 0.630838:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:14<1:15:25,  1.56it/s]

EarlyStopping counter: 105 out of 10000


Epoch 14: CE 0.630001:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:40<1:10:33,  1.54it/s]

EarlyStopping counter: 106 out of 10000


Epoch 14: CE 0.630316:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [38:06<1:01:57,  1.62it/s]

EarlyStopping counter: 107 out of 10000


Epoch 14: CE 0.629913:  42%|████████████████████████████████████████████████████████████████████████▌                                                                                                    | 4001/9541 [43:33<59:06,  1.56it/s]

EarlyStopping counter: 108 out of 10000


Epoch 14: CE 0.629236:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [48:59<52:35,  1.60it/s]

EarlyStopping counter: 109 out of 10000


Epoch 14: CE 0.629481:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:27<49:02,  1.54it/s]

EarlyStopping counter: 110 out of 10000


Epoch 14: CE 0.629216:  58%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                         | 5501/9541 [59:52<46:37,  1.44it/s]

EarlyStopping counter: 111 out of 10000


Epoch 14: CE 0.629241:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:19<40:34,  1.45it/s]

EarlyStopping counter: 112 out of 10000


Epoch 14: CE 0.629264:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:10:47<34:11,  1.48it/s]

EarlyStopping counter: 113 out of 10000


Epoch 14: CE 0.629352:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:14<28:10,  1.50it/s]

EarlyStopping counter: 114 out of 10000


Epoch 14: CE 0.629159:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:21:39<22:36,  1.50it/s]

EarlyStopping counter: 115 out of 10000


Epoch 14: CE 0.628468:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:27:06<17:09,  1.50it/s]

EarlyStopping counter: 116 out of 10000


Epoch 14: CE 0.628155:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:32<11:47,  1.47it/s]

EarlyStopping counter: 117 out of 10000


Epoch 14: CE 0.628217:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:38:00<05:45,  1.56it/s]

EarlyStopping counter: 118 out of 10000


Epoch 14: CE 0.628263: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:26<00:26,  1.51it/s]

EarlyStopping counter: 119 out of 10000


Epoch 14: CE 0.628247: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:52<00:00,  1.53it/s]
Epoch 15: CE 0.703920:   0%|                                                                                                                                                                              | 1/9541 [00:00<2:07:42,  1.25it/s]

EarlyStopping counter: 120 out of 10000


Epoch 15: CE 0.620726:   5%|█████████                                                                                                                                                                   | 501/9541 [05:28<1:41:37,  1.48it/s]

EarlyStopping counter: 121 out of 10000


Epoch 15: CE 0.620469:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [10:55<1:35:59,  1.48it/s]

EarlyStopping counter: 122 out of 10000


Epoch 15: CE 0.618309:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:21<1:25:18,  1.57it/s]

EarlyStopping counter: 123 out of 10000


Epoch 15: CE 0.619315:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:50<1:24:59,  1.48it/s]

EarlyStopping counter: 124 out of 10000


Epoch 15: CE 0.619625:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:18<1:15:25,  1.56it/s]

EarlyStopping counter: 125 out of 10000


Epoch 15: CE 0.620068:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:43<1:09:31,  1.57it/s]

EarlyStopping counter: 126 out of 10000


Epoch 15: CE 0.619451:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [38:10<1:08:32,  1.47it/s]

EarlyStopping counter: 127 out of 10000


Epoch 15: CE 0.618920:  42%|████████████████████████████████████████████████████████████████████████▌                                                                                                    | 4001/9541 [43:37<57:54,  1.59it/s]

EarlyStopping counter: 128 out of 10000


Epoch 15: CE 0.618783:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [49:04<56:30,  1.49it/s]

EarlyStopping counter: 129 out of 10000


Epoch 15: CE 0.618533:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:30<50:15,  1.51it/s]

EarlyStopping counter: 130 out of 10000


Epoch 15: CE 0.618868:  58%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                         | 5501/9541 [59:56<42:02,  1.60it/s]

EarlyStopping counter: 131 out of 10000


Epoch 15: CE 0.618875:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:26<35:44,  1.65it/s]

EarlyStopping counter: 132 out of 10000


Epoch 15: CE 0.618470:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:10:52<32:48,  1.54it/s]

EarlyStopping counter: 133 out of 10000


Epoch 15: CE 0.618289:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:19<27:38,  1.53it/s]

EarlyStopping counter: 134 out of 10000


Epoch 15: CE 0.618525:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:21:47<21:58,  1.55it/s]

EarlyStopping counter: 135 out of 10000


Epoch 15: CE 0.618216:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:27:11<16:36,  1.55it/s]

EarlyStopping counter: 136 out of 10000


Epoch 15: CE 0.618050:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:36<11:26,  1.52it/s]

EarlyStopping counter: 137 out of 10000


Epoch 15: CE 0.618477:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:38:01<06:01,  1.50it/s]

EarlyStopping counter: 138 out of 10000


Epoch 15: CE 0.618545: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:26<00:24,  1.61it/s]

EarlyStopping counter: 139 out of 10000


Epoch 15: CE 0.618613: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:52<00:00,  1.53it/s]
Epoch 16: CE 0.619131:   0%|                                                                                                                                                                              | 1/9541 [00:00<2:00:36,  1.32it/s]

EarlyStopping counter: 140 out of 10000


Epoch 16: CE 0.610437:   5%|█████████                                                                                                                                                                   | 501/9541 [05:28<1:38:31,  1.53it/s]

EarlyStopping counter: 141 out of 10000


Epoch 16: CE 0.610105:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [10:56<1:32:59,  1.53it/s]

EarlyStopping counter: 142 out of 10000


Epoch 16: CE 0.612256:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:20<1:27:29,  1.53it/s]

EarlyStopping counter: 143 out of 10000


Epoch 16: CE 0.611552:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:45<1:21:49,  1.54it/s]

EarlyStopping counter: 144 out of 10000


Epoch 16: CE 0.612785:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:10<1:13:07,  1.60it/s]

EarlyStopping counter: 145 out of 10000


Epoch 16: CE 0.613168:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:37<1:12:46,  1.50it/s]

EarlyStopping counter: 146 out of 10000


Epoch 16: CE 0.611752:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [38:07<1:09:35,  1.45it/s]

EarlyStopping counter: 147 out of 10000


Epoch 16: CE 0.611293:  42%|████████████████████████████████████████████████████████████████████████▌                                                                                                    | 4001/9541 [43:35<59:56,  1.54it/s]

EarlyStopping counter: 148 out of 10000


Epoch 16: CE 0.612093:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [49:02<58:11,  1.44it/s]

EarlyStopping counter: 149 out of 10000


Epoch 16: CE 0.611614:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:28<52:07,  1.45it/s]

EarlyStopping counter: 150 out of 10000


Epoch 16: CE 0.611603:  58%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                         | 5501/9541 [59:53<44:25,  1.52it/s]

EarlyStopping counter: 151 out of 10000


Epoch 16: CE 0.612045:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:19<40:30,  1.46it/s]

EarlyStopping counter: 152 out of 10000


Epoch 16: CE 0.612403:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:10:47<34:23,  1.47it/s]

EarlyStopping counter: 153 out of 10000


Epoch 16: CE 0.612085:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:14<28:56,  1.46it/s]

EarlyStopping counter: 154 out of 10000


Epoch 16: CE 0.611857:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:21:41<22:36,  1.50it/s]

EarlyStopping counter: 155 out of 10000


Epoch 16: CE 0.611945:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:27:07<16:59,  1.51it/s]

EarlyStopping counter: 156 out of 10000


Epoch 16: CE 0.611699:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:46<11:18,  1.53it/s]

EarlyStopping counter: 157 out of 10000


Epoch 16: CE 0.611719:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:38:13<05:44,  1.57it/s]

EarlyStopping counter: 158 out of 10000


Epoch 16: CE 0.611845: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:38<00:25,  1.54it/s]

EarlyStopping counter: 159 out of 10000


Epoch 16: CE 0.611845: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:44:04<00:00,  1.53it/s]
Epoch 17: CE 0.592800:   0%|                                                                                                                                                                              | 1/9541 [00:00<2:06:15,  1.26it/s]

EarlyStopping counter: 160 out of 10000


Epoch 17: CE 0.611169:   5%|█████████                                                                                                                                                                   | 501/9541 [05:26<1:39:46,  1.51it/s]

EarlyStopping counter: 161 out of 10000


Epoch 17: CE 0.609543:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [10:53<1:38:12,  1.45it/s]

EarlyStopping counter: 162 out of 10000


Epoch 17: CE 0.606981:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:19<1:24:33,  1.58it/s]

EarlyStopping counter: 163 out of 10000


Epoch 17: CE 0.607786:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:45<1:21:23,  1.54it/s]

EarlyStopping counter: 164 out of 10000


Epoch 17: CE 0.606288:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:13<1:17:05,  1.52it/s]

EarlyStopping counter: 165 out of 10000


Epoch 17: CE 0.607011:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:40<1:14:16,  1.47it/s]

EarlyStopping counter: 166 out of 10000


Epoch 17: CE 0.607232:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [38:06<1:03:49,  1.58it/s]

EarlyStopping counter: 167 out of 10000


Epoch 17: CE 0.606654:  42%|███████████████████████████████████████████████████████████████████████▋                                                                                                   | 4001/9541 [43:34<1:01:51,  1.49it/s]

EarlyStopping counter: 168 out of 10000


Epoch 17: CE 0.606104:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [49:00<57:11,  1.47it/s]

EarlyStopping counter: 169 out of 10000


Epoch 17: CE 0.606078:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:26<47:43,  1.59it/s]

EarlyStopping counter: 170 out of 10000


Epoch 17: CE 0.606125:  58%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                         | 5501/9541 [59:53<44:31,  1.51it/s]

EarlyStopping counter: 171 out of 10000


Epoch 17: CE 0.606467:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:19<37:21,  1.58it/s]

EarlyStopping counter: 172 out of 10000


Epoch 17: CE 0.606159:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:10:46<32:15,  1.57it/s]

EarlyStopping counter: 173 out of 10000


Epoch 17: CE 0.606227:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:12<27:51,  1.52it/s]

EarlyStopping counter: 174 out of 10000


Epoch 17: CE 0.605609:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:21:38<22:49,  1.49it/s]

EarlyStopping counter: 175 out of 10000


Epoch 17: CE 0.605538:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:27:03<16:48,  1.53it/s]

EarlyStopping counter: 176 out of 10000


Epoch 17: CE 0.605355:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:27<11:09,  1.55it/s]

EarlyStopping counter: 177 out of 10000


Epoch 17: CE 0.605303:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:37:56<05:54,  1.52it/s]

EarlyStopping counter: 178 out of 10000


Epoch 17: CE 0.605284: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:24<00:26,  1.49it/s]

EarlyStopping counter: 179 out of 10000


Epoch 17: CE 0.605177: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:50<00:00,  1.53it/s]
Epoch 18: CE 0.598001:   5%|█████████                                                                                                                                                                   | 501/9541 [05:29<1:43:40,  1.45it/s]

EarlyStopping counter: 1 out of 10000


Epoch 18: CE 0.597139:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [10:56<1:35:36,  1.49it/s]

EarlyStopping counter: 2 out of 10000


Epoch 18: CE 0.599028:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:23<1:28:45,  1.51it/s]

EarlyStopping counter: 3 out of 10000


Epoch 18: CE 0.599406:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:51<1:23:21,  1.51it/s]

EarlyStopping counter: 4 out of 10000


Epoch 18: CE 0.599090:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:15<1:14:34,  1.57it/s]

EarlyStopping counter: 5 out of 10000


Epoch 18: CE 0.599671:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:44<1:16:36,  1.42it/s]

EarlyStopping counter: 6 out of 10000


Epoch 18: CE 0.598730:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [38:10<1:08:41,  1.47it/s]

EarlyStopping counter: 7 out of 10000


Epoch 18: CE 0.599420:  42%|███████████████████████████████████████████████████████████████████████▋                                                                                                   | 4001/9541 [43:37<1:00:53,  1.52it/s]

EarlyStopping counter: 8 out of 10000


Epoch 18: CE 0.599583:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [49:03<54:34,  1.54it/s]

EarlyStopping counter: 9 out of 10000


Epoch 18: CE 0.599370:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:30<49:15,  1.54it/s]

EarlyStopping counter: 10 out of 10000


Epoch 18: CE 0.599144:  58%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                         | 5501/9541 [59:57<45:17,  1.49it/s]

EarlyStopping counter: 11 out of 10000


Epoch 18: CE 0.599320:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:20<37:09,  1.59it/s]

EarlyStopping counter: 12 out of 10000


Epoch 18: CE 0.599199:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:10:48<33:35,  1.51it/s]

EarlyStopping counter: 13 out of 10000


Epoch 18: CE 0.598923:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:17<27:18,  1.55it/s]

EarlyStopping counter: 14 out of 10000


Epoch 18: CE 0.598411:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:21:42<22:15,  1.53it/s]

EarlyStopping counter: 15 out of 10000


Epoch 18: CE 0.598650:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:27:11<16:41,  1.54it/s]

EarlyStopping counter: 16 out of 10000


Epoch 18: CE 0.598793:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:39<11:13,  1.54it/s]

EarlyStopping counter: 17 out of 10000


Epoch 18: CE 0.598903:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:38:07<06:14,  1.44it/s]

EarlyStopping counter: 18 out of 10000


Epoch 18: CE 0.598902: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:32<00:25,  1.59it/s]

EarlyStopping counter: 19 out of 10000


Epoch 18: CE 0.598946: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:58<00:00,  1.53it/s]
Epoch 19: CE 0.603760:   0%|                                                                                                                                                                              | 1/9541 [00:00<2:02:33,  1.30it/s]

EarlyStopping counter: 20 out of 10000


Epoch 19: CE 0.589050:   5%|█████████                                                                                                                                                                   | 501/9541 [05:27<1:35:05,  1.58it/s]

EarlyStopping counter: 21 out of 10000


Epoch 19: CE 0.590169:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [10:54<1:32:40,  1.54it/s]

EarlyStopping counter: 22 out of 10000


Epoch 19: CE 0.589999:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:21<1:27:32,  1.53it/s]

EarlyStopping counter: 23 out of 10000


Epoch 19: CE 0.590246:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:49<1:29:17,  1.41it/s]

EarlyStopping counter: 24 out of 10000


Epoch 19: CE 0.589853:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:18<1:19:16,  1.48it/s]

EarlyStopping counter: 25 out of 10000


Epoch 19: CE 0.590354:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:44<1:12:08,  1.51it/s]

EarlyStopping counter: 26 out of 10000


Epoch 19: CE 0.590811:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [38:10<1:08:19,  1.47it/s]

EarlyStopping counter: 27 out of 10000


Epoch 19: CE 0.590980:  42%|███████████████████████████████████████████████████████████████████████▋                                                                                                   | 4001/9541 [43:36<1:02:10,  1.49it/s]

EarlyStopping counter: 28 out of 10000


Epoch 19: CE 0.591518:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [49:03<53:36,  1.57it/s]

EarlyStopping counter: 29 out of 10000


Epoch 19: CE 0.592343:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:28<49:43,  1.52it/s]

EarlyStopping counter: 30 out of 10000


Epoch 19: CE 0.591943:  58%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                         | 5501/9541 [59:54<45:22,  1.48it/s]

EarlyStopping counter: 31 out of 10000


Epoch 19: CE 0.591512:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:21<37:42,  1.56it/s]

EarlyStopping counter: 32 out of 10000


Epoch 19: CE 0.591489:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:10:47<32:45,  1.55it/s]

EarlyStopping counter: 33 out of 10000


Epoch 19: CE 0.591592:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:15<27:15,  1.55it/s]

EarlyStopping counter: 34 out of 10000


Epoch 19: CE 0.591754:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:21:41<21:57,  1.55it/s]

EarlyStopping counter: 35 out of 10000


Epoch 19: CE 0.591923:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:27:09<17:53,  1.43it/s]

EarlyStopping counter: 36 out of 10000


Epoch 19: CE 0.591796:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:37<10:30,  1.65it/s]

EarlyStopping counter: 37 out of 10000


Epoch 19: CE 0.591679:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:38:04<05:29,  1.64it/s]

EarlyStopping counter: 38 out of 10000


Epoch 19: CE 0.591802: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:30<00:25,  1.59it/s]

EarlyStopping counter: 39 out of 10000


Epoch 19: CE 0.591852: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:56<00:00,  1.53it/s]
Epoch 20: CE 0.678058:   0%|                                                                                                                                                                              | 1/9541 [00:00<2:01:50,  1.31it/s]

EarlyStopping counter: 40 out of 10000


Epoch 20: CE 0.585521:   5%|█████████                                                                                                                                                                   | 501/9541 [05:26<1:38:57,  1.52it/s]

EarlyStopping counter: 41 out of 10000


Epoch 20: CE 0.585767:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [10:54<1:35:17,  1.49it/s]

EarlyStopping counter: 42 out of 10000


Epoch 20: CE 0.584476:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:21<1:30:19,  1.48it/s]

EarlyStopping counter: 43 out of 10000


Epoch 20: CE 0.585559:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:48<1:24:23,  1.49it/s]

EarlyStopping counter: 44 out of 10000


Epoch 20: CE 0.586787:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:13<1:15:20,  1.56it/s]

EarlyStopping counter: 45 out of 10000


Epoch 20: CE 0.585841:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:42<1:09:07,  1.58it/s]

EarlyStopping counter: 46 out of 10000


Epoch 20: CE 0.585578:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [38:07<1:07:08,  1.50it/s]

EarlyStopping counter: 47 out of 10000


Epoch 20: CE 0.585504:  42%|████████████████████████████████████████████████████████████████████████▌                                                                                                    | 4001/9541 [43:35<58:00,  1.59it/s]

EarlyStopping counter: 48 out of 10000


Epoch 20: CE 0.585423:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [49:02<56:06,  1.50it/s]

EarlyStopping counter: 49 out of 10000


Epoch 20: CE 0.585183:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:30<49:39,  1.52it/s]

EarlyStopping counter: 50 out of 10000


Epoch 20: CE 0.585685:  58%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                         | 5501/9541 [59:57<45:16,  1.49it/s]

EarlyStopping counter: 51 out of 10000


Epoch 20: CE 0.585548:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:25<38:47,  1.52it/s]

EarlyStopping counter: 52 out of 10000


Epoch 20: CE 0.585355:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:10:50<31:06,  1.63it/s]

EarlyStopping counter: 53 out of 10000


Epoch 20: CE 0.585104:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:17<28:39,  1.48it/s]

EarlyStopping counter: 54 out of 10000


Epoch 20: CE 0.585191:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:21:42<20:56,  1.62it/s]

EarlyStopping counter: 55 out of 10000


Epoch 20: CE 0.585417:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:27:08<16:56,  1.51it/s]

EarlyStopping counter: 56 out of 10000


Epoch 20: CE 0.585958:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:34<11:45,  1.47it/s]

EarlyStopping counter: 57 out of 10000


Epoch 20: CE 0.585985:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:37:59<05:39,  1.59it/s]

EarlyStopping counter: 58 out of 10000


Epoch 20: CE 0.586055: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:26<00:25,  1.54it/s]

EarlyStopping counter: 59 out of 10000


Epoch 20: CE 0.586088: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:52<00:00,  1.53it/s]
Epoch 21: CE 0.579942:   5%|█████████                                                                                                                                                                   | 501/9541 [05:39<1:37:25,  1.55it/s]

EarlyStopping counter: 1 out of 10000


Epoch 21: CE 0.581561:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [11:06<1:34:31,  1.51it/s]

EarlyStopping counter: 2 out of 10000


Epoch 21: CE 0.581390:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:31<1:26:22,  1.55it/s]

EarlyStopping counter: 3 out of 10000


Epoch 21: CE 0.580577:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:59<1:21:01,  1.55it/s]

EarlyStopping counter: 4 out of 10000


Epoch 21: CE 0.580691:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:24<1:13:41,  1.59it/s]

EarlyStopping counter: 5 out of 10000


Epoch 21: CE 0.581148:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:52<1:10:45,  1.54it/s]

EarlyStopping counter: 6 out of 10000


Epoch 21: CE 0.580018:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [38:20<1:04:40,  1.56it/s]

EarlyStopping counter: 7 out of 10000


Epoch 21: CE 0.579736:  42%|████████████████████████████████████████████████████████████████████████▌                                                                                                    | 4001/9541 [43:47<58:07,  1.59it/s]

EarlyStopping counter: 8 out of 10000


Epoch 21: CE 0.579791:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [49:13<53:15,  1.58it/s]

EarlyStopping counter: 9 out of 10000


Epoch 21: CE 0.579749:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:39<48:45,  1.55it/s]

EarlyStopping counter: 10 out of 10000


Epoch 21: CE 0.579616:  58%|██████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                        | 5501/9541 [1:00:06<42:44,  1.58it/s]

EarlyStopping counter: 11 out of 10000


Epoch 21: CE 0.579518:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:33<40:16,  1.46it/s]

EarlyStopping counter: 12 out of 10000


Epoch 21: CE 0.579888:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:10:58<30:54,  1.64it/s]

EarlyStopping counter: 13 out of 10000


Epoch 21: CE 0.579855:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:26<30:20,  1.39it/s]

EarlyStopping counter: 14 out of 10000


Epoch 21: CE 0.579539:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:21:51<21:59,  1.55it/s]

EarlyStopping counter: 15 out of 10000


Epoch 21: CE 0.579658:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:27:15<16:27,  1.56it/s]

EarlyStopping counter: 16 out of 10000


Epoch 21: CE 0.579602:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:39<10:46,  1.61it/s]

EarlyStopping counter: 17 out of 10000


Epoch 21: CE 0.579330:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:38:05<06:03,  1.49it/s]

EarlyStopping counter: 18 out of 10000


Epoch 21: CE 0.579708: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:29<00:27,  1.45it/s]

EarlyStopping counter: 19 out of 10000


Epoch 21: CE 0.579753: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:54<00:00,  1.53it/s]
Epoch 22: CE 0.639341:   0%|                                                                                                                                                                              | 1/9541 [00:00<2:10:43,  1.22it/s]

EarlyStopping counter: 20 out of 10000


Epoch 22: CE 0.573084:   5%|█████████                                                                                                                                                                   | 501/9541 [05:27<1:34:14,  1.60it/s]

EarlyStopping counter: 21 out of 10000


Epoch 22: CE 0.572508:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [10:54<1:38:16,  1.45it/s]

EarlyStopping counter: 22 out of 10000


Epoch 22: CE 0.573659:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:19<1:27:52,  1.52it/s]

EarlyStopping counter: 23 out of 10000


Epoch 22: CE 0.572393:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:46<1:21:54,  1.53it/s]

EarlyStopping counter: 24 out of 10000


Epoch 22: CE 0.573457:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:10<1:21:12,  1.44it/s]

EarlyStopping counter: 25 out of 10000


Epoch 22: CE 0.573617:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:34<1:14:42,  1.46it/s]

EarlyStopping counter: 26 out of 10000


Epoch 22: CE 0.573808:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [37:59<1:05:39,  1.53it/s]

EarlyStopping counter: 27 out of 10000


Epoch 22: CE 0.573299:  42%|████████████████████████████████████████████████████████████████████████▌                                                                                                    | 4001/9541 [43:26<59:37,  1.55it/s]

EarlyStopping counter: 28 out of 10000


Epoch 22: CE 0.572975:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [48:53<52:04,  1.61it/s]

EarlyStopping counter: 29 out of 10000


Epoch 22: CE 0.573256:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:19<49:16,  1.54it/s]

EarlyStopping counter: 30 out of 10000


Epoch 22: CE 0.573426:  58%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                         | 5501/9541 [59:45<45:04,  1.49it/s]

EarlyStopping counter: 31 out of 10000


Epoch 22: CE 0.573369:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:13<38:01,  1.55it/s]

EarlyStopping counter: 32 out of 10000


Epoch 22: CE 0.573677:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:10:39<33:12,  1.53it/s]

EarlyStopping counter: 33 out of 10000


Epoch 22: CE 0.573539:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:05<28:29,  1.49it/s]

EarlyStopping counter: 34 out of 10000


Epoch 22: CE 0.573195:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:21:31<22:00,  1.54it/s]

EarlyStopping counter: 35 out of 10000


Epoch 22: CE 0.573509:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:26:59<17:14,  1.49it/s]

EarlyStopping counter: 36 out of 10000


Epoch 22: CE 0.574037:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:26<10:39,  1.63it/s]

EarlyStopping counter: 37 out of 10000


Epoch 22: CE 0.574022:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:37:53<05:38,  1.60it/s]

EarlyStopping counter: 38 out of 10000


Epoch 22: CE 0.574132: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:21<00:25,  1.58it/s]

EarlyStopping counter: 39 out of 10000


Epoch 22: CE 0.574199: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:47<00:00,  1.53it/s]
Epoch 23: CE 0.584343:   0%|                                                                                                                                                                              | 1/9541 [00:00<2:00:36,  1.32it/s]

EarlyStopping counter: 40 out of 10000


Epoch 23: CE 0.564783:   5%|█████████                                                                                                                                                                   | 501/9541 [05:29<1:42:10,  1.47it/s]

EarlyStopping counter: 41 out of 10000


Epoch 23: CE 0.568028:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [10:55<1:30:35,  1.57it/s]

EarlyStopping counter: 42 out of 10000


Epoch 23: CE 0.568978:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:25<1:28:37,  1.51it/s]

EarlyStopping counter: 43 out of 10000


Epoch 23: CE 0.569674:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:51<1:22:37,  1.52it/s]

EarlyStopping counter: 44 out of 10000


Epoch 23: CE 0.569586:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:19<1:18:17,  1.50it/s]

EarlyStopping counter: 45 out of 10000


Epoch 23: CE 0.569463:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:44<1:08:55,  1.58it/s]

EarlyStopping counter: 46 out of 10000


Epoch 23: CE 0.569672:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [38:09<1:04:25,  1.56it/s]

EarlyStopping counter: 47 out of 10000


Epoch 23: CE 0.569290:  42%|████████████████████████████████████████████████████████████████████████▌                                                                                                    | 4001/9541 [43:36<59:13,  1.56it/s]

EarlyStopping counter: 48 out of 10000


Epoch 23: CE 0.569191:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [49:03<54:29,  1.54it/s]

EarlyStopping counter: 49 out of 10000


Epoch 23: CE 0.569017:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:30<48:55,  1.55it/s]

EarlyStopping counter: 50 out of 10000


Epoch 23: CE 0.569400:  58%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                         | 5501/9541 [59:55<41:09,  1.64it/s]

EarlyStopping counter: 51 out of 10000


Epoch 23: CE 0.569266:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:22<38:46,  1.52it/s]

EarlyStopping counter: 52 out of 10000


Epoch 23: CE 0.569369:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:10:48<30:30,  1.66it/s]

EarlyStopping counter: 53 out of 10000


Epoch 23: CE 0.569486:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:13<28:02,  1.51it/s]

EarlyStopping counter: 54 out of 10000


Epoch 23: CE 0.569781:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:21:38<22:25,  1.52it/s]

EarlyStopping counter: 55 out of 10000


Epoch 23: CE 0.569513:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:27:05<16:16,  1.58it/s]

EarlyStopping counter: 56 out of 10000


Epoch 23: CE 0.569392:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:33<11:42,  1.48it/s]

EarlyStopping counter: 57 out of 10000


Epoch 23: CE 0.569573:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:38:02<05:55,  1.52it/s]

EarlyStopping counter: 58 out of 10000


Epoch 23: CE 0.569662: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:29<00:27,  1.47it/s]

EarlyStopping counter: 59 out of 10000


Epoch 23: CE 0.569736: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:55<00:00,  1.53it/s]
Epoch 24: CE 0.604436:   0%|                                                                                                                                                                              | 1/9541 [00:00<2:10:08,  1.22it/s]

EarlyStopping counter: 60 out of 10000


Epoch 24: CE 0.567397:   5%|█████████                                                                                                                                                                   | 501/9541 [05:27<1:44:59,  1.44it/s]

EarlyStopping counter: 61 out of 10000


Epoch 24: CE 0.566583:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [10:52<1:34:53,  1.50it/s]

EarlyStopping counter: 62 out of 10000


Epoch 24: CE 0.567093:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:19<1:28:21,  1.52it/s]

EarlyStopping counter: 63 out of 10000


Epoch 24: CE 0.567402:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:48<1:19:53,  1.57it/s]

EarlyStopping counter: 64 out of 10000


Epoch 24: CE 0.566270:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:17<1:13:43,  1.59it/s]

EarlyStopping counter: 65 out of 10000


Epoch 24: CE 0.565770:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:45<1:07:54,  1.61it/s]

EarlyStopping counter: 66 out of 10000


Epoch 24: CE 0.565626:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [38:11<1:04:57,  1.55it/s]

EarlyStopping counter: 67 out of 10000


Epoch 24: CE 0.565281:  42%|███████████████████████████████████████████████████████████████████████▋                                                                                                   | 4001/9541 [43:38<1:00:19,  1.53it/s]

EarlyStopping counter: 68 out of 10000


Epoch 24: CE 0.565527:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [49:04<54:07,  1.55it/s]

EarlyStopping counter: 69 out of 10000


Epoch 24: CE 0.565080:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:33<48:55,  1.55it/s]

EarlyStopping counter: 70 out of 10000


Epoch 24: CE 0.564528:  58%|██████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                        | 5501/9541 [1:00:00<43:12,  1.56it/s]

EarlyStopping counter: 71 out of 10000


Epoch 24: CE 0.564876:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:28<39:56,  1.48it/s]

EarlyStopping counter: 72 out of 10000


Epoch 24: CE 0.564598:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:10:54<31:33,  1.61it/s]

EarlyStopping counter: 73 out of 10000


Epoch 24: CE 0.564597:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:20<28:15,  1.50it/s]

EarlyStopping counter: 74 out of 10000


Epoch 24: CE 0.564952:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:21:45<23:29,  1.45it/s]

EarlyStopping counter: 75 out of 10000


Epoch 24: CE 0.564982:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:27:09<16:37,  1.54it/s]

EarlyStopping counter: 76 out of 10000


Epoch 24: CE 0.565263:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:36<11:37,  1.49it/s]

EarlyStopping counter: 77 out of 10000


Epoch 24: CE 0.565211:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:38:02<06:15,  1.44it/s]

EarlyStopping counter: 78 out of 10000


Epoch 24: CE 0.565451: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:28<00:25,  1.56it/s]

EarlyStopping counter: 79 out of 10000


Epoch 24: CE 0.565475: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:54<00:00,  1.53it/s]
Epoch 25: CE 0.575445:   0%|                                                                                                                                                                              | 1/9541 [00:00<2:20:40,  1.13it/s]

EarlyStopping counter: 80 out of 10000


Epoch 25: CE 0.555450:   5%|█████████                                                                                                                                                                   | 501/9541 [05:26<1:40:09,  1.50it/s]

EarlyStopping counter: 81 out of 10000


Epoch 25: CE 0.558312:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [10:54<1:33:41,  1.52it/s]

EarlyStopping counter: 82 out of 10000


Epoch 25: CE 0.560054:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:31<1:29:29,  1.50it/s]

EarlyStopping counter: 83 out of 10000


Epoch 25: CE 0.559688:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:55<1:19:22,  1.58it/s]

EarlyStopping counter: 84 out of 10000


Epoch 25: CE 0.559939:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:22<1:16:32,  1.53it/s]

EarlyStopping counter: 85 out of 10000


Epoch 25: CE 0.560415:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:48<1:13:35,  1.48it/s]

EarlyStopping counter: 86 out of 10000


Epoch 25: CE 0.560596:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [38:14<1:08:44,  1.46it/s]

EarlyStopping counter: 87 out of 10000


Epoch 25: CE 0.560428:  42%|███████████████████████████████████████████████████████████████████████▋                                                                                                   | 4001/9541 [43:40<1:02:01,  1.49it/s]

EarlyStopping counter: 88 out of 10000


Epoch 25: CE 0.560764:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [49:07<55:59,  1.50it/s]

EarlyStopping counter: 89 out of 10000


Epoch 25: CE 0.560844:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:33<50:13,  1.51it/s]

EarlyStopping counter: 90 out of 10000


Epoch 25: CE 0.561183:  58%|██████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                        | 5501/9541 [1:00:01<43:01,  1.56it/s]

EarlyStopping counter: 91 out of 10000


Epoch 25: CE 0.561597:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:27<37:42,  1.56it/s]

EarlyStopping counter: 92 out of 10000


Epoch 25: CE 0.561902:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:10:54<32:54,  1.54it/s]

EarlyStopping counter: 93 out of 10000


Epoch 25: CE 0.561704:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:22<28:11,  1.50it/s]

EarlyStopping counter: 94 out of 10000


Epoch 25: CE 0.561700:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:21:48<22:08,  1.54it/s]

EarlyStopping counter: 95 out of 10000


Epoch 25: CE 0.561784:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:27:13<16:33,  1.55it/s]

EarlyStopping counter: 96 out of 10000


Epoch 25: CE 0.561832:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:38<11:27,  1.51it/s]

EarlyStopping counter: 97 out of 10000


Epoch 25: CE 0.561679:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:38:05<05:40,  1.58it/s]

EarlyStopping counter: 98 out of 10000


Epoch 25: CE 0.561799: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:31<00:26,  1.50it/s]

EarlyStopping counter: 99 out of 10000


Epoch 25: CE 0.561825: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:57<00:00,  1.53it/s]
Epoch 26: CE 0.578998:   0%|                                                                                                                                                                              | 1/9541 [00:00<2:00:32,  1.32it/s]

EarlyStopping counter: 100 out of 10000


Epoch 26: CE 0.553948:   5%|█████████                                                                                                                                                                   | 501/9541 [05:27<1:37:33,  1.54it/s]

EarlyStopping counter: 101 out of 10000


Epoch 26: CE 0.554268:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [10:55<1:27:43,  1.62it/s]

EarlyStopping counter: 102 out of 10000


Epoch 26: CE 0.556593:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:23<1:30:56,  1.47it/s]

EarlyStopping counter: 103 out of 10000


Epoch 26: CE 0.557100:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:49<1:23:39,  1.50it/s]

EarlyStopping counter: 104 out of 10000


Epoch 26: CE 0.559204:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:14<1:18:35,  1.49it/s]

EarlyStopping counter: 105 out of 10000


Epoch 26: CE 0.557598:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:40<1:09:53,  1.56it/s]

EarlyStopping counter: 106 out of 10000


Epoch 26: CE 0.557418:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [38:08<1:08:15,  1.47it/s]

EarlyStopping counter: 107 out of 10000


Epoch 26: CE 0.556792:  42%|███████████████████████████████████████████████████████████████████████▋                                                                                                   | 4001/9541 [43:37<1:00:44,  1.52it/s]

EarlyStopping counter: 108 out of 10000


Epoch 26: CE 0.557182:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [49:03<52:35,  1.60it/s]

EarlyStopping counter: 109 out of 10000


Epoch 26: CE 0.557291:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:27<47:18,  1.60it/s]

EarlyStopping counter: 110 out of 10000


Epoch 26: CE 0.557251:  58%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                         | 5501/9541 [59:54<41:57,  1.60it/s]

EarlyStopping counter: 111 out of 10000


Epoch 26: CE 0.556938:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:19<37:42,  1.56it/s]

EarlyStopping counter: 112 out of 10000


Epoch 26: CE 0.557237:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:10:44<32:30,  1.56it/s]

EarlyStopping counter: 113 out of 10000


Epoch 26: CE 0.556780:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:11<28:40,  1.48it/s]

EarlyStopping counter: 114 out of 10000


Epoch 26: CE 0.556939:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:21:38<23:10,  1.47it/s]

EarlyStopping counter: 115 out of 10000


Epoch 26: CE 0.556954:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:27:04<16:03,  1.60it/s]

EarlyStopping counter: 116 out of 10000


Epoch 26: CE 0.556968:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:31<11:34,  1.50it/s]

EarlyStopping counter: 117 out of 10000


Epoch 26: CE 0.556826:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:37:56<05:58,  1.51it/s]

EarlyStopping counter: 118 out of 10000


Epoch 26: CE 0.556553: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:20<00:27,  1.45it/s]

EarlyStopping counter: 119 out of 10000


Epoch 26: CE 0.556572: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:46<00:00,  1.53it/s]
Epoch 27: CE 0.583310:   0%|                 | 1/9541 [00:00<2:12:21,  1.20it/s]

EarlyStopping counter: 120 out of 10000


Epoch 27: CE 0.555395:   5%|▊              | 501/9541 [05:24<1:33:49,  1.61it/s]

EarlyStopping counter: 121 out of 10000


Epoch 27: CE 0.549180:  10%|█▍            | 1001/9541 [10:53<1:34:46,  1.50it/s]

EarlyStopping counter: 122 out of 10000


Epoch 27: CE 0.550157:  16%|██▏           | 1501/9541 [16:18<1:28:05,  1.52it/s]

EarlyStopping counter: 123 out of 10000


Epoch 27: CE 0.549199:  21%|██▉           | 2001/9541 [21:47<1:26:01,  1.46it/s]

EarlyStopping counter: 124 out of 10000


Epoch 27: CE 0.550108:  26%|███▋          | 2501/9541 [27:12<1:18:01,  1.50it/s]

EarlyStopping counter: 125 out of 10000


Epoch 27: CE 0.550393:  31%|████▍         | 3001/9541 [32:38<1:08:44,  1.59it/s]

EarlyStopping counter: 126 out of 10000


Epoch 27: CE 0.551105:  37%|█████▏        | 3501/9541 [38:05<1:08:41,  1.47it/s]

EarlyStopping counter: 127 out of 10000


Epoch 27: CE 0.551341:  42%|██████▋         | 4001/9541 [43:31<59:14,  1.56it/s]

EarlyStopping counter: 128 out of 10000


Epoch 27: CE 0.551898:  47%|███████▌        | 4501/9541 [48:58<56:49,  1.48it/s]

EarlyStopping counter: 129 out of 10000


Epoch 27: CE 0.552009:  52%|████████▍       | 5001/9541 [54:24<48:21,  1.56it/s]

EarlyStopping counter: 130 out of 10000


Epoch 27: CE 0.551856:  58%|█████████▏      | 5501/9541 [59:49<44:21,  1.52it/s]

EarlyStopping counter: 131 out of 10000


Epoch 27: CE 0.551805:  63%|████████▊     | 6001/9541 [1:05:15<37:03,  1.59it/s]

EarlyStopping counter: 132 out of 10000


Epoch 27: CE 0.551628:  68%|█████████▌    | 6501/9541 [1:10:39<32:30,  1.56it/s]

EarlyStopping counter: 133 out of 10000


Epoch 27: CE 0.551502:  73%|██████████▎   | 7001/9541 [1:16:06<27:13,  1.56it/s]

EarlyStopping counter: 134 out of 10000


Epoch 27: CE 0.551712:  79%|███████████   | 7501/9541 [1:21:31<21:46,  1.56it/s]

EarlyStopping counter: 135 out of 10000


Epoch 27: CE 0.551669:  84%|███████████▋  | 8001/9541 [1:26:57<16:39,  1.54it/s]

EarlyStopping counter: 136 out of 10000


Epoch 27: CE 0.551782:  89%|████████████▍ | 8501/9541 [1:32:22<11:02,  1.57it/s]

EarlyStopping counter: 137 out of 10000


Epoch 27: CE 0.551839:  94%|█████████████▏| 9001/9541 [1:37:47<05:54,  1.52it/s]

EarlyStopping counter: 138 out of 10000


Epoch 27: CE 0.551904: 100%|█████████████▉| 9501/9541 [1:43:10<00:26,  1.50it/s]

EarlyStopping counter: 139 out of 10000


Epoch 27: CE 0.551895: 100%|██████████████| 9541/9541 [1:43:36<00:00,  1.53it/s]
Epoch 28: CE 0.592634:   0%|                 | 1/9541 [00:00<2:13:12,  1.19it/s]

EarlyStopping counter: 140 out of 10000


Epoch 28: CE 0.546189:   5%|▊              | 501/9541 [05:27<1:41:24,  1.49it/s]

EarlyStopping counter: 141 out of 10000


Epoch 28: CE 0.544566:  10%|█▍            | 1001/9541 [10:52<1:32:12,  1.54it/s]

EarlyStopping counter: 142 out of 10000


Epoch 28: CE 0.545238:  16%|██▏           | 1501/9541 [16:17<1:29:22,  1.50it/s]

EarlyStopping counter: 143 out of 10000


Epoch 28: CE 0.546302:  21%|██▉           | 2001/9541 [21:42<1:20:00,  1.57it/s]

EarlyStopping counter: 144 out of 10000


Epoch 28: CE 0.545352:  26%|███▋          | 2501/9541 [27:08<1:15:22,  1.56it/s]

EarlyStopping counter: 145 out of 10000


Epoch 28: CE 0.545387:  31%|████▍         | 3001/9541 [32:34<1:11:38,  1.52it/s]

EarlyStopping counter: 146 out of 10000


Epoch 28: CE 0.544712:  37%|█████▏        | 3501/9541 [38:00<1:02:40,  1.61it/s]

EarlyStopping counter: 147 out of 10000


Epoch 28: CE 0.545146:  42%|█████▊        | 4001/9541 [43:24<1:02:13,  1.48it/s]

EarlyStopping counter: 148 out of 10000


Epoch 28: CE 0.545652:  47%|███████▌        | 4501/9541 [48:49<50:30,  1.66it/s]

EarlyStopping counter: 149 out of 10000


Epoch 28: CE 0.546017:  52%|████████▍       | 5001/9541 [54:13<45:08,  1.68it/s]

EarlyStopping counter: 150 out of 10000


Epoch 28: CE 0.545946:  58%|█████████▏      | 5501/9541 [59:37<42:39,  1.58it/s]

EarlyStopping counter: 151 out of 10000


Epoch 28: CE 0.546017:  63%|████████▊     | 6001/9541 [1:05:02<40:08,  1.47it/s]

EarlyStopping counter: 152 out of 10000


Epoch 28: CE 0.546245:  68%|█████████▌    | 6501/9541 [1:10:27<32:36,  1.55it/s]

EarlyStopping counter: 153 out of 10000


Epoch 28: CE 0.546764:  73%|██████████▎   | 7001/9541 [1:15:52<27:25,  1.54it/s]

EarlyStopping counter: 154 out of 10000


Epoch 28: CE 0.547020:  79%|███████████   | 7501/9541 [1:21:18<23:22,  1.45it/s]

EarlyStopping counter: 155 out of 10000


Epoch 28: CE 0.547261:  84%|███████████▋  | 8001/9541 [1:26:44<17:57,  1.43it/s]

EarlyStopping counter: 156 out of 10000


Epoch 28: CE 0.547122:  89%|████████████▍ | 8501/9541 [1:32:10<11:23,  1.52it/s]

EarlyStopping counter: 157 out of 10000


Epoch 28: CE 0.547143:  94%|█████████████▏| 9001/9541 [1:37:35<05:42,  1.58it/s]

EarlyStopping counter: 158 out of 10000


Epoch 28: CE 0.547388: 100%|█████████████▉| 9501/9541 [1:42:59<00:25,  1.58it/s]

EarlyStopping counter: 159 out of 10000


Epoch 28: CE 0.547409: 100%|██████████████| 9541/9541 [1:43:25<00:00,  1.54it/s]
Epoch 29: CE 0.622404:   0%|                 | 1/9541 [00:00<2:06:59,  1.25it/s]

EarlyStopping counter: 160 out of 10000


Epoch 29: CE 0.543355:   5%|▊              | 501/9541 [05:27<1:37:31,  1.54it/s]

EarlyStopping counter: 161 out of 10000


Epoch 29: CE 0.543999:  10%|█▍            | 1001/9541 [10:54<1:38:33,  1.44it/s]

EarlyStopping counter: 162 out of 10000


Epoch 29: CE 0.544340:  16%|██▏           | 1501/9541 [16:18<1:32:00,  1.46it/s]

EarlyStopping counter: 163 out of 10000


Epoch 29: CE 0.543624:  21%|██▉           | 2001/9541 [21:43<1:18:58,  1.59it/s]

EarlyStopping counter: 164 out of 10000


Epoch 29: CE 0.543522:  26%|███▋          | 2501/9541 [27:09<1:16:55,  1.53it/s]

EarlyStopping counter: 165 out of 10000


Epoch 29: CE 0.542811:  31%|████▍         | 3001/9541 [32:37<1:11:04,  1.53it/s]

EarlyStopping counter: 166 out of 10000


Epoch 29: CE 0.542837:  37%|█████▏        | 3501/9541 [38:02<1:02:28,  1.61it/s]

EarlyStopping counter: 167 out of 10000


Epoch 29: CE 0.542928:  42%|█████▊        | 4001/9541 [43:26<1:01:16,  1.51it/s]

EarlyStopping counter: 168 out of 10000


Epoch 29: CE 0.543127:  47%|███████▌        | 4501/9541 [48:51<55:26,  1.52it/s]

EarlyStopping counter: 169 out of 10000


Epoch 29: CE 0.543494:  52%|████████▍       | 5001/9541 [54:17<48:38,  1.56it/s]

EarlyStopping counter: 170 out of 10000


Epoch 29: CE 0.543406:  58%|█████████▏      | 5501/9541 [59:45<43:11,  1.56it/s]

EarlyStopping counter: 171 out of 10000


Epoch 29: CE 0.543816:  63%|████████▊     | 6001/9541 [1:05:21<38:42,  1.52it/s]

EarlyStopping counter: 172 out of 10000


Epoch 29: CE 0.543133:  68%|█████████▌    | 6501/9541 [1:10:45<31:48,  1.59it/s]

EarlyStopping counter: 173 out of 10000


Epoch 29: CE 0.542853:  73%|██████████▎   | 7001/9541 [1:16:11<27:57,  1.51it/s]

EarlyStopping counter: 174 out of 10000


Epoch 29: CE 0.542800:  79%|███████████   | 7501/9541 [1:21:35<20:32,  1.65it/s]

EarlyStopping counter: 175 out of 10000


Epoch 29: CE 0.542697:  84%|███████████▋  | 8001/9541 [1:27:02<16:36,  1.55it/s]

EarlyStopping counter: 176 out of 10000


Epoch 29: CE 0.542594:  89%|████████████▍ | 8501/9541 [1:32:27<10:55,  1.59it/s]

EarlyStopping counter: 177 out of 10000


Epoch 29: CE 0.542980:  94%|█████████████▏| 9001/9541 [1:37:54<05:40,  1.59it/s]

EarlyStopping counter: 178 out of 10000


Epoch 29: CE 0.542915: 100%|█████████████▉| 9501/9541 [1:43:18<00:24,  1.62it/s]

EarlyStopping counter: 179 out of 10000


Epoch 29: CE 0.542972: 100%|██████████████| 9541/9541 [1:43:44<00:00,  1.53it/s]
Epoch 30: CE 0.658494:   0%|                 | 1/9541 [00:00<2:13:42,  1.19it/s]

EarlyStopping counter: 180 out of 10000


Epoch 30: CE 0.537809:   5%|▊              | 501/9541 [05:25<1:40:18,  1.50it/s]

EarlyStopping counter: 181 out of 10000


Epoch 30: CE 0.535347:  10%|█▍            | 1001/9541 [10:51<1:31:46,  1.55it/s]

EarlyStopping counter: 182 out of 10000


Epoch 30: CE 0.535721:  16%|██▏           | 1501/9541 [16:19<1:26:42,  1.55it/s]

EarlyStopping counter: 183 out of 10000


Epoch 30: CE 0.536409:  21%|██▉           | 2001/9541 [21:43<1:22:43,  1.52it/s]

EarlyStopping counter: 184 out of 10000


Epoch 30: CE 0.537371:  26%|███▋          | 2501/9541 [27:06<1:17:49,  1.51it/s]

EarlyStopping counter: 185 out of 10000


Epoch 30: CE 0.537991:  31%|████▍         | 3001/9541 [32:32<1:10:52,  1.54it/s]

EarlyStopping counter: 186 out of 10000


Epoch 30: CE 0.538555:  37%|█████▏        | 3501/9541 [37:58<1:03:34,  1.58it/s]

EarlyStopping counter: 187 out of 10000


Epoch 30: CE 0.537924:  42%|██████▋         | 4001/9541 [43:22<56:51,  1.62it/s]

EarlyStopping counter: 188 out of 10000


Epoch 30: CE 0.538291:  47%|███████▌        | 4501/9541 [48:47<51:09,  1.64it/s]

EarlyStopping counter: 189 out of 10000


Epoch 30: CE 0.538215:  52%|████████▍       | 5001/9541 [54:11<47:17,  1.60it/s]

EarlyStopping counter: 190 out of 10000


Epoch 30: CE 0.538197:  58%|█████████▏      | 5501/9541 [59:35<43:03,  1.56it/s]

EarlyStopping counter: 191 out of 10000


Epoch 30: CE 0.537883:  63%|████████▊     | 6001/9541 [1:04:59<36:26,  1.62it/s]

EarlyStopping counter: 192 out of 10000


Epoch 30: CE 0.538418:  68%|█████████▌    | 6501/9541 [1:10:25<34:13,  1.48it/s]

EarlyStopping counter: 193 out of 10000


Epoch 30: CE 0.538435:  73%|██████████▎   | 7001/9541 [1:15:51<26:58,  1.57it/s]

EarlyStopping counter: 194 out of 10000


Epoch 30: CE 0.538060:  79%|███████████   | 7501/9541 [1:21:17<23:07,  1.47it/s]

EarlyStopping counter: 195 out of 10000


Epoch 30: CE 0.538163:  84%|███████████▋  | 8001/9541 [1:26:44<16:35,  1.55it/s]

EarlyStopping counter: 196 out of 10000


Epoch 30: CE 0.538523:  89%|████████████▍ | 8501/9541 [1:32:10<11:42,  1.48it/s]

EarlyStopping counter: 197 out of 10000


Epoch 30: CE 0.538877:  94%|█████████████▏| 9001/9541 [1:37:36<05:44,  1.57it/s]

EarlyStopping counter: 198 out of 10000


Epoch 30: CE 0.538841: 100%|█████████████▉| 9501/9541 [1:43:00<00:25,  1.56it/s]

EarlyStopping counter: 199 out of 10000


Epoch 30: CE 0.538833: 100%|██████████████| 9541/9541 [1:43:26<00:00,  1.54it/s]
Epoch 31: CE 0.599450:   0%|                 | 1/9541 [00:00<2:04:49,  1.27it/s]

EarlyStopping counter: 200 out of 10000


Epoch 31: CE 0.532706:  16%|██▏           | 1501/9541 [16:16<1:33:42,  1.43it/s]

EarlyStopping counter: 1 out of 10000


Epoch 31: CE 0.532104:  21%|██▉           | 2001/9541 [21:41<1:23:40,  1.50it/s]

EarlyStopping counter: 2 out of 10000


Epoch 31: CE 0.533406:  26%|███▋          | 2501/9541 [27:06<1:19:51,  1.47it/s]

EarlyStopping counter: 3 out of 10000


Epoch 31: CE 0.533648:  31%|████▍         | 3001/9541 [32:31<1:07:46,  1.61it/s]

EarlyStopping counter: 4 out of 10000


Epoch 31: CE 0.533467:  37%|█████▏        | 3501/9541 [37:56<1:06:56,  1.50it/s]

EarlyStopping counter: 5 out of 10000


Epoch 31: CE 0.534107:  42%|█████▊        | 4001/9541 [43:21<1:02:24,  1.48it/s]

EarlyStopping counter: 6 out of 10000


Epoch 31: CE 0.533731:  47%|███████▌        | 4501/9541 [48:47<54:34,  1.54it/s]

EarlyStopping counter: 7 out of 10000


Epoch 31: CE 0.534383:  52%|████████▍       | 5001/9541 [54:11<50:38,  1.49it/s]

EarlyStopping counter: 8 out of 10000


Epoch 31: CE 0.534095:  58%|█████████▏      | 5501/9541 [59:36<42:55,  1.57it/s]

EarlyStopping counter: 9 out of 10000


Epoch 31: CE 0.534189:  63%|████████▊     | 6001/9541 [1:05:01<37:35,  1.57it/s]

EarlyStopping counter: 10 out of 10000


Epoch 31: CE 0.534255:  68%|█████████▌    | 6501/9541 [1:10:27<33:26,  1.51it/s]

EarlyStopping counter: 11 out of 10000


Epoch 31: CE 0.534396:  73%|██████████▎   | 7001/9541 [1:15:52<28:16,  1.50it/s]

EarlyStopping counter: 12 out of 10000


Epoch 31: CE 0.534662:  79%|███████████   | 7501/9541 [1:21:18<23:04,  1.47it/s]

EarlyStopping counter: 13 out of 10000


Epoch 31: CE 0.534764:  84%|███████████▋  | 8001/9541 [1:26:46<17:05,  1.50it/s]

EarlyStopping counter: 14 out of 10000


Epoch 31: CE 0.535024:  89%|████████████▍ | 8501/9541 [1:32:11<11:52,  1.46it/s]

EarlyStopping counter: 15 out of 10000


Epoch 31: CE 0.535099:  94%|█████████████▏| 9001/9541 [1:37:37<05:41,  1.58it/s]

EarlyStopping counter: 16 out of 10000


Epoch 31: CE 0.535263: 100%|█████████████▉| 9501/9541 [1:43:02<00:25,  1.54it/s]

EarlyStopping counter: 17 out of 10000


Epoch 31: CE 0.535250: 100%|██████████████| 9541/9541 [1:43:28<00:00,  1.54it/s]
Epoch 32: CE 0.546167:   0%|                 | 1/9541 [00:00<2:10:47,  1.22it/s]

EarlyStopping counter: 18 out of 10000


Epoch 32: CE 0.532170:  10%|█▍            | 1001/9541 [10:52<1:30:31,  1.57it/s]

EarlyStopping counter: 1 out of 10000


Epoch 32: CE 0.531633:  16%|██▏           | 1501/9541 [16:16<1:27:55,  1.52it/s]

EarlyStopping counter: 2 out of 10000


Epoch 32: CE 0.531216:  26%|███▋          | 2501/9541 [27:09<1:11:18,  1.65it/s]

EarlyStopping counter: 1 out of 10000


Epoch 32: CE 0.531772:  37%|█████▏        | 3501/9541 [38:02<1:05:01,  1.55it/s]

EarlyStopping counter: 1 out of 10000


Epoch 32: CE 0.531992:  42%|█████▊        | 4001/9541 [43:30<1:01:04,  1.51it/s]

EarlyStopping counter: 2 out of 10000


Epoch 32: CE 0.531216:  47%|███████▌        | 4501/9541 [48:52<54:36,  1.54it/s]

EarlyStopping counter: 3 out of 10000


Epoch 32: CE 0.531260:  52%|████████▍       | 5001/9541 [54:18<48:55,  1.55it/s]

EarlyStopping counter: 4 out of 10000


Epoch 32: CE 0.531372:  58%|█████████▏      | 5501/9541 [59:43<46:01,  1.46it/s]

EarlyStopping counter: 5 out of 10000


Epoch 32: CE 0.531719:  63%|████████▊     | 6001/9541 [1:05:08<40:11,  1.47it/s]

EarlyStopping counter: 6 out of 10000


Epoch 32: CE 0.531541:  68%|█████████▌    | 6501/9541 [1:10:33<32:43,  1.55it/s]

EarlyStopping counter: 7 out of 10000


Epoch 32: CE 0.531407:  73%|██████████▎   | 7001/9541 [1:15:58<26:03,  1.62it/s]

EarlyStopping counter: 8 out of 10000


Epoch 32: CE 0.531455:  79%|███████████   | 7501/9541 [1:21:23<22:26,  1.52it/s]

EarlyStopping counter: 9 out of 10000


Epoch 32: CE 0.531289:  89%|████████████▍ | 8501/9541 [1:32:13<11:14,  1.54it/s]

EarlyStopping counter: 1 out of 10000


Epoch 32: CE 0.531063:  94%|█████████████▏| 9001/9541 [1:37:39<05:27,  1.65it/s]

EarlyStopping counter: 2 out of 10000


Epoch 32: CE 0.531377: 100%|█████████████▉| 9501/9541 [1:43:06<00:25,  1.54it/s]

EarlyStopping counter: 3 out of 10000


Epoch 32: CE 0.531305: 100%|██████████████| 9541/9541 [1:43:32<00:00,  1.54it/s]
Epoch 33: CE 0.531286:   5%|▊              | 501/9541 [05:28<1:38:36,  1.53it/s]

EarlyStopping counter: 1 out of 10000


Epoch 33: CE 0.532577:  10%|█▍            | 1001/9541 [10:52<1:31:18,  1.56it/s]

EarlyStopping counter: 2 out of 10000


Epoch 33: CE 0.531872:  16%|██▏           | 1501/9541 [16:17<1:26:31,  1.55it/s]

EarlyStopping counter: 3 out of 10000


Epoch 33: CE 0.530612:  21%|██▉           | 2001/9541 [21:43<1:23:54,  1.50it/s]

EarlyStopping counter: 4 out of 10000


Epoch 33: CE 0.529701:  26%|███▋          | 2501/9541 [27:09<1:15:03,  1.56it/s]

EarlyStopping counter: 5 out of 10000


Epoch 33: CE 0.528480:  31%|████▍         | 3001/9541 [32:34<1:09:17,  1.57it/s]

EarlyStopping counter: 6 out of 10000


Epoch 33: CE 0.528510:  37%|█████▏        | 3501/9541 [37:59<1:02:59,  1.60it/s]

EarlyStopping counter: 7 out of 10000


Epoch 33: CE 0.529015:  42%|██████▋         | 4001/9541 [43:22<57:44,  1.60it/s]

EarlyStopping counter: 8 out of 10000


Epoch 33: CE 0.528951:  47%|███████▌        | 4501/9541 [48:48<51:00,  1.65it/s]

EarlyStopping counter: 9 out of 10000


Epoch 33: CE 0.528686:  52%|████████▍       | 5001/9541 [54:15<52:28,  1.44it/s]

EarlyStopping counter: 10 out of 10000


Epoch 33: CE 0.528388:  58%|█████████▏      | 5501/9541 [59:42<43:59,  1.53it/s]

EarlyStopping counter: 11 out of 10000


Epoch 33: CE 0.528515:  63%|████████▊     | 6001/9541 [1:05:07<39:03,  1.51it/s]

EarlyStopping counter: 12 out of 10000


Epoch 33: CE 0.528703:  68%|█████████▌    | 6501/9541 [1:10:30<32:27,  1.56it/s]

EarlyStopping counter: 13 out of 10000


Epoch 33: CE 0.528524:  73%|██████████▎   | 7001/9541 [1:15:56<27:48,  1.52it/s]

EarlyStopping counter: 14 out of 10000


Epoch 33: CE 0.528745:  79%|███████████   | 7501/9541 [1:21:21<22:43,  1.50it/s]

EarlyStopping counter: 15 out of 10000


Epoch 33: CE 0.528726:  84%|███████████▋  | 8001/9541 [1:26:47<17:06,  1.50it/s]

EarlyStopping counter: 16 out of 10000


Epoch 33: CE 0.528558:  89%|████████████▍ | 8501/9541 [1:32:11<11:31,  1.50it/s]

EarlyStopping counter: 17 out of 10000


Epoch 33: CE 0.528470:  94%|█████████████▏| 9001/9541 [1:37:37<05:47,  1.55it/s]

EarlyStopping counter: 18 out of 10000


Epoch 33: CE 0.528178: 100%|█████████████▉| 9501/9541 [1:43:02<00:27,  1.48it/s]

EarlyStopping counter: 19 out of 10000


Epoch 33: CE 0.528174: 100%|██████████████| 9541/9541 [1:43:28<00:00,  1.54it/s]
Epoch 34: CE 0.587741:   0%|                 | 1/9541 [00:00<2:00:39,  1.32it/s]

EarlyStopping counter: 20 out of 10000


Epoch 34: CE 0.525142:   5%|▊              | 501/9541 [05:27<1:38:38,  1.53it/s]

EarlyStopping counter: 21 out of 10000


Epoch 34: CE 0.522145:  10%|█▍            | 1001/9541 [10:52<1:34:10,  1.51it/s]

EarlyStopping counter: 22 out of 10000


Epoch 34: CE 0.521298:  16%|██▏           | 1501/9541 [16:19<1:21:25,  1.65it/s]

EarlyStopping counter: 23 out of 10000


Epoch 34: CE 0.522550:  21%|██▉           | 2001/9541 [21:46<1:21:02,  1.55it/s]

EarlyStopping counter: 24 out of 10000


Epoch 34: CE 0.523337:  26%|███▋          | 2501/9541 [27:13<1:18:07,  1.50it/s]

EarlyStopping counter: 25 out of 10000


Epoch 34: CE 0.523867:  31%|████▍         | 3001/9541 [32:39<1:09:00,  1.58it/s]

EarlyStopping counter: 26 out of 10000


Epoch 34: CE 0.523834:  37%|█████▏        | 3501/9541 [38:18<1:09:04,  1.46it/s]

EarlyStopping counter: 27 out of 10000


Epoch 34: CE 0.523863:  42%|██████▋         | 4001/9541 [43:43<58:09,  1.59it/s]

EarlyStopping counter: 28 out of 10000


Epoch 34: CE 0.523570:  47%|███████▌        | 4501/9541 [49:08<56:52,  1.48it/s]

EarlyStopping counter: 29 out of 10000


Epoch 34: CE 0.523604:  52%|████████▍       | 5001/9541 [54:32<45:26,  1.66it/s]

EarlyStopping counter: 30 out of 10000


Epoch 34: CE 0.523268:  58%|█████████▏      | 5501/9541 [59:58<43:39,  1.54it/s]

EarlyStopping counter: 31 out of 10000


Epoch 34: CE 0.523240:  63%|████████▊     | 6001/9541 [1:05:24<39:08,  1.51it/s]

EarlyStopping counter: 32 out of 10000


Epoch 34: CE 0.523167:  68%|█████████▌    | 6501/9541 [1:10:49<34:01,  1.49it/s]

EarlyStopping counter: 33 out of 10000


Epoch 34: CE 0.523639:  73%|██████████▎   | 7001/9541 [1:16:14<26:30,  1.60it/s]

EarlyStopping counter: 34 out of 10000


Epoch 34: CE 0.523660:  79%|███████████   | 7501/9541 [1:21:40<23:31,  1.45it/s]

EarlyStopping counter: 35 out of 10000


Epoch 34: CE 0.523804:  84%|███████████▋  | 8001/9541 [1:27:05<16:41,  1.54it/s]

EarlyStopping counter: 36 out of 10000


Epoch 34: CE 0.523883:  89%|████████████▍ | 8501/9541 [1:32:30<10:41,  1.62it/s]

EarlyStopping counter: 37 out of 10000


Epoch 34: CE 0.524019:  94%|█████████████▏| 9001/9541 [1:37:56<05:53,  1.53it/s]

EarlyStopping counter: 38 out of 10000


Epoch 34: CE 0.524391: 100%|█████████████▉| 9501/9541 [1:43:21<00:26,  1.49it/s]

EarlyStopping counter: 39 out of 10000


Epoch 34: CE 0.524374: 100%|██████████████| 9541/9541 [1:43:47<00:00,  1.53it/s]
Epoch 35: CE 0.544263:   0%|                 | 1/9541 [00:00<2:06:37,  1.26it/s]

EarlyStopping counter: 40 out of 10000


Epoch 35: CE 0.522080:   5%|▊              | 501/9541 [05:26<1:37:12,  1.55it/s]

EarlyStopping counter: 41 out of 10000


Epoch 35: CE 0.520951:  10%|█▍            | 1001/9541 [10:51<1:33:21,  1.52it/s]

EarlyStopping counter: 42 out of 10000


Epoch 35: CE 0.520591:  16%|██▏           | 1501/9541 [16:17<1:28:15,  1.52it/s]

EarlyStopping counter: 43 out of 10000


Epoch 35: CE 0.522338:  21%|██▉           | 2001/9541 [21:43<1:21:42,  1.54it/s]

EarlyStopping counter: 44 out of 10000


Epoch 35: CE 0.522998:  26%|███▋          | 2501/9541 [27:10<1:14:50,  1.57it/s]

EarlyStopping counter: 45 out of 10000


Epoch 35: CE 0.522605:  31%|████▍         | 3001/9541 [32:36<1:13:48,  1.48it/s]

EarlyStopping counter: 46 out of 10000


Epoch 35: CE 0.522206:  37%|█████▏        | 3501/9541 [38:00<1:05:26,  1.54it/s]

EarlyStopping counter: 47 out of 10000


Epoch 35: CE 0.522632:  42%|██████▋         | 4001/9541 [43:25<59:40,  1.55it/s]

EarlyStopping counter: 48 out of 10000


Epoch 35: CE 0.522987:  47%|███████▌        | 4501/9541 [48:51<55:49,  1.50it/s]

EarlyStopping counter: 49 out of 10000


Epoch 35: CE 0.522548:  52%|████████▍       | 5001/9541 [54:17<50:10,  1.51it/s]

EarlyStopping counter: 50 out of 10000


Epoch 35: CE 0.522597:  58%|█████████▏      | 5501/9541 [59:42<42:57,  1.57it/s]

EarlyStopping counter: 51 out of 10000


Epoch 35: CE 0.522429:  63%|████████▊     | 6001/9541 [1:05:05<36:07,  1.63it/s]

EarlyStopping counter: 52 out of 10000


Epoch 35: CE 0.522084:  68%|█████████▌    | 6501/9541 [1:10:30<33:38,  1.51it/s]

EarlyStopping counter: 53 out of 10000


Epoch 35: CE 0.522113:  73%|██████████▎   | 7001/9541 [1:15:55<27:39,  1.53it/s]

EarlyStopping counter: 54 out of 10000


Epoch 35: CE 0.522006:  79%|███████████   | 7501/9541 [1:21:20<22:04,  1.54it/s]

EarlyStopping counter: 55 out of 10000


Epoch 35: CE 0.521720:  84%|███████████▋  | 8001/9541 [1:26:47<16:52,  1.52it/s]

EarlyStopping counter: 56 out of 10000


Epoch 35: CE 0.521629:  89%|████████████▍ | 8501/9541 [1:32:12<11:36,  1.49it/s]

EarlyStopping counter: 57 out of 10000


Epoch 35: CE 0.521731:  94%|█████████████▏| 9001/9541 [1:37:38<06:03,  1.49it/s]

EarlyStopping counter: 58 out of 10000


Epoch 35: CE 0.521811: 100%|█████████████▉| 9501/9541 [1:43:03<00:24,  1.60it/s]

EarlyStopping counter: 59 out of 10000


Epoch 35: CE 0.521892: 100%|██████████████| 9541/9541 [1:43:29<00:00,  1.54it/s]
Epoch 36: CE 0.414583:   0%|                 | 1/9541 [00:00<2:17:51,  1.15it/s]

EarlyStopping counter: 60 out of 10000


Epoch 36: CE 0.517648:   5%|▊              | 501/9541 [05:27<1:36:53,  1.56it/s]

EarlyStopping counter: 61 out of 10000


Epoch 36: CE 0.518326:  10%|█▍            | 1001/9541 [10:52<1:29:33,  1.59it/s]

EarlyStopping counter: 62 out of 10000


Epoch 36: CE 0.518318:  16%|██▏           | 1501/9541 [16:17<1:21:21,  1.65it/s]

EarlyStopping counter: 63 out of 10000


Epoch 36: CE 0.518045:  21%|██▉           | 2001/9541 [21:40<1:18:12,  1.61it/s]

EarlyStopping counter: 64 out of 10000


Epoch 36: CE 0.518159:  26%|███▋          | 2501/9541 [27:06<1:15:30,  1.55it/s]

EarlyStopping counter: 65 out of 10000


Epoch 36: CE 0.518025:  31%|████▍         | 3001/9541 [32:31<1:13:00,  1.49it/s]

EarlyStopping counter: 66 out of 10000


Epoch 36: CE 0.516703:  37%|█████▏        | 3501/9541 [37:56<1:08:38,  1.47it/s]

EarlyStopping counter: 67 out of 10000


Epoch 36: CE 0.517566:  42%|██████▋         | 4001/9541 [43:22<59:32,  1.55it/s]

EarlyStopping counter: 68 out of 10000


Epoch 36: CE 0.518071:  47%|███████▌        | 4501/9541 [48:49<51:22,  1.63it/s]

EarlyStopping counter: 69 out of 10000


Epoch 36: CE 0.518135:  52%|████████▍       | 5001/9541 [54:15<48:56,  1.55it/s]

EarlyStopping counter: 70 out of 10000


Epoch 36: CE 0.518102:  58%|█████████▏      | 5501/9541 [59:41<45:11,  1.49it/s]

EarlyStopping counter: 71 out of 10000


Epoch 36: CE 0.517780:  63%|████████▊     | 6001/9541 [1:05:09<38:55,  1.52it/s]

EarlyStopping counter: 72 out of 10000


Epoch 36: CE 0.517803:  68%|█████████▌    | 6501/9541 [1:10:36<33:43,  1.50it/s]

EarlyStopping counter: 73 out of 10000


Epoch 36: CE 0.517822:  73%|██████████▎   | 7001/9541 [1:16:01<27:39,  1.53it/s]

EarlyStopping counter: 74 out of 10000


Epoch 36: CE 0.518195:  79%|███████████   | 7501/9541 [1:21:27<21:57,  1.55it/s]

EarlyStopping counter: 75 out of 10000


Epoch 36: CE 0.518342:  84%|███████████▋  | 8001/9541 [1:26:53<16:56,  1.52it/s]

EarlyStopping counter: 76 out of 10000


Epoch 36: CE 0.518259:  89%|████████████▍ | 8501/9541 [1:32:18<11:33,  1.50it/s]

EarlyStopping counter: 77 out of 10000


Epoch 36: CE 0.518107:  94%|█████████████▏| 9001/9541 [1:37:42<06:13,  1.45it/s]

EarlyStopping counter: 78 out of 10000


Epoch 36: CE 0.518153: 100%|█████████████▉| 9501/9541 [1:43:06<00:24,  1.61it/s]

EarlyStopping counter: 79 out of 10000


Epoch 36: CE 0.518232: 100%|██████████████| 9541/9541 [1:43:31<00:00,  1.54it/s]
Epoch 37: CE 0.489115:   0%|                 | 1/9541 [00:00<2:01:39,  1.31it/s]

EarlyStopping counter: 80 out of 10000


Epoch 37: CE 0.515963:   5%|▊              | 501/9541 [05:24<1:39:00,  1.52it/s]

EarlyStopping counter: 81 out of 10000


Epoch 37: CE 0.517391:  10%|█▍            | 1001/9541 [10:48<1:33:07,  1.53it/s]

EarlyStopping counter: 82 out of 10000


Epoch 37: CE 0.517250:  16%|██▏           | 1501/9541 [16:14<1:30:19,  1.48it/s]

EarlyStopping counter: 83 out of 10000


Epoch 37: CE 0.517193:  21%|██▉           | 2001/9541 [21:41<1:23:17,  1.51it/s]

EarlyStopping counter: 84 out of 10000


Epoch 37: CE 0.516368:  26%|███▋          | 2501/9541 [27:06<1:15:08,  1.56it/s]

EarlyStopping counter: 85 out of 10000


Epoch 37: CE 0.516373:  31%|████▍         | 3001/9541 [32:31<1:07:28,  1.62it/s]

EarlyStopping counter: 86 out of 10000


Epoch 37: CE 0.516549:  37%|█████▏        | 3501/9541 [37:57<1:06:19,  1.52it/s]

EarlyStopping counter: 87 out of 10000


Epoch 37: CE 0.515617:  42%|██████▋         | 4001/9541 [43:22<59:48,  1.54it/s]

EarlyStopping counter: 88 out of 10000


Epoch 37: CE 0.516337:  47%|███████▌        | 4501/9541 [48:48<57:00,  1.47it/s]

EarlyStopping counter: 89 out of 10000


Epoch 37: CE 0.516592:  52%|████████▍       | 5001/9541 [54:14<50:20,  1.50it/s]

EarlyStopping counter: 90 out of 10000


Epoch 37: CE 0.516410:  58%|█████████▏      | 5501/9541 [59:38<42:53,  1.57it/s]

EarlyStopping counter: 91 out of 10000


Epoch 37: CE 0.515958:  63%|████████▊     | 6001/9541 [1:05:03<40:15,  1.47it/s]

EarlyStopping counter: 92 out of 10000


Epoch 37: CE 0.515768:  68%|█████████▌    | 6501/9541 [1:10:26<34:38,  1.46it/s]

EarlyStopping counter: 93 out of 10000


Epoch 37: CE 0.516173:  73%|██████████▎   | 7001/9541 [1:15:52<28:37,  1.48it/s]

EarlyStopping counter: 94 out of 10000


Epoch 37: CE 0.515991:  79%|███████████   | 7501/9541 [1:21:19<22:32,  1.51it/s]

EarlyStopping counter: 95 out of 10000


Epoch 37: CE 0.516190:  84%|███████████▋  | 8001/9541 [1:26:42<15:53,  1.62it/s]

EarlyStopping counter: 96 out of 10000


Epoch 37: CE 0.516033:  89%|████████████▍ | 8501/9541 [1:32:08<10:55,  1.59it/s]

EarlyStopping counter: 97 out of 10000


Epoch 37: CE 0.516046:  94%|█████████████▏| 9001/9541 [1:37:30<05:27,  1.65it/s]

EarlyStopping counter: 98 out of 10000


Epoch 37: CE 0.516062: 100%|█████████████▉| 9501/9541 [1:42:55<00:27,  1.48it/s]

EarlyStopping counter: 99 out of 10000


Epoch 37: CE 0.515982: 100%|██████████████| 9541/9541 [1:43:21<00:00,  1.54it/s]
Epoch 38: CE 0.614265:   0%|                 | 1/9541 [00:00<2:04:13,  1.28it/s]

EarlyStopping counter: 100 out of 10000


Epoch 38: CE 0.513612:   5%|▊              | 501/9541 [05:26<1:39:42,  1.51it/s]

EarlyStopping counter: 101 out of 10000


Epoch 38: CE 0.512794:  10%|█▍            | 1001/9541 [10:49<1:36:27,  1.48it/s]

EarlyStopping counter: 102 out of 10000


Epoch 38: CE 0.511826:  16%|██▏           | 1501/9541 [16:14<1:21:01,  1.65it/s]

EarlyStopping counter: 103 out of 10000


Epoch 38: CE 0.511958:  21%|██▉           | 2001/9541 [21:41<1:24:04,  1.49it/s]

EarlyStopping counter: 104 out of 10000


Epoch 38: CE 0.511958:  26%|███▋          | 2501/9541 [27:06<1:16:42,  1.53it/s]

EarlyStopping counter: 105 out of 10000


Epoch 38: CE 0.513501:  31%|████▍         | 3001/9541 [32:32<1:11:33,  1.52it/s]

EarlyStopping counter: 106 out of 10000


Epoch 38: CE 0.512701:  37%|█████▏        | 3501/9541 [37:57<1:10:10,  1.43it/s]

EarlyStopping counter: 107 out of 10000


Epoch 38: CE 0.512786:  42%|█████▊        | 4001/9541 [43:23<1:00:34,  1.52it/s]

EarlyStopping counter: 108 out of 10000


Epoch 38: CE 0.512584:  47%|███████▌        | 4501/9541 [48:46<56:00,  1.50it/s]

EarlyStopping counter: 109 out of 10000


Epoch 38: CE 0.512765:  52%|████████▍       | 5001/9541 [54:12<51:16,  1.48it/s]

EarlyStopping counter: 110 out of 10000


Epoch 38: CE 0.512673:  58%|█████████▏      | 5501/9541 [59:36<45:43,  1.47it/s]

EarlyStopping counter: 111 out of 10000


Epoch 38: CE 0.512559:  63%|████████▊     | 6001/9541 [1:05:02<38:18,  1.54it/s]

EarlyStopping counter: 112 out of 10000


Epoch 38: CE 0.512475:  68%|█████████▌    | 6501/9541 [1:10:26<33:55,  1.49it/s]

EarlyStopping counter: 113 out of 10000


Epoch 38: CE 0.512641:  73%|██████████▎   | 7001/9541 [1:15:51<28:40,  1.48it/s]

EarlyStopping counter: 114 out of 10000


Epoch 38: CE 0.512772:  79%|███████████   | 7501/9541 [1:21:17<21:24,  1.59it/s]

EarlyStopping counter: 115 out of 10000


Epoch 38: CE 0.513013:  84%|███████████▋  | 8001/9541 [1:26:42<16:34,  1.55it/s]

EarlyStopping counter: 116 out of 10000


Epoch 38: CE 0.513091:  89%|████████████▍ | 8501/9541 [1:32:08<11:12,  1.55it/s]

EarlyStopping counter: 117 out of 10000


Epoch 38: CE 0.513311:  94%|█████████████▏| 9001/9541 [1:37:35<06:00,  1.50it/s]

EarlyStopping counter: 118 out of 10000


Epoch 38: CE 0.512968: 100%|█████████████▉| 9501/9541 [1:43:01<00:26,  1.52it/s]

EarlyStopping counter: 119 out of 10000


Epoch 38: CE 0.512997: 100%|██████████████| 9541/9541 [1:43:26<00:00,  1.54it/s]
Epoch 39: CE 0.489285:   0%|                 | 1/9541 [00:00<2:05:52,  1.26it/s]

EarlyStopping counter: 120 out of 10000


Epoch 39: CE 0.504989:   5%|▊              | 501/9541 [05:27<1:35:33,  1.58it/s]

EarlyStopping counter: 121 out of 10000


Epoch 39: CE 0.503578:  10%|█▍            | 1001/9541 [11:05<1:30:48,  1.57it/s]

EarlyStopping counter: 122 out of 10000


Epoch 39: CE 0.505657:  16%|██▏           | 1501/9541 [16:31<1:31:24,  1.47it/s]

EarlyStopping counter: 123 out of 10000


Epoch 39: CE 0.507165:  21%|██▉           | 2001/9541 [21:57<1:26:57,  1.45it/s]

EarlyStopping counter: 124 out of 10000


Epoch 39: CE 0.507147:  26%|███▋          | 2501/9541 [27:23<1:15:32,  1.55it/s]

EarlyStopping counter: 125 out of 10000


Epoch 39: CE 0.507778:  31%|████▍         | 3001/9541 [32:48<1:12:32,  1.50it/s]

EarlyStopping counter: 126 out of 10000


Epoch 39: CE 0.508902:  37%|█████▏        | 3501/9541 [38:14<1:07:49,  1.48it/s]

EarlyStopping counter: 127 out of 10000


Epoch 39: CE 0.508743:  42%|█████▊        | 4001/9541 [43:39<1:03:47,  1.45it/s]

EarlyStopping counter: 128 out of 10000


Epoch 39: CE 0.509199:  47%|███████▌        | 4501/9541 [49:05<50:54,  1.65it/s]

EarlyStopping counter: 129 out of 10000


Epoch 39: CE 0.508565:  52%|████████▍       | 5001/9541 [54:30<47:18,  1.60it/s]

EarlyStopping counter: 130 out of 10000


Epoch 39: CE 0.508791:  58%|█████████▏      | 5501/9541 [59:55<41:44,  1.61it/s]

EarlyStopping counter: 131 out of 10000


Epoch 39: CE 0.509069:  63%|████████▊     | 6001/9541 [1:05:21<37:37,  1.57it/s]

EarlyStopping counter: 132 out of 10000


Epoch 39: CE 0.509121:  68%|█████████▌    | 6501/9541 [1:10:44<35:01,  1.45it/s]

EarlyStopping counter: 133 out of 10000


Epoch 39: CE 0.509192:  73%|██████████▎   | 7001/9541 [1:16:10<26:27,  1.60it/s]

EarlyStopping counter: 134 out of 10000


Epoch 39: CE 0.509245:  79%|███████████   | 7501/9541 [1:21:36<20:57,  1.62it/s]

EarlyStopping counter: 135 out of 10000


Epoch 39: CE 0.509617:  84%|███████████▋  | 8001/9541 [1:27:02<16:59,  1.51it/s]

EarlyStopping counter: 136 out of 10000


Epoch 39: CE 0.509553:  89%|████████████▍ | 8501/9541 [1:32:28<11:48,  1.47it/s]

EarlyStopping counter: 137 out of 10000


Epoch 39: CE 0.509342:  94%|█████████████▏| 9001/9541 [1:37:52<05:51,  1.53it/s]

EarlyStopping counter: 138 out of 10000


Epoch 39: CE 0.509416: 100%|█████████████▉| 9501/9541 [1:43:17<00:27,  1.47it/s]

EarlyStopping counter: 139 out of 10000


Epoch 39: CE 0.509382: 100%|██████████████| 9541/9541 [1:43:43<00:00,  1.53it/s]
Epoch 40: CE 0.440437:   0%|                 | 1/9541 [00:00<1:56:57,  1.36it/s]

EarlyStopping counter: 140 out of 10000


Epoch 40: CE 0.508517:   5%|▊              | 501/9541 [05:27<1:39:50,  1.51it/s]

EarlyStopping counter: 141 out of 10000


Epoch 40: CE 0.511025:  10%|█▍            | 1001/9541 [10:52<1:34:24,  1.51it/s]

EarlyStopping counter: 142 out of 10000


Epoch 40: CE 0.509085:  16%|██▏           | 1501/9541 [16:19<1:24:04,  1.59it/s]

EarlyStopping counter: 143 out of 10000


Epoch 40: CE 0.508945:  21%|██▉           | 2001/9541 [21:44<1:20:24,  1.56it/s]

EarlyStopping counter: 144 out of 10000


Epoch 40: CE 0.507622:  26%|███▋          | 2501/9541 [27:08<1:16:53,  1.53it/s]

EarlyStopping counter: 145 out of 10000


Epoch 40: CE 0.507664:  31%|████▍         | 3001/9541 [32:35<1:11:30,  1.52it/s]

EarlyStopping counter: 146 out of 10000


Epoch 40: CE 0.506726:  37%|█████▏        | 3501/9541 [38:01<1:05:16,  1.54it/s]

EarlyStopping counter: 147 out of 10000


Epoch 40: CE 0.506614:  42%|█████▊        | 4001/9541 [43:25<1:02:56,  1.47it/s]

EarlyStopping counter: 148 out of 10000


Epoch 40: CE 0.506765:  47%|███████▌        | 4501/9541 [48:49<54:49,  1.53it/s]

EarlyStopping counter: 149 out of 10000


Epoch 40: CE 0.506573:  52%|████████▍       | 5001/9541 [54:15<49:07,  1.54it/s]

EarlyStopping counter: 150 out of 10000


Epoch 40: CE 0.506879:  58%|█████████▏      | 5501/9541 [59:40<42:07,  1.60it/s]

EarlyStopping counter: 151 out of 10000


Epoch 40: CE 0.507040:  63%|████████▊     | 6001/9541 [1:05:05<40:58,  1.44it/s]

EarlyStopping counter: 152 out of 10000


Epoch 40: CE 0.507142:  68%|█████████▌    | 6501/9541 [1:10:30<32:10,  1.57it/s]

EarlyStopping counter: 153 out of 10000


Epoch 40: CE 0.506957:  73%|██████████▎   | 7001/9541 [1:15:55<27:24,  1.54it/s]

EarlyStopping counter: 154 out of 10000


Epoch 40: CE 0.506937:  79%|███████████   | 7501/9541 [1:21:23<22:49,  1.49it/s]

EarlyStopping counter: 155 out of 10000


Epoch 40: CE 0.506988:  84%|███████████▋  | 8001/9541 [1:26:49<16:24,  1.56it/s]

EarlyStopping counter: 156 out of 10000


Epoch 40: CE 0.507315:  88%|████████████▎ | 8367/9541 [1:30:49<12:51,  1.52it/s]