In [1]:
%load_ext autoreload
%autoreload 2

In [2]:
import json
import numpy as np
from torch.utils.data import Dataset, DataLoader
import glob
import wandb
import os
import torch.optim as optimizers

In [3]:
import dfs_code
from torch_geometric.data import InMemoryDataset, Data
import pickle
import torch
import torch.nn as nn
import tqdm
import copy
import pandas as pd
#torch.multiprocessing.set_sharing_strategy('file_system') # this is important on local machine
#def set_worker_sharing_strategy(worker_id: int) -> None:
#    torch.multiprocessing.set_sharing_strategy('file_system')

In [4]:
import sys
sys.path = ['../../src'] + sys.path
from dfs_transformer import EarlyStopping, DFSCodeSeq2SeqFC

2021-08-25 15:27:51.412107: W tensorflow/stream_executor/platform/default/dso_loader.cc:64] Could not load dynamic library 'libcudart.so.11.0'; dlerror: libcudart.so.11.0: cannot open shared object file: No such file or directory
2021-08-25 15:27:51.412135: I tensorflow/stream_executor/cuda/cudart_stub.cc:29] Ignore above cudart dlerror if you do not have a GPU set up on your machine.


In [5]:
wandb.init(project='chembl', entity='chrisxx')

config = wandb.config
config.n_atoms = 118
config.n_bonds = 4
config.emb_dim = 120
config.nhead = 12
config.nlayers = 6
config.max_nodes = 400
config.max_edges = 600
config.dim_feedforward = 2048
config.lr = 0.0003
config.n_epochs = 10000
config.lr_adjustment_period = 500
config.patience = 5
config.factor = 0.96
config.minimal_lr = 6e-8
config.target_idx = 7
config.batch_size = 200
config.valid_patience = 100
config.valid_minimal_improvement=0.00
config.model_dir = '../../models/chembl/better_transformer/medium/'
config.data_dir = "/mnt/project/chembl/ChEMBL100_noH/"
config.num_workers = 0
config.prefetch_factor = 2
config.persistent_workers = False
config.load_last = False


[34m[1mwandb[0m: Currently logged in as: [33mchrisxx[0m (use `wandb login --relogin` to force relogin)
[34m[1mwandb[0m: wandb version 0.12.0 is available!  To upgrade, please run:
[34m[1mwandb[0m:  $ pip install wandb --upgrade
2021-08-25 15:28:04.084136: W tensorflow/stream_executor/platform/default/dso_loader.cc:64] Could not load dynamic library 'libcudart.so.11.0'; dlerror: libcudart.so.11.0: cannot open shared object file: No such file or directory
2021-08-25 15:28:04.084163: I tensorflow/stream_executor/cuda/cudart_stub.cc:29] Ignore above cudart dlerror if you do not have a GPU set up on your machine.


In [6]:
os.makedirs(config.model_dir, exist_ok=True)

In [7]:
torch.multiprocessing.get_all_sharing_strategies()

{'file_descriptor', 'file_system'}

In [8]:
path = config.data_dir

In [9]:
class ChEMBL(InMemoryDataset):
    def __init__(self, fname):
        super().__init__()
        self.data, self.slices = torch.load(fname)

class ChEMBL100NoH(Dataset):
    """ChEMBL dataset of molecules and minimal DFS codes."""
    # create data structure that says which id is in which file...
    def __init__(self, path="/home/wendlerc/leq100_timeout60_sanity",
                       graph_pattern="/home/wendlerc/ChEMBL/preprocessedNoHs_split%d.pt", 
                       csv_file="/home/wendlerc/ChEMBL/small_molecules.csv", 
                       idx_max=64,
                       transform=None):
        self.path = path
        self.fnames = glob.glob(path+"CHEMBL*.pkl")
        self.data = []
        self.csv_file = csv_file
        self.path = path
        self.graph_pattern = graph_pattern 
        self.idx_max = idx_max
        self.prepare()
        
        
    def prepare(self):
        codes_all = {}
        for i in tqdm.tqdm(range(self.idx_max)):
            with open(self.path+"/%d/min_dfs_codes_split%d.json"%(i+1, i), 'r') as f:
                codes = json.load(f)
                for key, val in codes.items():
                    codes_all[key] = val
        graph_pattern = self.graph_pattern
        df = pd.read_csv(self.csv_file, delimiter=';', low_memory=False)
        chembl2smiles = {cid:smiles for cid, smiles in zip(df['ChEMBL ID'], df['Smiles'])}
        for i in range(self.idx_max):
            dataset = ChEMBL(graph_pattern%i)
            print(i)
            for data in tqdm.tqdm(dataset):
                if data.name in codes_all:
                    code = codes_all[data.name]
                    d = {'x':data.x.numpy(),
                          'z':data.z.numpy(),
                          'edge_attr': data.edge_attr.numpy(),
                          'edge_index': data.edge_index.numpy(),
                          'name':data.name,
                          'min_dfs_code': np.asarray(code['min_dfs_code']),
                          'min_dfs_index': np.asarray(code['dfs_index']),
                          'smiles': chembl2smiles[data.name]}
                    data_ = Data(x=torch.tensor(d['x']),
                                z=torch.tensor(d['z']),
                                edge_attr=torch.tensor(d['edge_attr']),
                                edge_index=torch.tensor(d['edge_index'], dtype=torch.long),
                                name=d['name'],
                                min_dfs_code=torch.tensor(d['min_dfs_code']),
                                min_dfs_index=torch.tensor(d['min_dfs_index'], dtype=torch.long),
                                smiles=d['smiles'])
                    self.data += [data_]   
            del dataset
        
    def __len__(self):
        return len(self.data)

    def __getitem__(self, idx):
        return self.data[idx]

In [10]:
def collate_fn(dlist):
    x_batch = [] 
    z_batch = []
    edge_attr_batch = []
    rnd_code_batch = []
    min_code_batch = []
    for d in dlist:
        rnd_code, rnd_index = dfs_code.rnd_dfs_code_from_torch_geometric(d, 
                                                                         d.z.numpy().tolist(), 
                                                                         np.argmax(d.edge_attr.numpy(), axis=1))
        x_batch += [d.x]
        z_batch += [d.z]#[nn.functional.one_hot(d.z, 118)]#118 elements in periodic table
        edge_attr_batch += [d.edge_attr]
        rnd_code_batch += [torch.tensor(rnd_code)]
        min_code_batch += [d.min_dfs_code]
    return rnd_code_batch, x_batch, z_batch, edge_attr_batch, min_code_batch

In [11]:
ngpu=1
device = torch.device('cuda:0' if (torch.cuda.is_available() and ngpu > 0) else 'cpu')

In [12]:
dataset = ChEMBL100NoH(idx_max=64)

100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 64/64 [02:21<00:00,  2.22s/it]


0


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5408.88it/s]


1


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5235.99it/s]


2


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5350.70it/s]


3


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5300.44it/s]


4


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5221.69it/s]


5


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5155.99it/s]


6


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5085.51it/s]


7


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5176.90it/s]


8


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5213.80it/s]


9


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5103.70it/s]


10


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5204.09it/s]


11


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5207.74it/s]


12


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5044.08it/s]


13


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5119.92it/s]


14


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5124.63it/s]


15


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5129.27it/s]


16


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5160.79it/s]


17


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5128.33it/s]


18


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5122.37it/s]


19


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5177.04it/s]


20


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5216.10it/s]


21


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5184.11it/s]


22


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5210.71it/s]


23


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29917/29917 [00:05<00:00, 5176.27it/s]


24


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5183.59it/s]


25


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5144.34it/s]


26


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5127.05it/s]


27


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5181.42it/s]


28


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5075.90it/s]


29


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5208.81it/s]


30


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:37<00:00, 804.69it/s]


31


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 4994.19it/s]


32


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5013.19it/s]


33


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5083.81it/s]


34


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5296.80it/s]


35


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5118.22it/s]


36


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:06<00:00, 4965.00it/s]


37


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5159.60it/s]


38


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5255.55it/s]


39


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5179.63it/s]


40


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5158.95it/s]


41


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5263.58it/s]


42


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5189.88it/s]


43


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5214.19it/s]


44


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5277.21it/s]


45


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5253.93it/s]


46


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5164.41it/s]


47


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5298.17it/s]


48


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5256.94it/s]


49


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5285.53it/s]


50


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5276.20it/s]


51


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5309.26it/s]


52


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5280.47it/s]


53


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5101.75it/s]


54


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5092.19it/s]


55


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5244.03it/s]


56


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5226.14it/s]


57


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5221.82it/s]


58


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5236.53it/s]


59


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5145.03it/s]


60


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5145.51it/s]


61


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:06<00:00, 4691.68it/s]


62


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5114.75it/s]


63


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 29916/29916 [00:05<00:00, 5161.77it/s]


In [13]:
loader = DataLoader(dataset, batch_size=config.batch_size, shuffle=True, pin_memory=False, collate_fn=collate_fn,
                   num_workers=config.num_workers, prefetch_factor=config.prefetch_factor, 
                    persistent_workers=config.persistent_workers)

In [14]:
to_cuda = lambda T: [t.to(device) for t in T]

In [15]:
model = DFSCodeSeq2SeqFC(n_atoms=config.n_atoms,
                         n_bonds=config.n_bonds, 
                         emb_dim=config.emb_dim, 
                         nhead=config.nhead, 
                         nlayers=config.nlayers, 
                         max_nodes=config.max_nodes, 
                         max_edges=config.max_edges,
                         atom_encoder=nn.Embedding(config.n_atoms, config.emb_dim), 
                         bond_encoder=nn.Linear(config.n_bonds, config.emb_dim))

In [16]:
if config.load_last:
    model.load_state_dict(torch.load(config.model_dir+'checkpoint.pt'))

In [17]:
optim = optimizers.Adam(model.parameters(), lr=config.lr)

#lr_scheduler = optimizers.lr_scheduler.ReduceLROnPlateau(optim, mode='min', verbose=True, patience=config.patience, factor=config.factor)
lr_scheduler = optimizers.lr_scheduler.ExponentialLR(optim, gamma=config.factor)

early_stopping = EarlyStopping(patience=config.valid_patience, delta=config.valid_minimal_improvement,
                              path=config.model_dir+'checkpoint.pt')
bce = torch.nn.BCEWithLogitsLoss()
ce = torch.nn.CrossEntropyLoss(ignore_index=-1)
softmax = nn.Softmax(dim=2)

In [18]:
model.to(device)

DFSCodeSeq2SeqFC(
  (encoder): DFSCodeEncoder(
    (emb_dfs): PositionalEncoding(
      (dropout): Dropout(p=0, inplace=False)
    )
    (emb_seq): PositionalEncoding(
      (dropout): Dropout(p=0.1, inplace=False)
    )
    (emb_atom): Embedding(118, 120)
    (emb_bond): Linear(in_features=4, out_features=120, bias=True)
    (mixer): Linear(in_features=600, out_features=600, bias=True)
    (enc): TransformerEncoder(
      (layers): ModuleList(
        (0): TransformerEncoderLayer(
          (self_attn): MultiheadAttention(
            (out_proj): NonDynamicallyQuantizableLinear(in_features=600, out_features=600, bias=True)
          )
          (linear1): Linear(in_features=600, out_features=2048, bias=True)
          (dropout): Dropout(p=0.1, inplace=False)
          (linear2): Linear(in_features=2048, out_features=600, bias=True)
          (norm1): LayerNorm((600,), eps=1e-05, elementwise_affine=True)
          (norm2): LayerNorm((600,), eps=1e-05, elementwise_affine=True)
         

In [None]:
try:
    for epoch in range(config.n_epochs):  
        epoch_loss = 0
        pbar = tqdm.tqdm(loader)
        for i, data in enumerate(pbar):
            optim.zero_grad()
            rndc, x, z, eattr, minc = data
            rndc = to_cuda(rndc)
            z = to_cuda(z)
            eattr = to_cuda(eattr)
            minc = to_cuda(minc)
            #prepare labels
            minc = [torch.cat((c, (-1)*torch.ones((1, 8), dtype=torch.long, device=device)), dim=0) for c in minc]
            minc_seq = nn.utils.rnn.pad_sequence(minc, padding_value=-1)
            
            #prediction
            dfs1, dfs2, atm1, atm2, bnd, eos = model(rndc, z, eattr)
            eos_label = (minc_seq[:,:,0] == (-1))
            loss = ce(torch.reshape(dfs1, (-1, config.max_nodes)), minc_seq[:, :, 0].view(-1)) 
            loss += ce(torch.reshape(dfs2, (-1, config.max_nodes)), minc_seq[:, :, 1].view(-1))
            loss += ce(torch.reshape(atm1, (-1, config.n_atoms)), minc_seq[:, :, 2].view(-1))
            loss += ce(torch.reshape(bnd, (-1, config.n_bonds)), minc_seq[:, :, 3].view(-1))
            loss += ce(torch.reshape(atm2, (-1, config.n_atoms)), minc_seq[:, :, 4].view(-1))
            loss += bce(eos, torch.unsqueeze(eos_label.float(), -1))
            
            loss.backward()
            torch.nn.utils.clip_grad_norm_(model.parameters(), 0.5)
            optim.step()
            epoch_loss = (epoch_loss*i + loss.item())/(i+1)
            
            curr_lr = list(optim.param_groups)[0]['lr']
            wandb.log({'loss':epoch_loss, 
                   'learning rate':curr_lr})
            pbar.set_description('Epoch %d: CE %2.6f'%(epoch+1, epoch_loss))
            
            if i % config.lr_adjustment_period == 0:
                early_stopping(epoch_loss, model)
                
        lr_scheduler.step()#(epoch_loss)
        
        if early_stopping.early_stop:
            break

        if curr_lr < config.minimal_lr:
            break

except KeyboardInterrupt:
    torch.save(model.state_dict(), config.model_dir+'_keyboardinterrupt.pt')
    print('keyboard interrupt caught')


Epoch 1: CE 3.797605: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:44:24<00:00,  1.52it/s]
Epoch 2: CE 2.839109: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:57<00:00,  1.53it/s]
Epoch 3: CE 2.843090:   0%|                                                                                                                                                                               | 1/9541 [00:00<2:17:20,  1.16it/s]

EarlyStopping counter: 1 out of 100


Epoch 3: CE 2.390885: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:43:42<00:00,  1.53it/s]
Epoch 4: CE 2.203739:   5%|█████████                                                                                                                                                                    | 501/9541 [05:24<1:38:12,  1.53it/s]

EarlyStopping counter: 1 out of 100


Epoch 4: CE 2.194216:  10%|██████████████████                                                                                                                                                          | 1001/9541 [10:46<1:34:14,  1.51it/s]

EarlyStopping counter: 2 out of 100


Epoch 4: CE 2.184312:  16%|███████████████████████████                                                                                                                                                 | 1501/9541 [16:08<1:25:07,  1.57it/s]

EarlyStopping counter: 3 out of 100


Epoch 4: CE 2.176811:  21%|████████████████████████████████████                                                                                                                                        | 2001/9541 [21:32<1:20:24,  1.56it/s]

EarlyStopping counter: 4 out of 100


Epoch 4: CE 2.169277:  26%|█████████████████████████████████████████████                                                                                                                               | 2501/9541 [26:56<1:14:32,  1.57it/s]

EarlyStopping counter: 5 out of 100


Epoch 4: CE 2.163426:  31%|██████████████████████████████████████████████████████                                                                                                                      | 3001/9541 [32:19<1:10:35,  1.54it/s]

EarlyStopping counter: 6 out of 100


Epoch 4: CE 2.157232:  37%|███████████████████████████████████████████████████████████████                                                                                                             | 3501/9541 [37:43<1:03:01,  1.60it/s]

EarlyStopping counter: 7 out of 100


Epoch 4: CE 2.149911:  42%|████████████████████████████████████████████████████████████████████████▏                                                                                                   | 4001/9541 [43:05<1:01:35,  1.50it/s]

EarlyStopping counter: 8 out of 100


Epoch 4: CE 2.142215:  47%|██████████████████████████████████████████████████████████████████████████████████                                                                                            | 4501/9541 [48:28<56:38,  1.48it/s]

EarlyStopping counter: 9 out of 100


Epoch 4: CE 2.135956:  52%|███████████████████████████████████████████████████████████████████████████████████████████▏                                                                                  | 5001/9541 [53:49<49:05,  1.54it/s]

EarlyStopping counter: 10 out of 100


Epoch 4: CE 2.129710:  58%|████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                         | 5501/9541 [59:39<44:32,  1.51it/s]

EarlyStopping counter: 11 out of 100


Epoch 4: CE 2.122998:  63%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                               | 6001/9541 [1:05:08<38:19,  1.54it/s]

EarlyStopping counter: 12 out of 100


Epoch 4: CE 2.115400:  68%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                      | 6501/9541 [1:10:37<33:20,  1.52it/s]

EarlyStopping counter: 13 out of 100


Epoch 4: CE 2.107924:  73%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                             | 7001/9541 [1:16:04<27:12,  1.56it/s]

EarlyStopping counter: 14 out of 100


Epoch 4: CE 2.101866:  79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                    | 7501/9541 [1:21:34<22:23,  1.52it/s]

EarlyStopping counter: 15 out of 100


Epoch 4: CE 2.094672:  84%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                           | 8001/9541 [1:27:03<17:10,  1.49it/s]

EarlyStopping counter: 16 out of 100


Epoch 4: CE 2.076419: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:44:16<00:00,  1.52it/s]
Epoch 5: CE 1.933509:  10%|██████████████████                                                                                                                                                          | 1001/9541 [10:59<1:32:39,  1.54it/s]

EarlyStopping counter: 1 out of 100


Epoch 5: CE 1.861822: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:44:29<00:00,  1.52it/s]
Epoch 6: CE 1.766372:   5%|█████████                                                                                                                                                                    | 501/9541 [05:30<1:36:58,  1.55it/s]

EarlyStopping counter: 1 out of 100


Epoch 6: CE 1.763046:  10%|██████████████████                                                                                                                                                          | 1001/9541 [10:59<1:34:47,  1.50it/s]

EarlyStopping counter: 2 out of 100


Epoch 6: CE 1.706399: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:44:25<00:00,  1.52it/s]
Epoch 7: CE 1.580629: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:45:15<00:00,  1.51it/s]
Epoch 8: CE 1.501717:   5%|█████████                                                                                                                                                                    | 501/9541 [05:29<1:40:01,  1.51it/s]

EarlyStopping counter: 1 out of 100


Epoch 8: CE 1.503493:  10%|██████████████████                                                                                                                                                          | 1001/9541 [10:58<1:33:06,  1.53it/s]

EarlyStopping counter: 2 out of 100


Epoch 8: CE 1.501044:  16%|███████████████████████████                                                                                                                                                 | 1501/9541 [16:28<1:28:16,  1.52it/s]

EarlyStopping counter: 3 out of 100


Epoch 8: CE 1.500406:  21%|████████████████████████████████████                                                                                                                                        | 2001/9541 [21:56<1:24:34,  1.49it/s]

EarlyStopping counter: 4 out of 100


Epoch 8: CE 1.497213:  26%|█████████████████████████████████████████████                                                                                                                               | 2501/9541 [27:23<1:16:21,  1.54it/s]

EarlyStopping counter: 5 out of 100


Epoch 8: CE 1.495574:  31%|██████████████████████████████████████████████████████                                                                                                                      | 3001/9541 [32:51<1:12:19,  1.51it/s]

EarlyStopping counter: 6 out of 100


Epoch 8: CE 1.491700:  37%|███████████████████████████████████████████████████████████████                                                                                                             | 3501/9541 [38:20<1:08:05,  1.48it/s]

EarlyStopping counter: 7 out of 100


Epoch 8: CE 1.488392:  42%|████████████████████████████████████████████████████████████████████████▉                                                                                                     | 4001/9541 [43:46<58:29,  1.58it/s]

EarlyStopping counter: 8 out of 100


Epoch 8: CE 1.486113:  47%|██████████████████████████████████████████████████████████████████████████████████                                                                                            | 4501/9541 [49:13<54:04,  1.55it/s]

EarlyStopping counter: 9 out of 100


Epoch 8: CE 1.484077:  52%|███████████████████████████████████████████████████████████████████████████████████████████▏                                                                                  | 5001/9541 [54:44<51:23,  1.47it/s]

EarlyStopping counter: 10 out of 100


Epoch 8: CE 1.482265:  58%|███████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                        | 5501/9541 [1:00:10<45:08,  1.49it/s]

EarlyStopping counter: 11 out of 100


Epoch 8: CE 1.480153:  63%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                               | 6001/9541 [1:05:36<37:16,  1.58it/s]

EarlyStopping counter: 12 out of 100


Epoch 8: CE 1.478572:  68%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                      | 6501/9541 [1:11:16<34:27,  1.47it/s]

EarlyStopping counter: 13 out of 100


Epoch 8: CE 1.476847:  73%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                             | 7001/9541 [1:16:43<27:23,  1.55it/s]

EarlyStopping counter: 14 out of 100


Epoch 8: CE 1.475321:  79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                    | 7501/9541 [1:22:11<21:34,  1.58it/s]

EarlyStopping counter: 15 out of 100


Epoch 8: CE 1.474539:  84%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                           | 8001/9541 [1:27:40<18:10,  1.41it/s]

EarlyStopping counter: 16 out of 100


Epoch 8: CE 1.472981:  89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:33:08<11:42,  1.48it/s]

EarlyStopping counter: 17 out of 100


Epoch 8: CE 1.472046:  94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:38:36<05:57,  1.51it/s]

EarlyStopping counter: 18 out of 100


Epoch 8: CE 1.470097: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:44:04<00:26,  1.50it/s]

EarlyStopping counter: 19 out of 100


Epoch 8: CE 1.469868: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:44:30<00:00,  1.52it/s]
Epoch 9: CE 1.411146:   5%|█████████                                                                                                                                                                    | 501/9541 [05:29<1:40:22,  1.50it/s]

EarlyStopping counter: 1 out of 100


Epoch 9: CE 1.411221:  10%|██████████████████                                                                                                                                                          | 1001/9541 [10:58<1:33:11,  1.53it/s]

EarlyStopping counter: 2 out of 100


Epoch 9: CE 1.412126:  16%|███████████████████████████                                                                                                                                                 | 1501/9541 [16:25<1:27:01,  1.54it/s]

EarlyStopping counter: 3 out of 100


Epoch 9: CE 1.411781:  21%|████████████████████████████████████                                                                                                                                        | 2001/9541 [21:53<1:22:38,  1.52it/s]

EarlyStopping counter: 4 out of 100


Epoch 9: CE 1.411027:  26%|█████████████████████████████████████████████                                                                                                                               | 2501/9541 [27:21<1:22:07,  1.43it/s]

EarlyStopping counter: 5 out of 100


Epoch 9: CE 1.410065:  31%|██████████████████████████████████████████████████████                                                                                                                      | 3001/9541 [32:50<1:13:31,  1.48it/s]

EarlyStopping counter: 6 out of 100


Epoch 9: CE 1.408420:  37%|███████████████████████████████████████████████████████████████                                                                                                             | 3501/9541 [38:19<1:07:56,  1.48it/s]

EarlyStopping counter: 7 out of 100


Epoch 9: CE 1.407751:  42%|████████████████████████████████████████████████████████████████████████▏                                                                                                   | 4001/9541 [43:49<1:02:24,  1.48it/s]

EarlyStopping counter: 8 out of 100


Epoch 9: CE 1.405920:  47%|██████████████████████████████████████████████████████████████████████████████████                                                                                            | 4501/9541 [49:16<53:46,  1.56it/s]

EarlyStopping counter: 9 out of 100


Epoch 9: CE 1.404857:  52%|███████████████████████████████████████████████████████████████████████████████████████████▏                                                                                  | 5001/9541 [54:43<49:42,  1.52it/s]

EarlyStopping counter: 10 out of 100


Epoch 9: CE 1.403086:  58%|███████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                        | 5501/9541 [1:00:13<47:16,  1.42it/s]

EarlyStopping counter: 11 out of 100


Epoch 9: CE 1.401363:  63%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                               | 6001/9541 [1:05:43<39:14,  1.50it/s]

EarlyStopping counter: 12 out of 100


Epoch 9: CE 1.399754:  68%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                      | 6501/9541 [1:11:10<32:52,  1.54it/s]

EarlyStopping counter: 13 out of 100


Epoch 9: CE 1.397581:  73%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                             | 7001/9541 [1:16:40<28:46,  1.47it/s]

EarlyStopping counter: 14 out of 100


Epoch 9: CE 1.395800:  79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                    | 7501/9541 [1:22:09<22:18,  1.52it/s]

EarlyStopping counter: 15 out of 100


Epoch 9: CE 1.394906:  84%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                           | 8001/9541 [1:27:37<16:27,  1.56it/s]

EarlyStopping counter: 16 out of 100


Epoch 9: CE 1.393477:  89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:33:03<11:50,  1.46it/s]

EarlyStopping counter: 17 out of 100


Epoch 9: CE 1.392601:  94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:38:31<05:55,  1.52it/s]

EarlyStopping counter: 18 out of 100


Epoch 9: CE 1.391397: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:58<00:25,  1.56it/s]

EarlyStopping counter: 19 out of 100


Epoch 9: CE 1.391308: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:44:24<00:00,  1.52it/s]
Epoch 10: CE 1.348750:   5%|█████████                                                                                                                                                                   | 501/9541 [05:29<1:44:22,  1.44it/s]

EarlyStopping counter: 1 out of 100


Epoch 10: CE 1.341129:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [10:58<1:33:04,  1.53it/s]

EarlyStopping counter: 2 out of 100


Epoch 10: CE 1.336633:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:26<1:26:26,  1.55it/s]

EarlyStopping counter: 3 out of 100


Epoch 10: CE 1.335770:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:52<1:22:02,  1.53it/s]

EarlyStopping counter: 4 out of 100


Epoch 10: CE 1.335064:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:19<1:16:24,  1.54it/s]

EarlyStopping counter: 5 out of 100


Epoch 10: CE 1.334202:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:48<1:13:32,  1.48it/s]

EarlyStopping counter: 6 out of 100


Epoch 10: CE 1.331575:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [38:16<1:04:31,  1.56it/s]

EarlyStopping counter: 7 out of 100


Epoch 10: CE 1.329921:  42%|████████████████████████████████████████████████████████████████████████▌                                                                                                    | 4001/9541 [43:44<57:11,  1.61it/s]

EarlyStopping counter: 8 out of 100


Epoch 10: CE 1.327791:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [49:13<55:48,  1.51it/s]

EarlyStopping counter: 9 out of 100


Epoch 10: CE 1.326150:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:41<51:31,  1.47it/s]

EarlyStopping counter: 10 out of 100


Epoch 10: CE 1.325203:  58%|██████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                        | 5501/9541 [1:00:12<43:07,  1.56it/s]

EarlyStopping counter: 11 out of 100


Epoch 10: CE 1.324739:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:42<38:22,  1.54it/s]

EarlyStopping counter: 12 out of 100


Epoch 10: CE 1.323491:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:11:10<34:13,  1.48it/s]

EarlyStopping counter: 13 out of 100


Epoch 10: CE 1.322367:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:39<26:21,  1.61it/s]

EarlyStopping counter: 14 out of 100


Epoch 10: CE 1.321291:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:22:08<20:43,  1.64it/s]

EarlyStopping counter: 15 out of 100


Epoch 10: CE 1.319816:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:27:37<17:06,  1.50it/s]

EarlyStopping counter: 16 out of 100


Epoch 10: CE 1.318676:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:33:05<11:36,  1.49it/s]

EarlyStopping counter: 17 out of 100


Epoch 10: CE 1.317721:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:38:35<06:09,  1.46it/s]

EarlyStopping counter: 18 out of 100


Epoch 10: CE 1.316871: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:44:04<00:24,  1.65it/s]

EarlyStopping counter: 19 out of 100


Epoch 10: CE 1.316841: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:44:30<00:00,  1.52it/s]
Epoch 11: CE 1.272020:   5%|█████████                                                                                                                                                                   | 501/9541 [05:32<1:40:06,  1.51it/s]

EarlyStopping counter: 1 out of 100


Epoch 11: CE 1.269125:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [11:00<1:30:36,  1.57it/s]

EarlyStopping counter: 2 out of 100


Epoch 11: CE 1.264687:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:25<1:21:41,  1.64it/s]

EarlyStopping counter: 3 out of 100


Epoch 11: CE 1.262705:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:54<1:18:39,  1.60it/s]

EarlyStopping counter: 4 out of 100


Epoch 11: CE 1.263834:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:23<1:14:18,  1.58it/s]

EarlyStopping counter: 5 out of 100


Epoch 11: CE 1.264472:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:48<1:09:35,  1.57it/s]

EarlyStopping counter: 6 out of 100


Epoch 11: CE 1.263924:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [38:15<1:07:14,  1.50it/s]

EarlyStopping counter: 7 out of 100


Epoch 11: CE 1.262712:  42%|███████████████████████████████████████████████████████████████████████▋                                                                                                   | 4001/9541 [43:42<1:03:20,  1.46it/s]

EarlyStopping counter: 8 out of 100


Epoch 11: CE 1.261453:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [49:11<53:19,  1.58it/s]

EarlyStopping counter: 9 out of 100


Epoch 11: CE 1.261535:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:39<48:40,  1.55it/s]

EarlyStopping counter: 10 out of 100


Epoch 11: CE 1.261241:  58%|██████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                        | 5501/9541 [1:00:08<46:22,  1.45it/s]

EarlyStopping counter: 11 out of 100


Epoch 11: CE 1.259996:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:38<39:36,  1.49it/s]

EarlyStopping counter: 12 out of 100


Epoch 11: CE 1.258418:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:11:06<33:58,  1.49it/s]

EarlyStopping counter: 13 out of 100


Epoch 11: CE 1.257205:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:34<27:19,  1.55it/s]

EarlyStopping counter: 14 out of 100


Epoch 11: CE 1.256413:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:22:03<22:30,  1.51it/s]

EarlyStopping counter: 15 out of 100


Epoch 11: CE 1.255021:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:27:31<17:21,  1.48it/s]

EarlyStopping counter: 16 out of 100


Epoch 11: CE 1.254165:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:33:01<11:26,  1.51it/s]

EarlyStopping counter: 17 out of 100


Epoch 11: CE 1.253186:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:38:30<05:43,  1.57it/s]

EarlyStopping counter: 18 out of 100


Epoch 11: CE 1.252785: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:44:00<00:26,  1.52it/s]

EarlyStopping counter: 19 out of 100


Epoch 11: CE 1.252682: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:44:26<00:00,  1.52it/s]
Epoch 12: CE 1.222600:   0%|                                                                                                                                                                              | 1/9541 [00:00<2:09:31,  1.23it/s]

EarlyStopping counter: 20 out of 100


Epoch 12: CE 1.217329:   5%|█████████                                                                                                                                                                   | 501/9541 [05:29<1:44:27,  1.44it/s]

EarlyStopping counter: 21 out of 100


Epoch 12: CE 1.206808:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [10:56<1:32:45,  1.53it/s]

EarlyStopping counter: 22 out of 100


Epoch 12: CE 1.204374:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:23<1:27:24,  1.53it/s]

EarlyStopping counter: 23 out of 100


Epoch 12: CE 1.203400:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:53<1:18:07,  1.61it/s]

EarlyStopping counter: 24 out of 100


Epoch 12: CE 1.203753:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:21<1:20:21,  1.46it/s]

EarlyStopping counter: 25 out of 100


Epoch 12: CE 1.203285:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:49<1:14:42,  1.46it/s]

EarlyStopping counter: 26 out of 100


Epoch 12: CE 1.202914:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [38:19<1:07:30,  1.49it/s]

EarlyStopping counter: 27 out of 100


Epoch 12: CE 1.202205:  42%|███████████████████████████████████████████████████████████████████████▋                                                                                                   | 4001/9541 [43:48<1:00:09,  1.53it/s]

EarlyStopping counter: 28 out of 100


Epoch 12: CE 1.201308:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [49:17<52:55,  1.59it/s]

EarlyStopping counter: 29 out of 100


Epoch 12: CE 1.200522:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:48<51:22,  1.47it/s]

EarlyStopping counter: 30 out of 100


Epoch 12: CE 1.200702:  58%|██████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                        | 5501/9541 [1:00:14<46:03,  1.46it/s]

EarlyStopping counter: 31 out of 100


Epoch 12: CE 1.199445:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:41<39:37,  1.49it/s]

EarlyStopping counter: 32 out of 100


Epoch 12: CE 1.198940:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:11:08<33:13,  1.53it/s]

EarlyStopping counter: 33 out of 100


Epoch 12: CE 1.198353:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:38<27:51,  1.52it/s]

EarlyStopping counter: 34 out of 100


Epoch 12: CE 1.197920:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:22:19<22:21,  1.52it/s]

EarlyStopping counter: 35 out of 100


Epoch 12: CE 1.197241:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:27:50<16:48,  1.53it/s]

EarlyStopping counter: 36 out of 100


Epoch 12: CE 1.196639:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:33:16<11:38,  1.49it/s]

EarlyStopping counter: 37 out of 100


Epoch 12: CE 1.195793:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:38:45<05:40,  1.59it/s]

EarlyStopping counter: 38 out of 100


Epoch 12: CE 1.195161: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:44:12<00:25,  1.59it/s]

EarlyStopping counter: 39 out of 100


Epoch 12: CE 1.195212: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:44:39<00:00,  1.52it/s]
Epoch 13: CE 1.328125:   0%|                                                                                                                                                                              | 1/9541 [00:00<1:59:16,  1.33it/s]

EarlyStopping counter: 40 out of 100


Epoch 13: CE 1.160680:   5%|█████████                                                                                                                                                                   | 501/9541 [05:29<1:44:33,  1.44it/s]

EarlyStopping counter: 41 out of 100


Epoch 13: CE 1.160776:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [10:56<1:35:19,  1.49it/s]

EarlyStopping counter: 42 out of 100


Epoch 13: CE 1.157998:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:23<1:28:02,  1.52it/s]

EarlyStopping counter: 43 out of 100


Epoch 13: CE 1.157035:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:53<1:24:49,  1.48it/s]

EarlyStopping counter: 44 out of 100


Epoch 13: CE 1.155136:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:21<1:18:38,  1.49it/s]

EarlyStopping counter: 45 out of 100


Epoch 13: CE 1.153819:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:50<1:14:45,  1.46it/s]

EarlyStopping counter: 46 out of 100


Epoch 13: CE 1.152933:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [38:19<1:05:31,  1.54it/s]

EarlyStopping counter: 47 out of 100


Epoch 13: CE 1.152680:  42%|███████████████████████████████████████████████████████████████████████▋                                                                                                   | 4001/9541 [43:47<1:02:33,  1.48it/s]

EarlyStopping counter: 48 out of 100


Epoch 13: CE 1.152663:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [49:17<55:42,  1.51it/s]

EarlyStopping counter: 49 out of 100


Epoch 13: CE 1.152088:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:45<51:57,  1.46it/s]

EarlyStopping counter: 50 out of 100


Epoch 13: CE 1.150864:  58%|██████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                        | 5501/9541 [1:00:13<44:57,  1.50it/s]

EarlyStopping counter: 51 out of 100


Epoch 13: CE 1.150533:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:40<36:30,  1.62it/s]

EarlyStopping counter: 52 out of 100


Epoch 13: CE 1.149869:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:11:09<32:26,  1.56it/s]

EarlyStopping counter: 53 out of 100


Epoch 13: CE 1.149101:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:35<27:42,  1.53it/s]

EarlyStopping counter: 54 out of 100


Epoch 13: CE 1.148574:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:22:04<22:17,  1.52it/s]

EarlyStopping counter: 55 out of 100


Epoch 13: CE 1.147651:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:27:32<17:12,  1.49it/s]

EarlyStopping counter: 56 out of 100


Epoch 13: CE 1.147139:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:33:02<11:30,  1.51it/s]

EarlyStopping counter: 57 out of 100


Epoch 13: CE 1.146543:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:38:31<05:54,  1.52it/s]

EarlyStopping counter: 58 out of 100


Epoch 13: CE 1.145494: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:59<00:25,  1.54it/s]

EarlyStopping counter: 59 out of 100


Epoch 13: CE 1.145447: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:44:25<00:00,  1.52it/s]
Epoch 14: CE 1.123714:   5%|█████████                                                                                                                                                                   | 501/9541 [05:28<1:35:21,  1.58it/s]

EarlyStopping counter: 1 out of 100


Epoch 14: CE 1.119869:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [10:57<1:29:46,  1.59it/s]

EarlyStopping counter: 2 out of 100


Epoch 14: CE 1.117306:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:24<1:24:40,  1.58it/s]

EarlyStopping counter: 3 out of 100


Epoch 14: CE 1.115758:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:53<1:21:56,  1.53it/s]

EarlyStopping counter: 4 out of 100


Epoch 14: CE 1.114653:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:22<1:13:16,  1.60it/s]

EarlyStopping counter: 5 out of 100


Epoch 14: CE 1.113924:  31%|█████████████████████████████████████████████████████▊                                                                                                                     | 3001/9541 [32:49<1:09:58,  1.56it/s]

EarlyStopping counter: 6 out of 100


Epoch 14: CE 1.113425:  37%|██████████████████████████████████████████████████████████████▋                                                                                                            | 3501/9541 [38:16<1:04:51,  1.55it/s]

EarlyStopping counter: 7 out of 100


Epoch 14: CE 1.112222:  42%|███████████████████████████████████████████████████████████████████████▋                                                                                                   | 4001/9541 [43:44<1:02:00,  1.49it/s]

EarlyStopping counter: 8 out of 100


Epoch 14: CE 1.111761:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [49:13<54:44,  1.53it/s]

EarlyStopping counter: 9 out of 100


Epoch 14: CE 1.110414:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:40<50:38,  1.49it/s]

EarlyStopping counter: 10 out of 100


Epoch 14: CE 1.110674:  58%|██████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                        | 5501/9541 [1:00:09<42:56,  1.57it/s]

EarlyStopping counter: 11 out of 100


Epoch 14: CE 1.109614:  63%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 6001/9541 [1:05:37<41:04,  1.44it/s]

EarlyStopping counter: 12 out of 100


Epoch 14: CE 1.109469:  68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 6501/9541 [1:11:04<33:30,  1.51it/s]

EarlyStopping counter: 13 out of 100


Epoch 14: CE 1.109389:  73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 7001/9541 [1:16:35<28:46,  1.47it/s]

EarlyStopping counter: 14 out of 100


Epoch 14: CE 1.108660:  79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 7501/9541 [1:22:03<22:13,  1.53it/s]

EarlyStopping counter: 15 out of 100


Epoch 14: CE 1.107624:  84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                           | 8001/9541 [1:27:31<17:28,  1.47it/s]

EarlyStopping counter: 16 out of 100


Epoch 14: CE 1.106434:  89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                  | 8501/9541 [1:32:58<11:32,  1.50it/s]

EarlyStopping counter: 17 out of 100


Epoch 14: CE 1.105649:  94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 9001/9541 [1:38:28<05:44,  1.57it/s]

EarlyStopping counter: 18 out of 100


Epoch 14: CE 1.105197: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 9501/9541 [1:43:55<00:26,  1.53it/s]

EarlyStopping counter: 19 out of 100


Epoch 14: CE 1.105146: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 9541/9541 [1:44:21<00:00,  1.52it/s]
Epoch 15: CE 1.124084:   0%|                                                                                                                                                                              | 1/9541 [00:00<2:15:45,  1.17it/s]

EarlyStopping counter: 20 out of 100


Epoch 15: CE 1.072433:  10%|█████████████████▉                                                                                                                                                         | 1001/9541 [10:59<1:27:55,  1.62it/s]

EarlyStopping counter: 1 out of 100


Epoch 15: CE 1.073598:  16%|██████████████████████████▉                                                                                                                                                | 1501/9541 [16:27<1:29:21,  1.50it/s]

EarlyStopping counter: 2 out of 100


Epoch 15: CE 1.071992:  21%|███████████████████████████████████▊                                                                                                                                       | 2001/9541 [21:57<1:18:25,  1.60it/s]

EarlyStopping counter: 3 out of 100


Epoch 15: CE 1.071418:  26%|████████████████████████████████████████████▊                                                                                                                              | 2501/9541 [27:26<1:19:55,  1.47it/s]

EarlyStopping counter: 4 out of 100


Epoch 15: CE 1.068117:  42%|████████████████████████████████████████████████████████████████████████▌                                                                                                    | 4001/9541 [43:53<59:00,  1.56it/s]

EarlyStopping counter: 1 out of 100


Epoch 15: CE 1.068073:  47%|█████████████████████████████████████████████████████████████████████████████████▌                                                                                           | 4501/9541 [49:21<53:24,  1.57it/s]

EarlyStopping counter: 2 out of 100


Epoch 15: CE 1.067993:  52%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 5001/9541 [54:49<50:32,  1.50it/s]

EarlyStopping counter: 3 out of 100


Epoch 15: CE 1.067410:  57%|██████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                        | 5479/9541 [1:00:06<47:07,  1.44it/s]