In [123]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
import numpy as np
from torch.utils.data import Dataset, DataLoader, random_split

from rdkit import Chem
from rdkit.Chem import AllChem

from tqdm import tqdm

In [140]:
# Define a custom Dataset class
class BiMDataset(Dataset):
    def __init__(
        self, 
        data_items, 
        unique_bonds, 
        unique_atoms, 
        bond_neighbors, 
        max_neighbors, 
        max_bond_count, 
        b_lengths_mean, 
        b_lengths_std, 
        b_angles_mean, 
        b_angles_std, 
        targets_means, 
        targets_std
    ):
        self.data_list = data_items
        self.unique_bonds = unique_bonds
        self.unique_atoms = unique_atoms
        self.bond_neighbors = bond_neighbors
        
        self.max_neighbors = max_neighbors       
        self.max_bond_count = max_bond_count
        
        self.b_lengths_mean = b_lengths_mean
        self.b_lengths_std = b_lengths_std
        
        self.b_angles_mean = b_angles_mean
        self.b_angles_std = b_angles_std
        
        self.targets_means = targets_means
        self.targets_std = targets_std
        
        self.bond_to_id = {bond: (idx+1) for idx, bond in enumerate(self.unique_bonds)}
        self.id_to_bond = {(idx + 1): bond for idx, bond in enumerate(self.unique_bonds)}

        print(f"{self.max_bond_count=}")
        
    def __len__(self):
        # Returns the number of items in the dataset
        return len(self.data_list)

    def __normalized_bond_length__(self, b_length):
        return (b_length - self.b_lengths_mean) / self.b_lengths_std

    def __normalized_bond_angle__(self, b_angle):
        return (b_angle - self.b_angles_mean) / self.b_angles_std 

    def __normalized_bond_energy__(self, b_energy):
        return (b_energy - self.targets_means) / self.targets_std 
            
    def __prepare_data__(self, item):
        smiles = item.smiles  # SMILES representation of the molecule
        mol = Chem.MolFromSmiles(smiles, sanitize=False)
        Chem.SanitizeMol(mol) 
        mol = Chem.AddHs(mol)

        bond_types = []
        bond_lengths = []
        neighbor_infos = []

        target = self.__normalized_bond_energy__(item.y[0][7]) # Internal Energy
        
        for bond in mol.GetBonds():
            atom1 = bond.GetBeginAtom()
            atom2 = bond.GetEndAtom()
            sorted_bond = tuple(sorted([atom1.GetSymbol(), atom2.GetSymbol()]))
            
            curr_bond_length = self.bond_neighbors[smiles][sorted_bond]['length']
            n_infos          = self.bond_neighbors[smiles][sorted_bond]['neighbors']
            
            bond_types.append(self.bond_to_id[sorted_bond])
            bond_lengths.append(
                self.__normalized_bond_length__(curr_bond_length)
            )

            current_bonds_neighbor_infos = [
                (
                    self.bond_to_id[n_bond], 
                    self.__normalized_bond_length__(n_bond_length), 
                    self.__normalized_bond_angle__(n_bond_angle)
                ) for n_bond, n_bond_length, n_bond_angle in n_infos
            ]
            
            # print(f"{self.max_neighbors=}")
            padded_bonds = self.max_neighbors - len(n_infos)
            # print(f"padding required={padded_bonds}")
            current_bonds_neighbor_infos += [(0, 0, 0) for _ in range(padded_bonds)]
            neighbor_infos.append(current_bonds_neighbor_infos)
           
        bond_types_tensor = torch.tensor(bond_types, dtype=torch.float32)
        bond_lengths_tensor = torch.tensor(bond_lengths, dtype=torch.float32)
        neighbor_infos_tensor = torch.tensor(neighbor_infos, dtype=torch.float32) 
        
        pad_size = self.max_bond_count - neighbor_infos_tensor.size(0)
        
        padding_tensor = torch.zeros(pad_size, neighbor_infos_tensor.size(1), neighbor_infos_tensor.size(2))
        padded_neighbor_infos_tensor = torch.cat([neighbor_infos_tensor, padding_tensor], dim=0) 

        padding_tensor = torch.zeros(pad_size)
        padded_bond_types_tensor = torch.cat([bond_types_tensor, padding_tensor.clone().detach()], dim=0)
        padded_bond_lengths_tensor = torch.cat([bond_lengths_tensor, padding_tensor.clone().detach()], dim=0)
        
        # print(f"{padded_neighbor_infos_tensor.shape=}")
        return padded_bond_types_tensor, padded_bond_lengths_tensor, padded_neighbor_infos_tensor, target
        
    def __getitem__(self, idx):
        curr_item = self.data_list[idx]
        return self.__prepare_data__(curr_item)

In [141]:
LENGTH_DIM = 1
ANGLE_DIM  = 1

class BondEmbedding(nn.Module):
    
    def __init__(self, bond_type_size, embedding_dim=16, max_neighbors=6):
        super(BondEmbedding, self).__init__()
        self.bond_type_embedding = nn.Embedding(bond_type_size, embedding_dim)
        
        # Calculate the input dimension for the fully connected layer
        combined_input_dim = (
            (embedding_dim + LENGTH_DIM)  # Current Bond Info
          + (max_neighbors * (embedding_dim + LENGTH_DIM + ANGLE_DIM)) # Neighboring Bond Info
        )

        # print(f"{combined_input_dim=}")
        
        self.fc = nn.Linear(combined_input_dim, embedding_dim)
        self.embedding_dim = embedding_dim

        
    def forward(self, bond_types, bond_lengths, neighbor_bond_types, neighbor_bond_lengths, angles):
        # Bond type embedding: [batch_size, 1] -> [batch_size, embedding_dim]
        bond_type_emb = self.bond_type_embedding(bond_types)
        # Concatenate bond embedding with its length
        bond_info = torch.cat([bond_type_emb, bond_lengths.unsqueeze(-1)], dim=-1)  # Shape: [batch_size, embedding_dim + 1]
        
        # Neighbor bond type embedding: [batch_size, max_neighbors, 1] -> [batch_size, max_neighbors, embedding_dim]
        neighbor_bond_type_emb = self.bond_type_embedding(neighbor_bond_types)
        # Concatenate neighbor bond type embedding, lengths, and angles
        neighbor_info = torch.cat([neighbor_bond_type_emb, neighbor_bond_lengths.unsqueeze(-1), angles.unsqueeze(-1)], dim=-1)  # Shape: [batch_size, max_neighbors, embedding_dim + 1 + 1]

        # Flatten neighbor_info to handle variable number of neighbors
        neighbor_info = neighbor_info.view(bond_info.size(0), bond_info.size(1), -1)  # Flatten neighbors info
        
        # print(f"{neighbor_bond_type_emb.shape=}")
        # print(f"{neighbor_info.shape=} -- {bond_info.shape=}")
        # Combine bond info and neighbor info
        
        combined_info = torch.cat([bond_info, neighbor_info], dim=-1)  # Shape: [batch_size, embedding_dim + 1 + max_neighbors * (embedding_dim + 2)]
        # print(f"{combined_info.shape=}")
        # Pass through fully connected layer for final output
        output = self.fc(combined_info)
        
        return output

In [142]:
# # Path to the saved dataset
# dataset_file = './data/QM-9-BiM-Dataset.pt'

# # Load the saved dataset
# bim_dataset = torch.load(dataset_file)

In [143]:
# bim_dataloader = DataLoader(bim_dataset, batch_size=4, shuffle=False)
# # Verify that the dataset is loaded correctly
# print(f"Dataset loaded from {dataset_file}")


In [144]:
# neighbor_infos_tensor = neighbor_infos_tensor.permute((0, 2, 3, 1))
# neighbor_infos_tensor.shape

In [145]:
# bond_types_tensor, bond_lengths_tensor, neighbor_infos_tensor, target

In [146]:
# max_bond_count = bim_dataset.max_bond_count
# max_neighbors  = bim_dataset.max_neighbors 
# unique_bond_count = len(bim_dataset.unique_bonds) + 1
# # max_bond_count, max_neighbors, unique_bond_count

In [147]:
# bond_embedding = BondEmbedding(
#     bond_type_size = unique_bond_count, 
#     embedding_dim  = 16, 
#     max_neighbors  = max_neighbors
# )
# neighbor_infos_tensor[:,:,:,0].shape, neighbor_infos_tensor[:,:,:,1].shape, neighbor_infos_tensor[:,:,:,2].shape
# output_emb = bond_embedding(
#     bond_types_tensor.to(torch.long), 
#     bond_lengths_tensor, 
#     neighbor_infos_tensor[:,:,:,0].to(torch.long), 
#     neighbor_infos_tensor[:,:,:,1], 
#     neighbor_infos_tensor[:,:,:,2]
# )

In [148]:
class BondSubnetwork(nn.Module):
    def __init__(self, input_dim, hidden_dim=1000, output_dim=1):
        super(BondSubnetwork, self).__init__()
        self.fc1 = nn.Linear(input_dim, hidden_dim)
        self.fc2 = nn.Linear(hidden_dim, hidden_dim)
        self.fc3 = nn.Linear(hidden_dim, output_dim)

    def forward(self, x):
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

In [149]:
class BiMNetwork(nn.Module):
    def __init__(self, bond_type_size, embedding_dim, max_neighbors, max_bond_count):
        super(BiMNetwork, self).__init__()
        self.bond_embedding = BondEmbedding(bond_type_size, embedding_dim, max_neighbors)
        self.subnetworks = nn.ModuleList([
            BondSubnetwork(input_dim = self.bond_embedding.embedding_dim) for _ in range(bond_type_size)
        ])

    def forward(self, bond_types, bond_lengths, neighbor_bond_types, neighbor_bond_lengths, angles):
        bond_embeddings = self.bond_embedding(
            bond_types, 
            bond_lengths, 
            neighbor_bond_types, 
            neighbor_bond_lengths, 
            angles
        )  # [batch_size, max_bond_count, embedding_dim]

        batch_size, max_bond_count, embedding_dim = bond_embeddings.size()
        energy_per_bond = torch.zeros(batch_size, max_bond_count, device=bond_embeddings.device)
        
        for bond_type in range(len(self.subnetworks)):
            mask = (bond_types == bond_type).float().unsqueeze(-1)   # [batch_size, max_bond_count, 1]
            bond_energy = self.subnetworks[bond_type](bond_embeddings).squeeze(-1)  # [batch_size, max_bond_count]
            energy_per_bond += mask.squeeze(-1) * bond_energy       # Element-wise multiplication and aggregation
    
        molecule_energy = energy_per_bond.sum(dim=-1, keepdim=True) # [batch_size, 1]
        return molecule_energy

In [150]:
# energy_pred = bim_net(
#     bond_types_tensor.to(torch.long), 
#     bond_lengths_tensor, 
#     neighbor_infos_tensor[:,:,:,0].to(torch.long), 
#     neighbor_infos_tensor[:,:,:,1], 
#     neighbor_infos_tensor[:,:,:,2]
# )

In [151]:
# energy_pred.shape

In [152]:
def create_dataloaders(dataset, batch_size, train_split=0.9, val_split=0.1):
    train_size = int(train_split * len(dataset))
    val_size = int(val_split * len(dataset))
    test_size = len(dataset) - train_size - val_size

    train_dataset, val_dataset, test_dataset = random_split(
        dataset, [train_size, val_size, test_size]
    )

    train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
    val_loader = DataLoader(val_dataset, batch_size=batch_size, shuffle=False)
    test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False)

    return train_loader, val_loader, test_loader

In [153]:
# train_loader, val_loader, test_loader = create_dataloaders(
#     dataset = bim_dataset, 
#     batch_size = 64
# )

In [154]:
def train(model, train_loader, optimizer, criterion, device):
    model.train()
    total_loss = 0.0
    for bond_types, bond_lengths, neighbor_infos, targets in tqdm(train_loader, desc="Training", ncols=100):
        # Move data to the device
        bond_types = bond_types.to(torch.long).to(device)
        bond_lengths = bond_lengths.to(device)
        neighbor_bond_types = neighbor_infos[:,:,:,0].to(torch.long).to(device)

        # print(f"--  {neighbor_infos.shape=} --- ")

        neighbor_bond_lengths = neighbor_infos[:,:,:,1].to(device)
        angles = neighbor_infos[:,:,:,2].to(device)
        target = targets.to(device)

        # print(f"{angles.shape=} -- {target.shape=}")

        # Forward pass
        optimizer.zero_grad()
        predictions = model(bond_types, bond_lengths, neighbor_bond_types, neighbor_bond_lengths, angles)

        # Compute loss
        loss = criterion(predictions, target)
        total_loss += loss.item()

        # Backward pass and optimization
        loss.backward()
        optimizer.step()

    return total_loss / len(train_loader)

In [155]:
def evaluate(model, loader, criterion, device):
    model.eval()
    total_loss = 0.0
    with torch.no_grad():
        for bond_types, bond_lengths, neighbor_infos, targets in tqdm(loader, desc="Evaluating", ncols=100):
            # Move data to the device
            bond_types = bond_types.to(torch.long).to(device)
            bond_lengths = bond_lengths.to(device)
            neighbor_bond_types = neighbor_infos[:,:,:,0].to(torch.long).to(device)
            neighbor_bond_lengths = neighbor_infos[:,:,:,1].to(device)
            angles = neighbor_infos[:,:,:,2].to(device)
            target = targets.to(device)

            # Forward pass
            predictions = model(bond_types, bond_lengths, neighbor_bond_types, neighbor_bond_lengths, angles)

            # Compute loss
            loss = criterion(predictions, target)
            total_loss += loss.item()

    return total_loss / len(loader)


In [156]:
# Configuration
batch_size = 1024
learning_rate = 0.0001
num_epochs = 50000
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

print(f"Training on = {device}")
print(f"epochs = {num_epochs}")

Training on = cuda
epochs = 50000


In [157]:
# Load dataset and create dataloaders
dataset = torch.load('./data/QM-9-BiM-Dataset.pt')
train_loader, val_loader, test_loader = create_dataloaders(dataset, batch_size)

In [158]:
# b_lengths_mean, b_lengths_std, b_angles_mean, b_angles_std, targets_means, targets_std = get_statistics(dataset.data_list)

In [159]:
max_bond_count = dataset.max_bond_count
max_neighbors  = dataset.max_neighbors 
unique_bond_count = len(dataset.unique_bonds) + 1
print(f"{max_bond_count=} -- {max_neighbors=} -- {unique_bond_count=}")
# Initialize model, loss, and optimizer
model = BiMNetwork(
    bond_type_size = unique_bond_count, 
    embedding_dim  = 16, 
    max_neighbors  = max_neighbors, 
    max_bond_count = max_bond_count
)

max_bond_count=28 -- max_neighbors=6 -- unique_bond_count=10


In [160]:
model.to(device)
criterion = nn.MSELoss()
optimizer = optim.Adam(model.parameters(), lr=learning_rate, betas=(0.95, 0.999))

# Training loop
for epoch in range(1, num_epochs+1):
    print(f"Epoch {epoch}/{num_epochs}")
    train_loss = train(model, train_loader, optimizer, criterion, device)

    if epoch % 50 == 0:
        val_loss = evaluate(model, val_loader, criterion, device)
        print(f"Training Loss: {train_loss:.4f}, Validation Loss: {val_loss:.4f}")

    if epoch % 200 == 0:
        # Save the model
        torch.save(model.state_dict(), f"./ckpts/model_at_epoch_{epoch}.pth")
        print(f"Model saved to ./ckpts/model_at_epoch_{epoch}.pth")

    
# Final evaluation on test data
test_loss = evaluate(model, test_loader, criterion, device)
print(f"Test Loss: {test_loss:.4f}")

# Save the model
torch.save(model.state_dict(), f"./ckpts/model_at_epoch_{num_epochs}.pth")
print(f"Model saved to ./ckpts/model_at_epoch_{num_epochs}.pth")


Epoch 1/50000


  return F.mse_loss(input, target, reduction=self.reduction)
Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 2/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 3/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:20<00:00,  5.27it/s]


Epoch 4/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.27it/s]


Epoch 5/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.15it/s]


Epoch 6/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.29it/s]


Epoch 7/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.22it/s]


Epoch 8/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.19it/s]


Epoch 9/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.29it/s]


Epoch 10/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.21it/s]


Epoch 11/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.23it/s]


Epoch 12/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:20<00:00,  5.42it/s]


Epoch 13/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.22it/s]


Epoch 14/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.30it/s]


Epoch 15/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 16/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 17/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 18/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 19/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 20/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.31it/s]


Epoch 21/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:20<00:00,  5.44it/s]


Epoch 22/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.25it/s]


Epoch 23/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.26it/s]


Epoch 24/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.24it/s]


Epoch 25/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.25it/s]


Epoch 26/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.28it/s]


Epoch 27/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.27it/s]


Epoch 28/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.27it/s]


Epoch 29/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.28it/s]


Epoch 30/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.47it/s]


Epoch 31/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.27it/s]


Epoch 32/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.29it/s]


Epoch 33/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.17it/s]


Epoch 34/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.24it/s]


Epoch 35/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:18<00:00,  6.00it/s]


Epoch 36/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.06it/s]


Epoch 37/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.17it/s]


Epoch 38/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.13it/s]


Epoch 39/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:20<00:00,  5.37it/s]


Epoch 40/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.13it/s]


Epoch 41/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.14it/s]


Epoch 42/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.11it/s]


Epoch 43/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.13it/s]


Epoch 44/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.12it/s]


Epoch 45/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.24it/s]


Epoch 46/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.13it/s]


Epoch 47/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:20<00:00,  5.34it/s]


Epoch 48/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.15it/s]


Epoch 49/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.12it/s]


Epoch 50/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.14it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:01<00:00,  6.77it/s]


Training Loss: 1.0077, Validation Loss: 0.9599
Epoch 51/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 52/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.25it/s]


Epoch 53/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.19it/s]


Epoch 54/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.23it/s]


Epoch 55/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 56/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.53it/s]


Epoch 57/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.19it/s]


Epoch 58/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 59/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 60/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 61/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 62/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 63/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 64/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 65/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.55it/s]


Epoch 66/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 67/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 68/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 69/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 70/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 71/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 72/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.19it/s]


Epoch 73/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 74/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.51it/s]


Epoch 75/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 76/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 77/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 78/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.24it/s]


Epoch 79/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.17it/s]


Epoch 80/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.32it/s]


Epoch 81/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.29it/s]


Epoch 82/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 83/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.53it/s]


Epoch 84/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 85/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 86/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 87/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 88/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 89/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 90/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 91/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 92/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.50it/s]


Epoch 93/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.32it/s]


Epoch 94/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 95/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.31it/s]


Epoch 96/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.32it/s]


Epoch 97/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 98/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 99/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.30it/s]


Epoch 100/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.24it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:01<00:00,  6.69it/s]


Training Loss: 1.0040, Validation Loss: 0.9485
Epoch 101/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:20<00:00,  5.44it/s]


Epoch 102/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.30it/s]


Epoch 103/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.28it/s]


Epoch 104/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 105/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 106/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.31it/s]


Epoch 107/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.20it/s]


Epoch 108/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.18it/s]


Epoch 109/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.55it/s]


Epoch 110/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 111/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 112/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 113/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 114/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 115/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 116/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 117/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 118/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.51it/s]


Epoch 119/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 120/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 121/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 122/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 123/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 124/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 125/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 126/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 127/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.56it/s]


Epoch 128/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 129/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.41it/s]


Epoch 130/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 131/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 132/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 133/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 134/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 135/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.41it/s]


Epoch 136/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.55it/s]


Epoch 137/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 138/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 139/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 140/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 141/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 142/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 143/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 144/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 145/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.48it/s]


Epoch 146/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 147/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 148/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 149/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 150/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:01<00:00,  7.00it/s]


Training Loss: 1.0042, Validation Loss: 0.9482
Epoch 151/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 152/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.31it/s]


Epoch 153/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 154/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.53it/s]


Epoch 155/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 156/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 157/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 158/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 159/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 160/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 161/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 162/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 163/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.49it/s]


Epoch 164/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 165/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.32it/s]


Epoch 166/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 167/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 168/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 169/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 170/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 171/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 172/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.54it/s]


Epoch 173/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 174/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 175/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 176/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.31it/s]


Epoch 177/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 178/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.30it/s]


Epoch 179/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.22it/s]


Epoch 180/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.48it/s]


Epoch 181/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 182/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 183/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 184/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 185/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.31it/s]


Epoch 186/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 187/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 188/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 189/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.55it/s]


Epoch 190/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 191/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 192/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 193/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 194/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 195/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.32it/s]


Epoch 196/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.32it/s]


Epoch 197/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 198/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.52it/s]


Epoch 199/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 200/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:01<00:00,  7.01it/s]


Training Loss: 1.0036, Validation Loss: 0.9482
Model saved to ./ckpts/model_at_epoch_200.pth
Epoch 201/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 202/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 203/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 204/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.26it/s]


Epoch 205/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 206/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 207/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.52it/s]


Epoch 208/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 209/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 210/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 211/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 212/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 213/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 214/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 215/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 216/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.56it/s]


Epoch 217/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 218/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 219/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 220/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 221/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 222/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 223/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.23it/s]


Epoch 224/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 225/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.55it/s]


Epoch 226/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 227/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 228/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 229/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 230/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.32it/s]


Epoch 231/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.31it/s]


Epoch 232/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.31it/s]


Epoch 233/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.26it/s]


Epoch 234/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.57it/s]


Epoch 235/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 236/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 237/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 238/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 239/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 240/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 241/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 242/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 243/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.52it/s]


Epoch 244/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 245/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 246/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 247/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 248/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 249/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 250/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:01<00:00,  6.99it/s]


Training Loss: 1.0032, Validation Loss: 0.9481
Epoch 251/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.49it/s]


Epoch 252/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 253/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.32it/s]


Epoch 254/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 255/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.29it/s]


Epoch 256/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.32it/s]


Epoch 257/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 258/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.30it/s]


Epoch 259/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.30it/s]


Epoch 260/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.52it/s]


Epoch 261/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 262/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 263/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 264/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 265/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 266/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 267/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 268/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 269/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.53it/s]


Epoch 270/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.31it/s]


Epoch 271/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.28it/s]


Epoch 272/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.28it/s]


Epoch 273/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 274/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.26it/s]


Epoch 275/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.30it/s]


Epoch 276/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 277/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 278/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.51it/s]


Epoch 279/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.25it/s]


Epoch 280/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:18<00:00,  6.01it/s]


Epoch 281/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:18<00:00,  6.01it/s]


Epoch 282/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:18<00:00,  6.05it/s]


Epoch 283/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.08it/s]


Epoch 284/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:18<00:00,  6.04it/s]


Epoch 285/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.10it/s]


Epoch 286/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.25it/s]


Epoch 287/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.47it/s]


Epoch 288/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 289/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.31it/s]


Epoch 290/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 291/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.25it/s]


Epoch 292/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.20it/s]


Epoch 293/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.27it/s]


Epoch 294/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.22it/s]


Epoch 295/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 296/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.59it/s]


Epoch 297/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.41it/s]


Epoch 298/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.11it/s]


Epoch 299/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.22it/s]


Epoch 300/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.27it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:01<00:00,  6.93it/s]


Training Loss: 1.0031, Validation Loss: 0.9481
Epoch 301/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 302/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 303/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 304/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 305/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.51it/s]


Epoch 306/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 307/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 308/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.32it/s]


Epoch 309/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 310/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 311/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 312/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 313/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.57it/s]


Epoch 314/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 315/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 316/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 317/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 318/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 319/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 320/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 321/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 322/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.54it/s]


Epoch 323/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 324/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 325/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 326/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 327/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 328/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 329/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 330/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 331/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.53it/s]


Epoch 332/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 333/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.30it/s]


Epoch 334/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.32it/s]


Epoch 335/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.12it/s]


Epoch 336/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:18<00:00,  6.03it/s]


Epoch 337/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.11it/s]


Epoch 338/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.11it/s]


Epoch 339/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.21it/s]


Epoch 340/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:20<00:00,  5.40it/s]


Epoch 341/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.19it/s]


Epoch 342/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.24it/s]


Epoch 343/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.19it/s]


Epoch 344/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.21it/s]


Epoch 345/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.23it/s]


Epoch 346/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.16it/s]


Epoch 347/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.25it/s]


Epoch 348/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.22it/s]


Epoch 349/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:20<00:00,  5.44it/s]


Epoch 350/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.23it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:01<00:00,  6.94it/s]


Training Loss: 1.0033, Validation Loss: 0.9483
Epoch 351/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.17it/s]


Epoch 352/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.19it/s]


Epoch 353/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.25it/s]


Epoch 354/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.25it/s]


Epoch 355/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.19it/s]


Epoch 356/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.22it/s]


Epoch 357/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.23it/s]


Epoch 358/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:20<00:00,  5.40it/s]


Epoch 359/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.22it/s]


Epoch 360/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.24it/s]


Epoch 361/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.23it/s]


Epoch 362/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.17it/s]


Epoch 363/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.20it/s]


Epoch 364/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.14it/s]


Epoch 365/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.23it/s]


Epoch 366/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.18it/s]


Epoch 367/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:20<00:00,  5.39it/s]


Epoch 368/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.28it/s]


Epoch 369/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.18it/s]


Epoch 370/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.17it/s]


Epoch 371/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.19it/s]


Epoch 372/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.23it/s]


Epoch 373/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.24it/s]


Epoch 374/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.15it/s]


Epoch 375/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.22it/s]


Epoch 376/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:20<00:00,  5.42it/s]


Epoch 377/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.22it/s]


Epoch 378/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.24it/s]


Epoch 379/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.22it/s]


Epoch 380/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.22it/s]


Epoch 381/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.17it/s]


Epoch 382/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.21it/s]


Epoch 383/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.20it/s]


Epoch 384/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:20<00:00,  5.43it/s]


Epoch 385/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.25it/s]


Epoch 386/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.24it/s]


Epoch 387/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.18it/s]


Epoch 388/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.14it/s]


Epoch 389/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.22it/s]


Epoch 390/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.24it/s]


Epoch 391/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.21it/s]


Epoch 392/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.20it/s]


Epoch 393/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:20<00:00,  5.38it/s]


Epoch 394/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.24it/s]


Epoch 395/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.21it/s]


Epoch 396/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.19it/s]


Epoch 397/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.24it/s]


Epoch 398/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.24it/s]


Epoch 399/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.20it/s]


Epoch 400/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.18it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:01<00:00,  6.65it/s]


Training Loss: 1.0027, Validation Loss: 0.9482
Model saved to ./ckpts/model_at_epoch_400.pth
Epoch 401/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.23it/s]


Epoch 402/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:20<00:00,  5.43it/s]


Epoch 403/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.23it/s]


Epoch 404/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.21it/s]


Epoch 405/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.26it/s]


Epoch 406/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.32it/s]


Epoch 407/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 408/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 409/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 410/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 411/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.54it/s]


Epoch 412/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.32it/s]


Epoch 413/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 414/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 415/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 416/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 417/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 418/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 419/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 420/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.52it/s]


Epoch 421/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 422/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 423/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 424/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 425/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 426/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 427/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 428/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 429/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.54it/s]


Epoch 430/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 431/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 432/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 433/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 434/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 435/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 436/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 437/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 438/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.52it/s]


Epoch 439/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 440/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 441/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 442/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 443/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 444/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 445/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 446/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 447/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.56it/s]


Epoch 448/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 449/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 450/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:01<00:00,  6.93it/s]


Training Loss: 1.0038, Validation Loss: 0.9481
Epoch 451/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 452/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.41it/s]


Epoch 453/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 454/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 455/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.49it/s]


Epoch 456/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 457/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 458/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 459/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 460/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 461/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 462/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 463/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 464/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.54it/s]


Epoch 465/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 466/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 467/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.32it/s]


Epoch 468/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 469/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 470/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 471/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 472/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 473/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.55it/s]


Epoch 474/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 475/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 476/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 477/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 478/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 479/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 480/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 481/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 482/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.53it/s]


Epoch 483/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 484/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 485/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 486/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 487/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 488/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.31it/s]


Epoch 489/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 490/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 491/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.55it/s]


Epoch 492/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 493/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 494/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 495/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 496/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 497/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 498/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 499/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 500/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.53it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:01<00:00,  6.97it/s]


Training Loss: 1.0030, Validation Loss: 0.9481
Epoch 501/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 502/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 503/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 504/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 505/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 506/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 507/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 508/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 509/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.55it/s]


Epoch 510/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.30it/s]


Epoch 511/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.31it/s]


Epoch 512/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 513/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 514/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 515/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 516/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 517/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.61it/s]


Epoch 518/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 519/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 520/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 521/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 522/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 523/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 524/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 525/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 526/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.59it/s]


Epoch 527/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 528/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 529/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 530/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 531/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 532/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 533/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 534/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 535/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.57it/s]


Epoch 536/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 537/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 538/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 539/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 540/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 541/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 542/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 543/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 544/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.59it/s]


Epoch 545/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 546/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.32it/s]


Epoch 547/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 548/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 549/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 550/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:01<00:00,  7.08it/s]


Training Loss: 1.0039, Validation Loss: 0.9481
Epoch 551/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 552/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 553/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.51it/s]


Epoch 554/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 555/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 556/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 557/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 558/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 559/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 560/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 561/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 562/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.53it/s]


Epoch 563/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.41it/s]


Epoch 564/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 565/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 566/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 567/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 568/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 569/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 570/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.32it/s]


Epoch 571/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.54it/s]


Epoch 572/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 573/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.33it/s]


Epoch 574/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 575/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 576/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 577/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.35it/s]


Epoch 578/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 579/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 580/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.61it/s]


Epoch 581/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 582/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 583/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 584/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 585/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 586/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 587/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 588/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.60it/s]


Epoch 589/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 590/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 591/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 592/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 593/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 594/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 595/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 596/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 597/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.60it/s]


Epoch 598/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 599/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 600/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:01<00:00,  7.08it/s]


Training Loss: 1.0033, Validation Loss: 0.9481
Model saved to ./ckpts/model_at_epoch_600.pth
Epoch 601/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 602/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 603/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.49it/s]


Epoch 604/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 605/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 606/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.59it/s]


Epoch 607/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 608/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 609/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 610/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 611/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 612/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 613/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 614/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 615/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.59it/s]


Epoch 616/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 617/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 618/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 619/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 620/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 621/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 622/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 623/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 624/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.61it/s]


Epoch 625/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 626/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 627/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 628/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 629/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 630/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 631/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 632/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 633/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.61it/s]


Epoch 634/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 635/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 636/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 637/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 638/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 639/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 640/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 641/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 642/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.60it/s]


Epoch 643/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 644/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 645/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 646/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 647/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 648/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 649/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 650/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:04<00:00,  2.94it/s]


Training Loss: 1.0030, Validation Loss: 0.9481
Epoch 651/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.51it/s]


Epoch 652/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.51it/s]


Epoch 653/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 654/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 655/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 656/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 657/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 658/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 659/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.56it/s]


Epoch 660/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 661/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 662/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 663/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 664/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 665/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 666/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.49it/s]


Epoch 667/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 668/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.60it/s]


Epoch 669/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 670/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 671/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 672/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 673/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 674/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 675/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 676/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 677/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.60it/s]


Epoch 678/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 679/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 680/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 681/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 682/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 683/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 684/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 685/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 686/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.59it/s]


Epoch 687/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 688/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 689/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 690/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 691/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 692/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 693/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 694/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 695/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.59it/s]


Epoch 696/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 697/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 698/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 699/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 700/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:01<00:00,  7.03it/s]


Training Loss: 1.0030, Validation Loss: 0.9481
Epoch 701/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 702/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 703/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 704/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.60it/s]


Epoch 705/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 706/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 707/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 708/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 709/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 710/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 711/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 712/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 713/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.61it/s]


Epoch 714/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 715/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.49it/s]


Epoch 716/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 717/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 718/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 719/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 720/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 721/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.60it/s]


Epoch 722/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 723/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 724/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 725/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 726/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 727/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 728/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 729/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 730/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.61it/s]


Epoch 731/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 732/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 733/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.41it/s]


Epoch 734/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 735/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 736/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 737/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 738/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 739/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.60it/s]


Epoch 740/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 741/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 742/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 743/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 744/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 745/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 746/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 747/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 748/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.61it/s]


Epoch 749/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 750/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:01<00:00,  7.08it/s]


Training Loss: 1.0031, Validation Loss: 0.9481
Epoch 751/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 752/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 753/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 754/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 755/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 756/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 757/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.59it/s]


Epoch 758/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 759/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 760/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 761/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 762/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 763/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 764/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 765/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 766/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.62it/s]


Epoch 767/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 768/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 769/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.36it/s]


Epoch 770/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 771/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 772/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 773/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 774/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 775/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.61it/s]


Epoch 776/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.41it/s]


Epoch 777/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 778/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 779/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 780/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 781/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 782/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 783/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 784/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.57it/s]


Epoch 785/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 786/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 787/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 788/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 789/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 790/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 791/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 792/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.61it/s]


Epoch 793/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 794/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 795/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.49it/s]


Epoch 796/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 797/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 798/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 799/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 800/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:01<00:00,  7.02it/s]


Training Loss: 1.0030, Validation Loss: 0.9481
Model saved to ./ckpts/model_at_epoch_800.pth
Epoch 801/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.54it/s]


Epoch 802/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 803/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 804/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 805/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 806/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.25it/s]


Epoch 807/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 808/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 809/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 810/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.59it/s]


Epoch 811/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 812/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 813/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 814/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 815/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 816/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 817/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 818/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 819/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.59it/s]


Epoch 820/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 821/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 822/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 823/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 824/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 825/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 826/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 827/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 828/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.60it/s]


Epoch 829/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 830/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 831/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 832/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 833/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 834/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 835/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 836/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 837/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.57it/s]


Epoch 838/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 839/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 840/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 841/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 842/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 843/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 844/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 845/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 846/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.61it/s]


Epoch 847/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 848/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 849/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 850/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:01<00:00,  7.05it/s]


Training Loss: 1.0031, Validation Loss: 0.9481
Epoch 851/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 852/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 853/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 854/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.59it/s]


Epoch 855/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 856/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.49it/s]


Epoch 857/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 858/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 859/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 860/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 861/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 862/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 863/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.60it/s]


Epoch 864/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 865/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 866/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 867/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 868/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 869/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 870/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 871/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 872/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.58it/s]


Epoch 873/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 874/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 875/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 876/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 877/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 878/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 879/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 880/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 881/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.61it/s]


Epoch 882/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 883/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 884/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 885/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 886/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 887/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 888/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 889/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 890/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.57it/s]


Epoch 891/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 892/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 893/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 894/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 895/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 896/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 897/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 898/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 899/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.62it/s]


Epoch 900/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:01<00:00,  7.07it/s]


Training Loss: 1.0031, Validation Loss: 0.9483
Epoch 901/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.41it/s]


Epoch 902/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 903/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 904/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 905/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 906/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 907/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 908/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.60it/s]


Epoch 909/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 910/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 911/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 912/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 913/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 914/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 915/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 916/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 917/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.59it/s]


Epoch 918/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 919/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 920/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 921/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 922/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 923/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 924/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 925/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.57it/s]


Epoch 926/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 927/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 928/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 929/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 930/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 931/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 932/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 933/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 934/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.59it/s]


Epoch 935/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 936/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 937/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 938/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 939/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 940/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 941/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 942/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 943/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.59it/s]


Epoch 944/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 945/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 946/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 947/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 948/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 949/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 950/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:01<00:00,  7.09it/s]


Training Loss: 1.0037, Validation Loss: 0.9481
Epoch 951/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 952/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.58it/s]


Epoch 953/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.41it/s]


Epoch 954/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 955/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 956/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 957/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 958/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 959/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 960/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 961/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.60it/s]


Epoch 962/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 963/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 964/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 965/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 966/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 967/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 968/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 969/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 970/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.58it/s]


Epoch 971/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 972/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 973/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 974/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 975/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 976/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 977/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 978/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 979/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.55it/s]


Epoch 980/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 981/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 982/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 983/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 984/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 985/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 986/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 987/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 988/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.62it/s]


Epoch 989/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 990/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 991/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 992/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 993/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 994/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 995/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 996/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.59it/s]


Epoch 997/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 998/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 999/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 1000/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:01<00:00,  7.02it/s]


Training Loss: 1.0034, Validation Loss: 0.9481
Model saved to ./ckpts/model_at_epoch_1000.pth
Epoch 1001/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 1002/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1003/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 1004/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 1005/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.57it/s]


Epoch 1006/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 1007/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.49it/s]


Epoch 1008/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1009/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1010/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 1011/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1012/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 1013/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1014/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.58it/s]


Epoch 1015/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 1016/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 1017/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1018/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 1019/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 1020/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 1021/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.41it/s]


Epoch 1022/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1023/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.58it/s]


Epoch 1024/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 1025/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1026/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1027/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1028/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 1029/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 1030/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 1031/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 1032/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.61it/s]


Epoch 1033/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 1034/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1035/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1036/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 1037/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 1038/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 1039/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1040/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 1041/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.58it/s]


Epoch 1042/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 1043/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.41it/s]


Epoch 1044/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1045/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 1046/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 1047/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1048/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 1049/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 1050/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.58it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:01<00:00,  7.08it/s]


Training Loss: 1.0032, Validation Loss: 0.9481
Epoch 1051/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1052/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 1053/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 1054/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 1055/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1056/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1057/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 1058/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.60it/s]


Epoch 1059/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1060/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 1061/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1062/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.48it/s]


Epoch 1063/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1064/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 1065/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 1066/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 1067/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.59it/s]


Epoch 1068/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 1069/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 1070/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1071/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 1072/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 1073/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.44it/s]


Epoch 1074/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.41it/s]


Epoch 1075/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 1076/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.58it/s]


Epoch 1077/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1078/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1079/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.47it/s]


Epoch 1080/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 1081/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.42it/s]


Epoch 1082/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.46it/s]


Epoch 1083/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.30it/s]


Epoch 1084/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.28it/s]


Epoch 1085/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:20<00:00,  5.42it/s]


Epoch 1086/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.32it/s]


Epoch 1087/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.26it/s]


Epoch 1088/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.34it/s]


Epoch 1089/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.40it/s]


Epoch 1090/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.37it/s]


Epoch 1091/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.38it/s]


Epoch 1092/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.17it/s]


Epoch 1093/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.22it/s]


Epoch 1094/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.51it/s]


Epoch 1095/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.25it/s]


Epoch 1096/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.19it/s]


Epoch 1097/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 1098/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.39it/s]


Epoch 1099/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.25it/s]


Epoch 1100/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:17<00:00,  6.26it/s]
Evaluating: 100%|███████████████████████████████████████████████████| 13/13 [00:01<00:00,  7.09it/s]


Training Loss: 1.0036, Validation Loss: 0.9482
Epoch 1101/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.43it/s]


Epoch 1102/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:16<00:00,  6.45it/s]


Epoch 1103/50000


Training: 100%|███████████████████████████████████████████████████| 109/109 [00:19<00:00,  5.55it/s]


Epoch 1104/50000


Training:  70%|████████████████████████████████████▎               | 76/109 [00:12<00:05,  6.24it/s]


KeyboardInterrupt: 