In [1]:
from torch.utils.data import DataLoader
import numpy as np
import matplotlib.pyplot as plt
import torch
from glob import glob
import seaborn as sns
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
from tqdm import tqdm
import pickle
import random
import time

import deep_snow.models
import deep_snow.dataset

In [2]:
# def set_seed(seed: int = 43):
#     random.seed(seed)
#     np.random.seed(seed)
#     torch.manual_seed(seed)
#     torch.cuda.manual_seed(seed)
#     torch.backends.cudnn.deterministic = True
#     torch.backends.cudnn.benchmark = False

#     set_seed()

In [3]:
def sample_lognormal(center, sigma):
    mu = np.log(center)
    return np.random.lognormal(mean=mu, sigma=sigma)

# def visualize_lognormal(center, sigmas, n_samples=10000):
#     f, ax = plt.subplots(figsize=(10, 6))
#     for sigma in sigmas:
#         mu = np.log(center)
#         samples = np.random.lognormal(mean=mu, sigma=sigma, size=n_samples)
#         sns.kdeplot(samples, label=f'sigma={sigma}', ax=ax)
#     ax.set_xlabel('Sampled Value')
#     ax.set_ylabel('Density')
#     ax.set_title(f'Lognormal Samples Centered on {center}')
#     f.legend()
#     ax.grid(True, which='both', linestyle='--')
#     ax.set_xlim(0, 0.0005)
#     ax.set_ylim(0)

# # Example usage
# visualize_lognormal(center=1e-4, sigmas=[1.0])

In [4]:
# get paths to data
train_data_dir = '/mnt/working/brencher/repos/deep-snow/data/subsets_v4/train'
train_path_list = glob(f'{train_data_dir}/ASO_50M_SD*.nc')

val_data_dir = '/mnt/working/brencher/repos/deep-snow/data/subsets_v4/val'
val_path_list = glob(f'{val_data_dir}/ASO_50M_SD*.nc')

#consolidate for final run
train_path_list = train_path_list + val_path_list

test_data_dir = '/mnt/working/brencher/repos/deep-snow/data/subsets_v4/test'
test_path_list = glob(f'{test_data_dir}/ASO_50M_SD*.nc')

In [5]:
def train_model(input_channels, return_channels, epochs, lr, weight_decay, n_layers=5):
    model = deep_snow.models.ResDepth(n_input_channels=len(input_channels), depth=n_layers)
    model_name = f'ResDepth_lr{lr}_weightdecay{weight_decay}'
    model.to('cuda');  # Run on GPU
    # Define optimizer and loss function
    optimizer = optim.AdamW(model.parameters(), lr=lr, weight_decay=weight_decay)
    scheduler = optim.lr_scheduler.ReduceLROnPlateau(optimizer, mode='min', factor=0.5, patience=10, threshold=0.00001)
    loss_fn = nn.MSELoss()
    epochs = epochs
    
    train_loss = []
    test_loss = []
    counter = 0
    min_test_loss = 1
    patience = 0
    patience_limit = 50

    # training and validation loop
    for epoch in range(epochs):
        epoch_start_time = time.time()
        print(f'\nStarting epoch {epoch+1}')
        train_epoch_loss = []
        test_epoch_loss = []
            
        # Loop through training data with tqdm progress bar
        pbar = tqdm(train_loader, desc=f"Epoch {epoch+1}/{epochs}", unit="batch", ncols=130)
        for data_tuple in pbar:
            model.train()
            optimizer.zero_grad()
    
            # read data into dictionary
            data_dict = {name: tensor for name, tensor in zip(return_channels, data_tuple)}
            # prepare inputs by concatenating along channel dimension
            inputs = torch.cat([data_dict[channel] for channel in input_channels], dim=1).to('cuda')
    
            # generate prediction
            pred_sd = model(inputs)
    
            # Limit prediction to areas with valid data
            pred_sd = torch.where(data_dict['aso_gap_map'].to('cuda') + data_dict['rtc_gap_map'].to('cuda') + data_dict['s2_gap_map'].to('cuda') == 0, pred_sd, torch.zeros_like(pred_sd).to('cuda'))
            aso_sd = torch.where(data_dict['aso_gap_map'].to('cuda') + data_dict['rtc_gap_map'].to('cuda') + data_dict['s2_gap_map'].to('cuda') == 0, data_dict['aso_sd'].to('cuda'), torch.zeros_like(pred_sd).to('cuda'))
    
            # Calculate loss
            train_batch_loss = loss_fn(pred_sd, aso_sd.to('cuda'))
            train_epoch_loss.append(train_batch_loss.item())
    
            # Update tqdm progress bar with batch loss
            pbar.set_postfix({'batch loss': train_batch_loss.item(), 'mean epoch loss': np.mean(train_epoch_loss)})
    
            train_batch_loss.backward()  # Propagate the gradients in backward pass
            optimizer.step()
    
        train_loss.append(np.mean(train_epoch_loss))
        print(f'Training loss: {np.mean(train_epoch_loss)}')
    
        # Run model on validation data with tqdm progress bar
        for data_tuple in tqdm(test_loader, desc="Testing", unit="batch"):
            with torch.no_grad():
                model.eval()
                
                # read data into dictionary
                data_dict = {name: tensor for name, tensor in zip(return_channels, data_tuple)}
                # prepare inputs by concatenating along channel dimension
                inputs = torch.cat([data_dict[channel] for channel in input_channels], dim=1).to('cuda')
        
                # generate prediction
                pred_sd = model(inputs)
        
                # Limit prediction to areas with valid data
                pred_sd = torch.where(data_dict['aso_gap_map'].to('cuda') + data_dict['rtc_gap_map'].to('cuda') + data_dict['s2_gap_map'].to('cuda') == 0, pred_sd, torch.zeros_like(pred_sd).to('cuda'))
                aso_sd = torch.where(data_dict['aso_gap_map'].to('cuda') + data_dict['rtc_gap_map'].to('cuda') + data_dict['s2_gap_map'].to('cuda') == 0, data_dict['aso_sd'].to('cuda'), torch.zeros_like(pred_sd).to('cuda'))
        
                # Calculate loss
                test_batch_loss = loss_fn(pred_sd, aso_sd.to('cuda'))
                test_epoch_loss.append(test_batch_loss.item())
    
        test_loss.append(np.mean(test_epoch_loss))
        print(f'Test loss: {np.mean(test_epoch_loss)}')
        scheduler.step(np.mean(test_epoch_loss))

        # save loss 
        with open(f'../../../loss/{model_name}_test_loss.pkl', 'wb') as f:
            pickle.dump(test_loss, f)
            
        with open(f'../../../loss/{model_name}_train_loss.pkl', 'wb') as f:
            pickle.dump(train_loss, f)
        
        # Early stopping check (start saving after 30 epochs)
        if np.mean(test_epoch_loss) < min_test_loss:
            min_test_loss = np.mean(test_epoch_loss)
            min_test_loss_epoch = epoch
            patience = 0
            if epoch > 30:
                torch.save(model.state_dict(), f'../../../weights/{model_name}_epochs{epoch}_mintestloss{min_test_loss:.5f}')
        else:
            patience += 1

        if patience >= patience_limit:
            print(f"\nEarly stopping at epoch {epoch + 1}. No improvement in test loss for {patience_limit} epochs.")
            break

        epoch_end_time = time.time()
        print(f'epoch time: {epoch_end_time - epoch_start_time:.4f} seconds')

    #plot_loss(train_loss, val_loss)
    return [min_test_loss_epoch, min_test_loss]

In [6]:
# define data to be returned by dataloader
return_channels = [
    # ASO products
    'aso_sd', # ASO lidar snow depth (target dataset)
    'aso_gap_map', # gaps in ASO data
    
    'delta_cr', # change in cross ratio, snowon_cr - snowoff_cr
    'rtc_gap_map', # gaps in Sentinel-1 data
   
    # Sentinel-2 products 
    'blue', # snow on Sentinel-2 blue band
    'swir1', # snow on Sentinel-2 shortwave infrared band 1
    'ndsi', # Normalized Difference Snow Index from Sentinel-2
    's2_gap_map', # gaps in Sentinel-2 data

    # snodas datset
    'snodas_sd', # snow depth

    # PROBA-V global land cover dataset (Buchhorn et al., 2020)
    'fcf', # fractional forest cover
    
    # COP30 digital elevation model      
    'elevation',
    'slope',
    'northness',
    'curvature',

    # day of water year
    'dowy'
                    ]

# prepare training and validation dataloaders
train_data = deep_snow.dataset.Datasetv2(train_path_list, return_channels, norm=True, cache_data=True)
train_loader = torch.utils.data.DataLoader(dataset=train_data, batch_size=16, shuffle=True)
test_data = deep_snow.dataset.Datasetv2(test_path_list, return_channels, norm=True, augment=False, cache_data=True)
test_loader = torch.utils.data.DataLoader(dataset=test_data, batch_size=16, shuffle=True)

In [7]:
# define input channels for model
input_channels = ['snodas_sd',
                  'blue',
                  'swir1',
                  'ndsi',
                  'elevation',
                  'northness',
                  'slope',
                  'curvature',
                  'dowy',
                  'delta_cr',
                  'fcf'
                 ]

In [None]:
num_trials = 20
epochs=500
exp_dict = {}

for trial in range(num_trials):
    
    print('---------------------------------------------------------')
    print(f'starting trial {trial}')
    lr = sample_lognormal(center=3e-4, sigma=1.0)
    weight_decay = sample_lognormal(center=1e-4, sigma=1.0)
    print(f'lr: {lr}, weight decay: {weight_decay}')
    min_test_loss_epoch, min_test_loss = train_model(input_channels, return_channels, epochs=epochs, lr=lr, weight_decay=weight_decay)
    print(f'lr: {lr}, weight decay: {weight_decay}, final epoch: {min_test_loss_epoch}, final test loss: {min_test_loss}')
    exp_dict[trial] = [lr, weight_decay, min_test_loss_epoch, min_test_loss]
    # save experiments 
    with open(f'../../../loss/ResDepth_lr_tuning_loss_final.pkl', 'wb') as f:
        pickle.dump(exp_dict, f)

---------------------------------------------------------
starting trial 0
lr: 8.769533075169251e-05, weight decay: 2.7559395538018623e-05

Starting epoch 1


Epoch 1/500: 100%|██████████████████████████████| 909/909 [29:52<00:00,  1.97s/batch, batch loss=0.00149, mean epoch loss=0.00222]


Training loss: 0.002221425731951469


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [03:47<00:00,  2.39s/batch]


Test loss: 0.0015934013449096758
epoch time: 2020.1181 seconds

Starting epoch 2


Epoch 2/500: 100%|██████████████████████████████| 909/909 [00:50<00:00, 17.96batch/s, batch loss=0.00122, mean epoch loss=0.00157]


Training loss: 0.001571285996752703


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.14batch/s]


Test loss: 0.0014334477710929749
epoch time: 51.5774 seconds

Starting epoch 3


Epoch 3/500: 100%|█████████████████████████████| 909/909 [00:50<00:00, 17.88batch/s, batch loss=0.000516, mean epoch loss=0.00146]


Training loss: 0.0014628771210428199


Testing: 100%|██████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 100.04batch/s]


Test loss: 0.001602139994869695
epoch time: 51.7872 seconds

Starting epoch 4


Epoch 4/500: 100%|█████████████████████████████| 909/909 [00:50<00:00, 17.87batch/s, batch loss=0.000576, mean epoch loss=0.00139]


Training loss: 0.001391166148068075


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.83batch/s]


Test loss: 0.0013659887170529386
epoch time: 51.8199 seconds

Starting epoch 5


Epoch 5/500: 100%|█████████████████████████████| 909/909 [00:50<00:00, 17.83batch/s, batch loss=0.000266, mean epoch loss=0.00136]


Training loss: 0.0013562740341642907


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.83batch/s]


Test loss: 0.0013303676188163656
epoch time: 51.9420 seconds

Starting epoch 6


Epoch 6/500: 100%|█████████████████████████████| 909/909 [00:50<00:00, 17.94batch/s, batch loss=0.000984, mean epoch loss=0.00131]


Training loss: 0.0013059083271435615


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.53batch/s]


Test loss: 0.0013578900393392695
epoch time: 51.6329 seconds

Starting epoch 7


Epoch 7/500: 100%|██████████████████████████████| 909/909 [00:49<00:00, 18.53batch/s, batch loss=0.00287, mean epoch loss=0.00127]


Training loss: 0.0012666860032351267


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.51batch/s]


Test loss: 0.0013154898868187478
epoch time: 50.0380 seconds

Starting epoch 8


Epoch 8/500: 100%|█████████████████████████████| 909/909 [00:49<00:00, 18.25batch/s, batch loss=0.000688, mean epoch loss=0.00124]


Training loss: 0.0012388380310298134


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.69batch/s]


Test loss: 0.0012840588693507015
epoch time: 50.7684 seconds

Starting epoch 9


Epoch 9/500: 100%|███████████████████████████████| 909/909 [00:51<00:00, 17.77batch/s, batch loss=0.00103, mean epoch loss=0.0012]


Training loss: 0.0011997024166373162


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.63batch/s]


Test loss: 0.001265654137578646
epoch time: 52.1038 seconds

Starting epoch 10


Epoch 10/500: 100%|████████████████████████████| 909/909 [00:51<00:00, 17.76batch/s, batch loss=0.000383, mean epoch loss=0.00118]


Training loss: 0.0011782889067953784


Testing: 100%|██████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 100.03batch/s]


Test loss: 0.0012021921774200898
epoch time: 52.1478 seconds

Starting epoch 11


Epoch 11/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.24batch/s, batch loss=0.000822, mean epoch loss=0.00116]


Training loss: 0.0011574040755417713


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.98batch/s]


Test loss: 0.0012451320292281086
epoch time: 50.7912 seconds

Starting epoch 12


Epoch 12/500: 100%|█████████████████████████████| 909/909 [00:49<00:00, 18.23batch/s, batch loss=0.00258, mean epoch loss=0.00113]


Training loss: 0.0011285670884932663


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.02batch/s]


Test loss: 0.0012712741246152866
epoch time: 50.9000 seconds

Starting epoch 13


Epoch 13/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.36batch/s, batch loss=0.000803, mean epoch loss=0.00111]


Training loss: 0.001113868517750514


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.78batch/s]


Test loss: 0.0012000192979987907
epoch time: 50.5092 seconds

Starting epoch 14


Epoch 14/500: 100%|██████████████████████████████| 909/909 [00:48<00:00, 18.67batch/s, batch loss=0.00125, mean epoch loss=0.0011]


Training loss: 0.001095169502156387


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.32batch/s]


Test loss: 0.0011243059765547515
epoch time: 49.7130 seconds

Starting epoch 15


Epoch 15/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.65batch/s, batch loss=0.000842, mean epoch loss=0.00108]


Training loss: 0.0010810423818308611


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.34batch/s]


Test loss: 0.0011236745410745865
epoch time: 49.7700 seconds

Starting epoch 16


Epoch 16/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.53batch/s, batch loss=0.000351, mean epoch loss=0.00106]


Training loss: 0.0010606897522859164


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.41batch/s]


Test loss: 0.0012750325016799922
epoch time: 50.0506 seconds

Starting epoch 17


Epoch 17/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.63batch/s, batch loss=0.00288, mean epoch loss=0.00105]


Training loss: 0.0010521292503771031


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.35batch/s]


Test loss: 0.0010788593177781685
epoch time: 49.8240 seconds

Starting epoch 18


Epoch 18/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.58batch/s, batch loss=0.000384, mean epoch loss=0.00104]


Training loss: 0.0010365280188417484


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.92batch/s]


Test loss: 0.0010854650922977414
epoch time: 49.9507 seconds

Starting epoch 19


Epoch 19/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.65batch/s, batch loss=0.00061, mean epoch loss=0.00103]


Training loss: 0.0010277117830395086


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.45batch/s]


Test loss: 0.0010334743943531065
epoch time: 49.7675 seconds

Starting epoch 20


Epoch 20/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.71batch/s, batch loss=0.00062, mean epoch loss=0.00101]


Training loss: 0.001012456752997654


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.59batch/s]


Test loss: 0.001045126736311144
epoch time: 49.5784 seconds

Starting epoch 21


Epoch 21/500: 100%|██████████████████████████████| 909/909 [00:48<00:00, 18.65batch/s, batch loss=0.000577, mean epoch loss=0.001]


Training loss: 0.0010034329500053195


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.84batch/s]


Test loss: 0.001160586957427624
epoch time: 49.7366 seconds

Starting epoch 22


Epoch 22/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.62batch/s, batch loss=0.00353, mean epoch loss=0.000994]


Training loss: 0.0009937117290661959


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.88batch/s]


Test loss: 0.0010575907505546256
epoch time: 49.8230 seconds

Starting epoch 23


Epoch 23/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.64batch/s, batch loss=0.000856, mean epoch loss=0.000991]


Training loss: 0.0009913084935054323


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.00batch/s]


Test loss: 0.001184212385468479
epoch time: 49.8009 seconds

Starting epoch 24


Epoch 24/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.65batch/s, batch loss=0.000188, mean epoch loss=0.000975]


Training loss: 0.0009746781463388505


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.34batch/s]


Test loss: 0.00111540782259238
epoch time: 49.7406 seconds

Starting epoch 25


Epoch 25/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.50batch/s, batch loss=0.00138, mean epoch loss=0.000965]


Training loss: 0.0009649132494270398


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.01batch/s]


Test loss: 0.0010088561954417904
epoch time: 50.1402 seconds

Starting epoch 26


Epoch 26/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.60batch/s, batch loss=0.00193, mean epoch loss=0.000947]


Training loss: 0.0009470270758983833


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.87batch/s]


Test loss: 0.0010117064769330777
epoch time: 49.8713 seconds

Starting epoch 27


Epoch 27/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.63batch/s, batch loss=0.00144, mean epoch loss=0.000949]


Training loss: 0.0009489032149793732


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.88batch/s]


Test loss: 0.0011082087379978283
epoch time: 49.7478 seconds

Starting epoch 28


Epoch 28/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.57batch/s, batch loss=0.000344, mean epoch loss=0.000928]


Training loss: 0.0009281861345785464


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.73batch/s]


Test loss: 0.0010374117786628439
epoch time: 49.9157 seconds

Starting epoch 29


Epoch 29/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.48batch/s, batch loss=0.000967, mean epoch loss=0.00093]


Training loss: 0.0009301784864552032


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.89batch/s]


Test loss: 0.0010659459148116997
epoch time: 50.1642 seconds

Starting epoch 30


Epoch 30/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.56batch/s, batch loss=0.000823, mean epoch loss=0.000921]


Training loss: 0.0009212041017069516


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.36batch/s]


Test loss: 0.001145318056468999
epoch time: 49.9286 seconds

Starting epoch 31


Epoch 31/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.56batch/s, batch loss=0.00209, mean epoch loss=0.000918]


Training loss: 0.0009180904946615766


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.37batch/s]


Test loss: 0.0010693389542498872
epoch time: 49.9434 seconds

Starting epoch 32


Epoch 32/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.59batch/s, batch loss=0.00113, mean epoch loss=0.000893]


Training loss: 0.0008932139552927707


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.51batch/s]


Test loss: 0.0010589019628241658
epoch time: 49.8840 seconds

Starting epoch 33


Epoch 33/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.56batch/s, batch loss=0.000633, mean epoch loss=0.000905]


Training loss: 0.0009046448856707505


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.24batch/s]


Test loss: 0.0010119966929778457
epoch time: 49.9385 seconds

Starting epoch 34


Epoch 34/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.61batch/s, batch loss=0.000484, mean epoch loss=0.000886]


Training loss: 0.0008856948963443932


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.64batch/s]


Test loss: 0.0010482448376837727
epoch time: 49.8267 seconds

Starting epoch 35


Epoch 35/500: 100%|█████████████████████████████| 909/909 [00:49<00:00, 18.53batch/s, batch loss=0.0019, mean epoch loss=0.000878]


Training loss: 0.000877693797039635


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.01batch/s]


Test loss: 0.001025126390710571
epoch time: 50.0498 seconds

Starting epoch 36


Epoch 36/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.54batch/s, batch loss=0.000581, mean epoch loss=0.000876]


Training loss: 0.0008762177165866752


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.17batch/s]


Test loss: 0.0010011328534394698
epoch time: 50.0423 seconds

Starting epoch 37


Epoch 37/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.49batch/s, batch loss=0.00102, mean epoch loss=0.000859]


Training loss: 0.0008590230024197524


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.41batch/s]


Test loss: 0.0010027307393580772
epoch time: 50.1134 seconds

Starting epoch 38


Epoch 38/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.52batch/s, batch loss=0.00107, mean epoch loss=0.000871]


Training loss: 0.0008714967900034187


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.97batch/s]


Test loss: 0.001018614564274781
epoch time: 50.0576 seconds

Starting epoch 39


Epoch 39/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.45batch/s, batch loss=0.000358, mean epoch loss=0.00084]


Training loss: 0.0008395630193363114


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.31batch/s]


Test loss: 0.0011947183306083868
epoch time: 50.2418 seconds

Starting epoch 40


Epoch 40/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.39batch/s, batch loss=0.00095, mean epoch loss=0.000859]


Training loss: 0.0008592378510144241


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.09batch/s]


Test loss: 0.001067940442436865
epoch time: 50.3865 seconds

Starting epoch 41


Epoch 41/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.39batch/s, batch loss=0.00124, mean epoch loss=0.000839]


Training loss: 0.0008388665976514194


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.89batch/s]


Test loss: 0.0009813753165010559
epoch time: 50.4395 seconds

Starting epoch 42


Epoch 42/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.27batch/s, batch loss=0.00102, mean epoch loss=0.000826]


Training loss: 0.0008263425078348419


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.37batch/s]


Test loss: 0.0009773728014950296
epoch time: 50.7771 seconds

Starting epoch 43


Epoch 43/500: 100%|███████████████████████████████| 909/909 [00:49<00:00, 18.20batch/s, batch loss=0.001, mean epoch loss=0.00082]


Training loss: 0.0008200421961600973


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.67batch/s]


Test loss: 0.0009787197736410521
epoch time: 50.9145 seconds

Starting epoch 44


Epoch 44/500: 100%|████████████████████████████| 909/909 [00:50<00:00, 18.12batch/s, batch loss=0.000245, mean epoch loss=0.00082]


Training loss: 0.000820015046128371


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.81batch/s]


Test loss: 0.0010923959892304418
epoch time: 51.1983 seconds

Starting epoch 45


Epoch 45/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.51batch/s, batch loss=0.000844, mean epoch loss=0.000822]


Training loss: 0.0008219412263962815


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.70batch/s]


Test loss: 0.0009898883220126951
epoch time: 50.0770 seconds

Starting epoch 46


Epoch 46/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.58batch/s, batch loss=0.000518, mean epoch loss=0.000806]


Training loss: 0.0008057891213681141


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.53batch/s]


Test loss: 0.0011024714230045089
epoch time: 49.9272 seconds

Starting epoch 47


Epoch 47/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.64batch/s, batch loss=0.000667, mean epoch loss=0.000811]


Training loss: 0.0008112154166107934


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.86batch/s]


Test loss: 0.0009810459518216942
epoch time: 49.7486 seconds

Starting epoch 48


Epoch 48/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.66batch/s, batch loss=0.000623, mean epoch loss=0.000789]


Training loss: 0.0007892238221110646


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.08batch/s]


Test loss: 0.0011204615848040894
epoch time: 49.7035 seconds

Starting epoch 49


Epoch 49/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.50batch/s, batch loss=0.00128, mean epoch loss=0.000789]


Training loss: 0.0007889803201749708


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.22batch/s]


Test loss: 0.0010183965134753013
epoch time: 50.1239 seconds

Starting epoch 50


Epoch 50/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.63batch/s, batch loss=0.000624, mean epoch loss=0.000816]


Training loss: 0.0008156984664256555


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.47batch/s]


Test loss: 0.0010222987022165111
epoch time: 49.7797 seconds

Starting epoch 51


Epoch 51/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.52batch/s, batch loss=0.000534, mean epoch loss=0.000788]


Training loss: 0.0007876245497382805


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.51batch/s]


Test loss: 0.0010383420911813646
epoch time: 50.1058 seconds

Starting epoch 52


Epoch 52/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.59batch/s, batch loss=0.000515, mean epoch loss=0.000766]


Training loss: 0.0007662567639590484


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.95batch/s]


Test loss: 0.0010131128723610584
epoch time: 49.9155 seconds

Starting epoch 53


Epoch 53/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.52batch/s, batch loss=0.000596, mean epoch loss=0.000783]


Training loss: 0.000782701195640555


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.77batch/s]


Test loss: 0.0010148237160664346
epoch time: 50.0787 seconds

Starting epoch 54


Epoch 54/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.48batch/s, batch loss=0.00116, mean epoch loss=0.000722]


Training loss: 0.0007216526747491209


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.86batch/s]


Test loss: 0.0010003943213776343
epoch time: 50.1850 seconds

Starting epoch 55


Epoch 55/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.51batch/s, batch loss=0.00145, mean epoch loss=0.000709]


Training loss: 0.0007093531108870246


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.69batch/s]


Test loss: 0.0009707255148034739
epoch time: 50.1557 seconds

Starting epoch 56


Epoch 56/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.37batch/s, batch loss=0.00116, mean epoch loss=0.000712]


Training loss: 0.0007119451603814175


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.17batch/s]


Test loss: 0.0009795167645758117
epoch time: 50.5288 seconds

Starting epoch 57


Epoch 57/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.51batch/s, batch loss=0.00219, mean epoch loss=0.000699]


Training loss: 0.0006992867344913723


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.21batch/s]


Test loss: 0.0010197989694700625
epoch time: 50.1031 seconds

Starting epoch 58


Epoch 58/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.51batch/s, batch loss=0.000436, mean epoch loss=0.000699]


Training loss: 0.0006988100401748651


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.19batch/s]


Test loss: 0.000943931510310473
epoch time: 50.1549 seconds

Starting epoch 59


Epoch 59/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.39batch/s, batch loss=0.000516, mean epoch loss=0.000697]


Training loss: 0.0006969588262634314


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.32batch/s]


Test loss: 0.0009959299200042887
epoch time: 50.4178 seconds

Starting epoch 60


Epoch 60/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.50batch/s, batch loss=0.000479, mean epoch loss=0.000687]


Training loss: 0.0006870815545115343


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.18batch/s]


Test loss: 0.0009616583786402387
epoch time: 50.1386 seconds

Starting epoch 61


Epoch 61/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.49batch/s, batch loss=0.000416, mean epoch loss=0.000684]


Training loss: 0.0006839732296553023


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.65batch/s]


Test loss: 0.0009945944460157893
epoch time: 50.1794 seconds

Starting epoch 62


Epoch 62/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.55batch/s, batch loss=0.0014, mean epoch loss=0.000678]


Training loss: 0.0006775534876347679


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.76batch/s]


Test loss: 0.0010133835912902692
epoch time: 49.9908 seconds

Starting epoch 63


Epoch 63/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.53batch/s, batch loss=0.00201, mean epoch loss=0.000673]


Training loss: 0.0006726235055238648


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.63batch/s]


Test loss: 0.0010281285084171319
epoch time: 50.0639 seconds

Starting epoch 64


Epoch 64/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.60batch/s, batch loss=0.0003, mean epoch loss=0.000677]


Training loss: 0.0006770896676610064


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.94batch/s]


Test loss: 0.0010004116675669426
epoch time: 49.8956 seconds

Starting epoch 65


Epoch 65/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.53batch/s, batch loss=0.00108, mean epoch loss=0.000667]


Training loss: 0.0006670177792632088


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.40batch/s]


Test loss: 0.0010009223981270272
epoch time: 50.0794 seconds

Starting epoch 66


Epoch 66/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.55batch/s, batch loss=0.000384, mean epoch loss=0.000669]


Training loss: 0.0006686766184361834


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.32batch/s]


Test loss: 0.0010337696398461335
epoch time: 50.0224 seconds

Starting epoch 67


Epoch 67/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.53batch/s, batch loss=0.000884, mean epoch loss=0.000678]


Training loss: 0.0006777991224910215


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.62batch/s]


Test loss: 0.0011034066349231196
epoch time: 50.0299 seconds

Starting epoch 68


Epoch 68/500: 100%|█████████████████████████████| 909/909 [00:49<00:00, 18.53batch/s, batch loss=0.0008, mean epoch loss=0.000656]


Training loss: 0.0006556003856843048


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.54batch/s]


Test loss: 0.0010122157011401693
epoch time: 50.0358 seconds

Starting epoch 69


Epoch 69/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.58batch/s, batch loss=0.000474, mean epoch loss=0.000656]


Training loss: 0.0006555892405701389


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.25batch/s]


Test loss: 0.001080030627168813
epoch time: 49.9441 seconds

Starting epoch 70


Epoch 70/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.63batch/s, batch loss=0.000414, mean epoch loss=0.000636]


Training loss: 0.0006357440820861068


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.63batch/s]


Test loss: 0.0009624852688590947
epoch time: 49.7988 seconds

Starting epoch 71


Epoch 71/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.63batch/s, batch loss=0.000855, mean epoch loss=0.000635]


Training loss: 0.0006346178055020885


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.99batch/s]


Test loss: 0.0009891867965435314
epoch time: 49.8260 seconds

Starting epoch 72


Epoch 72/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.61batch/s, batch loss=0.000668, mean epoch loss=0.000629]


Training loss: 0.0006285866307230703


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.63batch/s]


Test loss: 0.001007775754336954
epoch time: 49.8287 seconds

Starting epoch 73


Epoch 73/500: 100%|██████████████████████████████| 909/909 [00:48<00:00, 18.59batch/s, batch loss=0.001, mean epoch loss=0.000626]


Training loss: 0.0006260342543400869


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.06batch/s]


Test loss: 0.0009910025885083566
epoch time: 49.8795 seconds

Starting epoch 74


Epoch 74/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.64batch/s, batch loss=0.000631, mean epoch loss=0.000626]


Training loss: 0.0006260554051686645


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.42batch/s]


Test loss: 0.0009959371316271197
epoch time: 49.7866 seconds

Starting epoch 75


Epoch 75/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.64batch/s, batch loss=0.000552, mean epoch loss=0.000619]


Training loss: 0.0006187289345589296


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.04batch/s]


Test loss: 0.000968046759187832
epoch time: 49.7782 seconds

Starting epoch 76


Epoch 76/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.61batch/s, batch loss=0.000665, mean epoch loss=0.000627]


Training loss: 0.000627443932330732


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.66batch/s]


Test loss: 0.0010130631216605636
epoch time: 49.8803 seconds

Starting epoch 77


Epoch 77/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.60batch/s, batch loss=0.000626, mean epoch loss=0.000614]


Training loss: 0.0006136552629889686


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.22batch/s]


Test loss: 0.0009804638212938842
epoch time: 49.8544 seconds

Starting epoch 78


Epoch 78/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.61batch/s, batch loss=0.000823, mean epoch loss=0.000618]


Training loss: 0.0006178411943941096


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.89batch/s]


Test loss: 0.0010069280075473024
epoch time: 49.8551 seconds

Starting epoch 79


Epoch 79/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.54batch/s, batch loss=0.000115, mean epoch loss=0.000614]


Training loss: 0.0006140871601049187


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.28batch/s]


Test loss: 0.0009666998427986216
epoch time: 50.0205 seconds

Starting epoch 80


Epoch 80/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.60batch/s, batch loss=0.000186, mean epoch loss=0.000611]


Training loss: 0.0006111917712590457


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.55batch/s]


Test loss: 0.0010055057813205118
epoch time: 49.8793 seconds

Starting epoch 81


Epoch 81/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.58batch/s, batch loss=0.000965, mean epoch loss=0.000603]


Training loss: 0.0006030125622670228


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.90batch/s]


Test loss: 0.0009911066883145586
epoch time: 49.9040 seconds

Starting epoch 82


Epoch 82/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.57batch/s, batch loss=0.000337, mean epoch loss=0.0006]


Training loss: 0.0005997418618618013


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.67batch/s]


Test loss: 0.0009950275079494244
epoch time: 49.9786 seconds

Starting epoch 83


Epoch 83/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.67batch/s, batch loss=0.00103, mean epoch loss=0.000599]


Training loss: 0.0005985259506227736


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.29batch/s]


Test loss: 0.0009827901765483578
epoch time: 49.6881 seconds

Starting epoch 84


Epoch 84/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.70batch/s, batch loss=0.000556, mean epoch loss=0.000598]


Training loss: 0.0005984071515163338


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.26batch/s]


Test loss: 0.0009997216626192983
epoch time: 49.6006 seconds

Starting epoch 85


Epoch 85/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.64batch/s, batch loss=0.000149, mean epoch loss=0.000594]


Training loss: 0.0005937285147277803


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.74batch/s]


Test loss: 0.0010058442329816323
epoch time: 49.7850 seconds

Starting epoch 86


Epoch 86/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.48batch/s, batch loss=0.000848, mean epoch loss=0.000594]


Training loss: 0.0005935242955507716


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.49batch/s]


Test loss: 0.0009891258148280414
epoch time: 50.1927 seconds

Starting epoch 87


Epoch 87/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.66batch/s, batch loss=0.000165, mean epoch loss=0.000592]


Training loss: 0.0005924141696956248


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.51batch/s]


Test loss: 0.0009794784075654063
epoch time: 49.7076 seconds

Starting epoch 88


Epoch 88/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.64batch/s, batch loss=0.000229, mean epoch loss=0.000592]


Training loss: 0.0005916862051055894


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.96batch/s]


Test loss: 0.0010169489508323176
epoch time: 49.7487 seconds

Starting epoch 89


Epoch 89/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.68batch/s, batch loss=0.00041, mean epoch loss=0.000591]


Training loss: 0.0005913384337862134


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.40batch/s]


Test loss: 0.0010134382243880903
epoch time: 49.6631 seconds

Starting epoch 90


Epoch 90/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.64batch/s, batch loss=0.00153, mean epoch loss=0.000588]


Training loss: 0.0005880069827728923


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.80batch/s]


Test loss: 0.0010000396167589843
epoch time: 49.7702 seconds

Starting epoch 91


Epoch 91/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.59batch/s, batch loss=0.000323, mean epoch loss=0.000587]


Training loss: 0.0005873916440714962


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.15batch/s]


Test loss: 0.0010251160544085954
epoch time: 49.9337 seconds

Starting epoch 92


Epoch 92/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.63batch/s, batch loss=0.000753, mean epoch loss=0.000584]


Training loss: 0.0005843072241498836


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.40batch/s]


Test loss: 0.0009988790555661054
epoch time: 49.8222 seconds

Starting epoch 93


Epoch 93/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.69batch/s, batch loss=0.000765, mean epoch loss=0.000581]


Training loss: 0.0005813200643910257


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.11batch/s]


Test loss: 0.0009762440783608901
epoch time: 49.6533 seconds

Starting epoch 94


Epoch 94/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.72batch/s, batch loss=0.00147, mean epoch loss=0.000582]


Training loss: 0.000582141163599807


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.45batch/s]


Test loss: 0.0009901123378719939
epoch time: 49.5462 seconds

Starting epoch 95


Epoch 95/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.68batch/s, batch loss=0.000511, mean epoch loss=0.000583]


Training loss: 0.0005825354905822211


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.56batch/s]


Test loss: 0.0009781307583723805
epoch time: 49.6290 seconds

Starting epoch 96


Epoch 96/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.72batch/s, batch loss=0.000527, mean epoch loss=0.00058]


Training loss: 0.0005796615624134618


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.42batch/s]


Test loss: 0.0010021768893286782
epoch time: 49.5509 seconds

Starting epoch 97


Epoch 97/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.64batch/s, batch loss=0.000372, mean epoch loss=0.000578]


Training loss: 0.0005782371391584199


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.67batch/s]


Test loss: 0.001000323631237016
epoch time: 49.7793 seconds

Starting epoch 98


Epoch 98/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.67batch/s, batch loss=0.000843, mean epoch loss=0.000578]


Training loss: 0.0005778107342438448


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.77batch/s]


Test loss: 0.0010111931500049601
epoch time: 49.6788 seconds

Starting epoch 99


Epoch 99/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.69batch/s, batch loss=0.00137, mean epoch loss=0.000577]


Training loss: 0.0005773032660004647


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.45batch/s]


Test loss: 0.0009961717376044314
epoch time: 49.6265 seconds

Starting epoch 100


Epoch 100/500: 100%|██████████████████████████| 909/909 [00:48<00:00, 18.72batch/s, batch loss=0.000278, mean epoch loss=0.000578]


Training loss: 0.0005778282021451664


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.41batch/s]


Test loss: 0.0009942712856603688
epoch time: 49.5466 seconds

Starting epoch 101


Epoch 101/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.75batch/s, batch loss=0.00105, mean epoch loss=0.000576]


Training loss: 0.0005762248900390488


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.32batch/s]


Test loss: 0.0010049779881036987
epoch time: 49.4727 seconds

Starting epoch 102


Epoch 102/500: 100%|██████████████████████████| 909/909 [00:48<00:00, 18.73batch/s, batch loss=0.000257, mean epoch loss=0.000576]


Training loss: 0.0005756085380184776


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.61batch/s]


Test loss: 0.0010103527251263394
epoch time: 49.5279 seconds

Starting epoch 103


Epoch 103/500: 100%|██████████████████████████| 909/909 [00:48<00:00, 18.70batch/s, batch loss=0.000154, mean epoch loss=0.000574]


Training loss: 0.0005740690892975935


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.40batch/s]


Test loss: 0.0010054739274844332
epoch time: 49.6085 seconds

Starting epoch 104


Epoch 104/500: 100%|██████████████████████████| 909/909 [00:48<00:00, 18.66batch/s, batch loss=0.000683, mean epoch loss=0.000573]


Training loss: 0.0005734204594641402


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.90batch/s]


Test loss: 0.0009934381698258222
epoch time: 49.7266 seconds

Starting epoch 105


Epoch 105/500: 100%|██████████████████████████| 909/909 [00:48<00:00, 18.72batch/s, batch loss=0.000997, mean epoch loss=0.000571]


Training loss: 0.000571437538012978


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.60batch/s]


Test loss: 0.0010078975340308573
epoch time: 49.5480 seconds

Starting epoch 106


Epoch 106/500: 100%|██████████████████████████| 909/909 [00:48<00:00, 18.68batch/s, batch loss=0.000402, mean epoch loss=0.000572]


Training loss: 0.0005719377689717793


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.61batch/s]


Test loss: 0.0010126756779898546
epoch time: 49.6592 seconds

Starting epoch 107


Epoch 107/500: 100%|██████████████████████████| 909/909 [00:48<00:00, 18.74batch/s, batch loss=0.000785, mean epoch loss=0.000571]


Training loss: 0.0005711217146030396


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.33batch/s]


Test loss: 0.0010101983878197834
epoch time: 49.5068 seconds

Starting epoch 108


Epoch 108/500: 100%|██████████████████████████| 909/909 [00:48<00:00, 18.73batch/s, batch loss=0.000282, mean epoch loss=0.000571]


Training loss: 0.0005710496849919478


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.33batch/s]


Test loss: 0.0010023467221272815

Early stopping at epoch 108. No improvement in test loss for 50 epochs.
lr: 8.769533075169251e-05, weight decay: 2.7559395538018623e-05, final epoch: 57, final test loss: 0.000943931510310473
---------------------------------------------------------
starting trial 1
lr: 2.1104834703347795e-05, weight decay: 0.00012081495499235992

Starting epoch 1


Epoch 1/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.72batch/s, batch loss=0.000353, mean epoch loss=0.00244]


Training loss: 0.002441508858035625


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.49batch/s]


Test loss: 0.0018337063895734517
epoch time: 49.5877 seconds

Starting epoch 2


Epoch 2/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.74batch/s, batch loss=0.000795, mean epoch loss=0.00175]


Training loss: 0.0017510699357658652


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.31batch/s]


Test loss: 0.0016436185932865268
epoch time: 49.4950 seconds

Starting epoch 3


Epoch 3/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.75batch/s, batch loss=0.000996, mean epoch loss=0.00163]


Training loss: 0.0016250641302157469


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.49batch/s]


Test loss: 0.0015448413948577486
epoch time: 49.4676 seconds

Starting epoch 4


Epoch 4/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.73batch/s, batch loss=0.000428, mean epoch loss=0.00156]


Training loss: 0.001562187639351963


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.52batch/s]


Test loss: 0.0014589809990291924
epoch time: 49.5518 seconds

Starting epoch 5


Epoch 5/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.75batch/s, batch loss=0.000715, mean epoch loss=0.00151]


Training loss: 0.00151377748585615


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.30batch/s]


Test loss: 0.0014736165010713433
epoch time: 49.5162 seconds

Starting epoch 6


Epoch 6/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.63batch/s, batch loss=0.000836, mean epoch loss=0.00148]


Training loss: 0.0014818956132019471


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.53batch/s]


Test loss: 0.0014499693551394892
epoch time: 49.7830 seconds

Starting epoch 7


Epoch 7/500: 100%|██████████████████████████████| 909/909 [00:48<00:00, 18.67batch/s, batch loss=0.00116, mean epoch loss=0.00145]


Training loss: 0.0014479742308605228


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.96batch/s]


Test loss: 0.001354050770169124
epoch time: 49.6705 seconds

Starting epoch 8


Epoch 8/500: 100%|██████████████████████████████| 909/909 [00:48<00:00, 18.69batch/s, batch loss=0.00162, mean epoch loss=0.00141]


Training loss: 0.0014092684399260502


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.96batch/s]


Test loss: 0.0013806532853969226
epoch time: 49.6427 seconds

Starting epoch 9


Epoch 9/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.67batch/s, batch loss=0.000639, mean epoch loss=0.00139]


Training loss: 0.00139265802722643


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.19batch/s]


Test loss: 0.0013441339530369364
epoch time: 49.6802 seconds

Starting epoch 10


Epoch 10/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.65batch/s, batch loss=0.000839, mean epoch loss=0.00135]


Training loss: 0.001347097768706994


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.92batch/s]


Test loss: 0.0013871179473904992
epoch time: 49.7323 seconds

Starting epoch 11


Epoch 11/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.67batch/s, batch loss=0.000562, mean epoch loss=0.00132]


Training loss: 0.00132041326750087


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.19batch/s]


Test loss: 0.0012578862688602194
epoch time: 49.6892 seconds

Starting epoch 12


Epoch 12/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.54batch/s, batch loss=0.000608, mean epoch loss=0.00131]


Training loss: 0.0013058802884684752


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.52batch/s]


Test loss: 0.0012992625835498697
epoch time: 50.0076 seconds

Starting epoch 13


Epoch 13/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.71batch/s, batch loss=0.00307, mean epoch loss=0.00129]


Training loss: 0.0012851140130129648


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.94batch/s]


Test loss: 0.0012929882039315998
epoch time: 49.5632 seconds

Starting epoch 14


Epoch 14/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.70batch/s, batch loss=0.000545, mean epoch loss=0.00126]


Training loss: 0.0012598830645102741


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.90batch/s]


Test loss: 0.0012663128096487765
epoch time: 49.6040 seconds

Starting epoch 15


Epoch 15/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.70batch/s, batch loss=0.00113, mean epoch loss=0.00125]


Training loss: 0.0012455706741747665


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.25batch/s]


Test loss: 0.001240024190873986
epoch time: 49.5709 seconds

Starting epoch 16


Epoch 16/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.72batch/s, batch loss=0.000303, mean epoch loss=0.00123]


Training loss: 0.00122952570183532


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.99batch/s]


Test loss: 0.0011752039062373927
epoch time: 49.5569 seconds

Starting epoch 17


Epoch 17/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.66batch/s, batch loss=0.00184, mean epoch loss=0.00122]


Training loss: 0.001218478819572767


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.91batch/s]


Test loss: 0.001255402788458588
epoch time: 49.7052 seconds

Starting epoch 18


Epoch 18/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.64batch/s, batch loss=0.00115, mean epoch loss=0.00121]


Training loss: 0.0012066045003461348


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.81batch/s]


Test loss: 0.001232298876244673
epoch time: 49.7373 seconds

Starting epoch 19


Epoch 19/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.61batch/s, batch loss=0.000466, mean epoch loss=0.00119]


Training loss: 0.0011908639416985348


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.69batch/s]


Test loss: 0.0011350105551843482
epoch time: 49.8530 seconds

Starting epoch 20


Epoch 20/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.69batch/s, batch loss=0.00306, mean epoch loss=0.00118]


Training loss: 0.0011830759999926644


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.66batch/s]


Test loss: 0.0013266069168151404
epoch time: 49.6580 seconds

Starting epoch 21


Epoch 21/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.63batch/s, batch loss=0.000602, mean epoch loss=0.00116]


Training loss: 0.0011631784187022768


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.02batch/s]


Test loss: 0.0012042738059167995
epoch time: 49.7638 seconds

Starting epoch 22


Epoch 22/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.67batch/s, batch loss=0.00321, mean epoch loss=0.00115]


Training loss: 0.0011548570154384737


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.02batch/s]


Test loss: 0.0012117243307569114
epoch time: 49.6580 seconds

Starting epoch 23


Epoch 23/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.63batch/s, batch loss=0.00181, mean epoch loss=0.00115]


Training loss: 0.0011466997910605495


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.01batch/s]


Test loss: 0.00117652265808398
epoch time: 49.8020 seconds

Starting epoch 24


Epoch 24/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.63batch/s, batch loss=0.00267, mean epoch loss=0.00114]


Training loss: 0.001139755153613461


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.95batch/s]


Test loss: 0.001147812989381093
epoch time: 49.7844 seconds

Starting epoch 25


Epoch 25/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.59batch/s, batch loss=0.00118, mean epoch loss=0.00113]


Training loss: 0.0011308461509044851


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.58batch/s]


Test loss: 0.0011158581553517204
epoch time: 49.9247 seconds

Starting epoch 26


Epoch 26/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.55batch/s, batch loss=0.000735, mean epoch loss=0.00111]


Training loss: 0.001111346140080741


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.03batch/s]


Test loss: 0.0010901164827182104
epoch time: 50.0166 seconds

Starting epoch 27


Epoch 27/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.57batch/s, batch loss=0.00112, mean epoch loss=0.00111]


Training loss: 0.0011138120457536808


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.49batch/s]


Test loss: 0.0011218137680675442
epoch time: 49.9247 seconds

Starting epoch 28


Epoch 28/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.60batch/s, batch loss=0.000838, mean epoch loss=0.00111]


Training loss: 0.0011057728458208347


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.79batch/s]


Test loss: 0.0011023444129693272
epoch time: 49.8840 seconds

Starting epoch 29


Epoch 29/500: 100%|██████████████████████████████| 909/909 [00:48<00:00, 18.62batch/s, batch loss=0.00244, mean epoch loss=0.0011]


Training loss: 0.001099641524104858


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.14batch/s]


Test loss: 0.001194520143939084
epoch time: 49.8162 seconds

Starting epoch 30


Epoch 30/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.62batch/s, batch loss=0.000194, mean epoch loss=0.00109]


Training loss: 0.0010851350578935908


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.12batch/s]


Test loss: 0.0013224528008753335
epoch time: 49.8087 seconds

Starting epoch 31


Epoch 31/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.66batch/s, batch loss=0.00424, mean epoch loss=0.00108]


Training loss: 0.001083282552483672


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.77batch/s]


Test loss: 0.001143559029227809
epoch time: 49.7011 seconds

Starting epoch 32


Epoch 32/500: 100%|█████████████████████████████| 909/909 [00:49<00:00, 18.53batch/s, batch loss=0.00162, mean epoch loss=0.00108]


Training loss: 0.001076933680043253


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.62batch/s]


Test loss: 0.0011653248808885875
epoch time: 50.0323 seconds

Starting epoch 33


Epoch 33/500: 100%|█████████████████████████████| 909/909 [00:49<00:00, 18.45batch/s, batch loss=0.00591, mean epoch loss=0.00107]


Training loss: 0.00106550882587831


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.70batch/s]


Test loss: 0.0012244997218275736
epoch time: 50.2562 seconds

Starting epoch 34


Epoch 34/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.67batch/s, batch loss=0.000768, mean epoch loss=0.00106]


Training loss: 0.0010607571721016004


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.35batch/s]


Test loss: 0.0010755501365852787
epoch time: 49.7195 seconds

Starting epoch 35


Epoch 35/500: 100%|██████████████████████████████| 909/909 [00:48<00:00, 18.71batch/s, batch loss=0.0014, mean epoch loss=0.00105]


Training loss: 0.0010533098300982459


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.18batch/s]


Test loss: 0.001094694176725553
epoch time: 49.5645 seconds

Starting epoch 36


Epoch 36/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.63batch/s, batch loss=0.000363, mean epoch loss=0.00104]


Training loss: 0.0010424052846890273


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.57batch/s]


Test loss: 0.0011183356103413788
epoch time: 49.7795 seconds

Starting epoch 37


Epoch 37/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.59batch/s, batch loss=0.000856, mean epoch loss=0.00104]


Training loss: 0.0010448054078608681


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.78batch/s]


Test loss: 0.0010863968036382606
epoch time: 49.8904 seconds

Starting epoch 38


Epoch 38/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.50batch/s, batch loss=0.000183, mean epoch loss=0.00104]


Training loss: 0.0010370391171476297


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.88batch/s]


Test loss: 0.0010467925979020564
epoch time: 50.1924 seconds

Starting epoch 39


Epoch 39/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.55batch/s, batch loss=0.000659, mean epoch loss=0.00103]


Training loss: 0.0010320643984951638


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.80batch/s]


Test loss: 0.001103083246179219
epoch time: 49.9827 seconds

Starting epoch 40


Epoch 40/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.68batch/s, batch loss=0.00173, mean epoch loss=0.00102]


Training loss: 0.0010205543899801852


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.47batch/s]


Test loss: 0.0010729505637611606
epoch time: 49.6628 seconds

Starting epoch 41


Epoch 41/500: 100%|██████████████████████████████| 909/909 [00:48<00:00, 18.70batch/s, batch loss=0.0003, mean epoch loss=0.00101]


Training loss: 0.0010084032055741787


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.03batch/s]


Test loss: 0.0011451838712673635
epoch time: 49.5955 seconds

Starting epoch 42


Epoch 42/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.62batch/s, batch loss=0.000967, mean epoch loss=0.00101]


Training loss: 0.001012798402487181


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.71batch/s]


Test loss: 0.0010792721986562308
epoch time: 49.8164 seconds

Starting epoch 43


Epoch 43/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.57batch/s, batch loss=0.00178, mean epoch loss=0.00101]


Training loss: 0.001009418271875549


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.87batch/s]


Test loss: 0.0011279159256159083
epoch time: 49.9384 seconds

Starting epoch 44


Epoch 44/500: 100%|██████████████████████████████| 909/909 [00:49<00:00, 18.53batch/s, batch loss=0.000841, mean epoch loss=0.001]


Training loss: 0.0010042595343936565


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.77batch/s]


Test loss: 0.0010674578119314422
epoch time: 50.0815 seconds

Starting epoch 45


Epoch 45/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.54batch/s, batch loss=0.00092, mean epoch loss=0.000996]


Training loss: 0.0009958276532775962


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.69batch/s]


Test loss: 0.0010284870300797354
epoch time: 50.0719 seconds

Starting epoch 46


Epoch 46/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.58batch/s, batch loss=0.000619, mean epoch loss=0.000984]


Training loss: 0.0009838644864600626


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.29batch/s]


Test loss: 0.0010916347252388828
epoch time: 49.9418 seconds

Starting epoch 47


Epoch 47/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.50batch/s, batch loss=0.00112, mean epoch loss=0.000994]


Training loss: 0.0009941152463715057


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.82batch/s]


Test loss: 0.0010980421487291
epoch time: 50.1389 seconds

Starting epoch 48


Epoch 48/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.62batch/s, batch loss=0.000984, mean epoch loss=0.000984]


Training loss: 0.000984338633899246


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.74batch/s]


Test loss: 0.001074605815627269
epoch time: 49.8260 seconds

Starting epoch 49


Epoch 49/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.65batch/s, batch loss=0.00141, mean epoch loss=0.000982]


Training loss: 0.0009820032588338655


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.24batch/s]


Test loss: 0.0011114230244665554
epoch time: 49.7356 seconds

Starting epoch 50


Epoch 50/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.68batch/s, batch loss=0.00141, mean epoch loss=0.000966]


Training loss: 0.0009655381673388593


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.75batch/s]


Test loss: 0.001062163322747342
epoch time: 49.6778 seconds

Starting epoch 51


Epoch 51/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.61batch/s, batch loss=0.000417, mean epoch loss=0.000968]


Training loss: 0.0009682622060501934


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.46batch/s]


Test loss: 0.0010882479178498646
epoch time: 49.8519 seconds

Starting epoch 52


Epoch 52/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.59batch/s, batch loss=0.00116, mean epoch loss=0.000964]


Training loss: 0.0009638898412282584


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.52batch/s]


Test loss: 0.0011484812629580694
epoch time: 49.8877 seconds

Starting epoch 53


Epoch 53/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.64batch/s, batch loss=0.00143, mean epoch loss=0.000957]


Training loss: 0.0009572845698446722


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.37batch/s]


Test loss: 0.0011469642751188458
epoch time: 49.7726 seconds

Starting epoch 54


Epoch 54/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.64batch/s, batch loss=0.00113, mean epoch loss=0.000959]


Training loss: 0.000958934016188602


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.85batch/s]


Test loss: 0.0010682024561040298
epoch time: 49.7848 seconds

Starting epoch 55


Epoch 55/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.63batch/s, batch loss=0.00124, mean epoch loss=0.000942]


Training loss: 0.0009416369811902735


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.41batch/s]


Test loss: 0.0011746398072175093
epoch time: 49.8053 seconds

Starting epoch 56


Epoch 56/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.59batch/s, batch loss=0.000425, mean epoch loss=0.000934]


Training loss: 0.0009342195900060785


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.50batch/s]


Test loss: 0.0011448327712347045
epoch time: 49.9162 seconds

Starting epoch 57


Epoch 57/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.60batch/s, batch loss=0.0014, mean epoch loss=0.000904]


Training loss: 0.0009042626651894297


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.41batch/s]


Test loss: 0.001035036158895022
epoch time: 49.8785 seconds

Starting epoch 58


Epoch 58/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.66batch/s, batch loss=0.00126, mean epoch loss=0.000896]


Training loss: 0.0008963261862656581


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.76batch/s]


Test loss: 0.00106371300981233
epoch time: 49.7154 seconds

Starting epoch 59


Epoch 59/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.57batch/s, batch loss=0.00041, mean epoch loss=0.000889]


Training loss: 0.0008892694836469215


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.14batch/s]


Test loss: 0.0011449937304285796
epoch time: 49.9770 seconds

Starting epoch 60


Epoch 60/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.66batch/s, batch loss=0.000992, mean epoch loss=0.000887]


Training loss: 0.0008867344595063493


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.90batch/s]


Test loss: 0.0010829731129649047
epoch time: 49.7454 seconds

Starting epoch 61


Epoch 61/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.65batch/s, batch loss=0.000506, mean epoch loss=0.000881]


Training loss: 0.0008812144124652213


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.98batch/s]


Test loss: 0.0010231165481902854
epoch time: 49.7781 seconds

Starting epoch 62


Epoch 62/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.65batch/s, batch loss=0.0011, mean epoch loss=0.000883]


Training loss: 0.0008826173589383898


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.69batch/s]


Test loss: 0.0012539422004728725
epoch time: 49.7434 seconds

Starting epoch 63


Epoch 63/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.63batch/s, batch loss=0.00205, mean epoch loss=0.000887]


Training loss: 0.0008872137169330099


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.59batch/s]


Test loss: 0.0010463610179661039
epoch time: 49.7771 seconds

Starting epoch 64


Epoch 64/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.56batch/s, batch loss=0.00115, mean epoch loss=0.000875]


Training loss: 0.0008748710158272575


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.53batch/s]


Test loss: 0.0010663991928786824
epoch time: 49.9427 seconds

Starting epoch 65


Epoch 65/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.60batch/s, batch loss=0.000583, mean epoch loss=0.000872]


Training loss: 0.0008716614103013953


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.35batch/s]


Test loss: 0.001041922300110424
epoch time: 49.8626 seconds

Starting epoch 66


Epoch 66/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.61batch/s, batch loss=0.000211, mean epoch loss=0.000863]


Training loss: 0.000862555731650405


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.74batch/s]


Test loss: 0.0010514954892354772
epoch time: 49.8406 seconds

Starting epoch 67


Epoch 67/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.64batch/s, batch loss=0.000823, mean epoch loss=0.000862]


Training loss: 0.0008619058958970152


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.68batch/s]


Test loss: 0.00109080285029976
epoch time: 49.7492 seconds

Starting epoch 68


Epoch 68/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.61batch/s, batch loss=0.000929, mean epoch loss=0.000868]


Training loss: 0.000868383097763704


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.06batch/s]


Test loss: 0.001060855721344093
epoch time: 49.8474 seconds

Starting epoch 69


Epoch 69/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.61batch/s, batch loss=0.000619, mean epoch loss=0.000864]


Training loss: 0.0008638456622428056


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.16batch/s]


Test loss: 0.0012016201434705994
epoch time: 49.8428 seconds

Starting epoch 70


Epoch 70/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.63batch/s, batch loss=0.000442, mean epoch loss=0.000854]


Training loss: 0.0008541011488261967


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.08batch/s]


Test loss: 0.001020057675257129
epoch time: 49.8302 seconds

Starting epoch 71


Epoch 71/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.64batch/s, batch loss=0.00161, mean epoch loss=0.000846]


Training loss: 0.0008455215768726072


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.03batch/s]


Test loss: 0.0010420661079574769
epoch time: 49.7700 seconds

Starting epoch 72


Epoch 72/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.61batch/s, batch loss=0.000331, mean epoch loss=0.000847]


Training loss: 0.0008470809990856799


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.00batch/s]


Test loss: 0.001099572154864865
epoch time: 49.8270 seconds

Starting epoch 73


Epoch 73/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.66batch/s, batch loss=0.00021, mean epoch loss=0.000855]


Training loss: 0.0008554122237516418


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.01batch/s]


Test loss: 0.001090289327303732
epoch time: 49.7052 seconds

Starting epoch 74


Epoch 74/500: 100%|██████████████████████████████| 909/909 [00:48<00:00, 18.63batch/s, batch loss=0.002, mean epoch loss=0.000844]


Training loss: 0.0008437342942033165


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.09batch/s]


Test loss: 0.0010461921540186987
epoch time: 49.8051 seconds

Starting epoch 75


Epoch 75/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.66batch/s, batch loss=0.00116, mean epoch loss=0.000843]


Training loss: 0.0008425873115606444


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.89batch/s]


Test loss: 0.0010718851524870842
epoch time: 49.6871 seconds

Starting epoch 76


Epoch 76/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.66batch/s, batch loss=0.00109, mean epoch loss=0.000839]


Training loss: 0.0008392245508330193


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.51batch/s]


Test loss: 0.0010453040029939362
epoch time: 49.7092 seconds

Starting epoch 77


Epoch 77/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.68batch/s, batch loss=0.000354, mean epoch loss=0.000833]


Training loss: 0.0008327484003061862


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.76batch/s]


Test loss: 0.0010268406729569267
epoch time: 49.6458 seconds

Starting epoch 78


Epoch 78/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.67batch/s, batch loss=0.00112, mean epoch loss=0.000846]


Training loss: 0.0008461970087004788


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.10batch/s]


Test loss: 0.0010449960129335523
epoch time: 49.6738 seconds

Starting epoch 79


Epoch 79/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.62batch/s, batch loss=0.00101, mean epoch loss=0.000837]


Training loss: 0.0008370920820705356


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.59batch/s]


Test loss: 0.0010534690674639455
epoch time: 49.8232 seconds

Starting epoch 80


Epoch 80/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.66batch/s, batch loss=0.000698, mean epoch loss=0.000828]


Training loss: 0.0008279767167546742


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.94batch/s]


Test loss: 0.0010220707087826573
epoch time: 49.7187 seconds

Starting epoch 81


Epoch 81/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.64batch/s, batch loss=0.000405, mean epoch loss=0.00083]


Training loss: 0.0008302374299171796


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.29batch/s]


Test loss: 0.0010823759056572606
epoch time: 49.7745 seconds

Starting epoch 82


Epoch 82/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.61batch/s, batch loss=0.000303, mean epoch loss=0.000809]


Training loss: 0.0008085653855024409


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.90batch/s]


Test loss: 0.0010434653891838695
epoch time: 49.8364 seconds

Starting epoch 83


Epoch 83/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.64batch/s, batch loss=0.000605, mean epoch loss=0.000806]


Training loss: 0.0008059999587129452


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.21batch/s]


Test loss: 0.0010273145796657588
epoch time: 49.7549 seconds

Starting epoch 84


Epoch 84/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.67batch/s, batch loss=0.000357, mean epoch loss=0.000799]


Training loss: 0.0007987505860511243


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.49batch/s]


Test loss: 0.0010438778627614835
epoch time: 49.6658 seconds

Starting epoch 85


Epoch 85/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.66batch/s, batch loss=0.000613, mean epoch loss=0.000801]


Training loss: 0.0008007460319467118


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.66batch/s]


Test loss: 0.0010768757737854397
epoch time: 49.7005 seconds

Starting epoch 86


Epoch 86/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.68batch/s, batch loss=0.000515, mean epoch loss=0.000795]


Training loss: 0.0007952186844586493


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.05batch/s]


Test loss: 0.0010209545211278294
epoch time: 49.6487 seconds

Starting epoch 87


Epoch 87/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.64batch/s, batch loss=0.000925, mean epoch loss=0.000795]


Training loss: 0.0007948604353480845


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.33batch/s]


Test loss: 0.0010591473785768215
epoch time: 49.7547 seconds

Starting epoch 88


Epoch 88/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.67batch/s, batch loss=0.000358, mean epoch loss=0.000794]


Training loss: 0.0007942110296526163


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.79batch/s]


Test loss: 0.0010393449256968636
epoch time: 49.6870 seconds

Starting epoch 89


Epoch 89/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.70batch/s, batch loss=0.000377, mean epoch loss=0.000793]


Training loss: 0.0007932764534202375


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.91batch/s]


Test loss: 0.0010594644697113453
epoch time: 49.5832 seconds

Starting epoch 90


Epoch 90/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.66batch/s, batch loss=0.000266, mean epoch loss=0.000793]


Training loss: 0.0007930050721517288


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.63batch/s]


Test loss: 0.0010478483764209637
epoch time: 49.7231 seconds

Starting epoch 91


Epoch 91/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.66batch/s, batch loss=0.000215, mean epoch loss=0.000793]


Training loss: 0.0007932363453202246


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.56batch/s]


Test loss: 0.0010672013897228202
epoch time: 49.6886 seconds

Starting epoch 92


Epoch 92/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.65batch/s, batch loss=0.00198, mean epoch loss=0.000785]


Training loss: 0.000784876745203994


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.43batch/s]


Test loss: 0.0010489301999577468
epoch time: 49.7462 seconds

Starting epoch 93


Epoch 93/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.71batch/s, batch loss=0.00027, mean epoch loss=0.000775]


Training loss: 0.000774724790903922


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.53batch/s]


Test loss: 0.001041287067652631
epoch time: 49.5579 seconds

Starting epoch 94


Epoch 94/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.60batch/s, batch loss=0.000283, mean epoch loss=0.000775]


Training loss: 0.0007754602845212239


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.69batch/s]


Test loss: 0.0010341331457694699
epoch time: 49.8401 seconds

Starting epoch 95


Epoch 95/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.66batch/s, batch loss=0.000288, mean epoch loss=0.000777]


Training loss: 0.000777034309441152


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.53batch/s]


Test loss: 0.001036330556962639
epoch time: 49.6919 seconds

Starting epoch 96


Epoch 96/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.67batch/s, batch loss=0.00113, mean epoch loss=0.000774]


Training loss: 0.0007737585223051033


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.84batch/s]


Test loss: 0.0010527258734280048
epoch time: 49.6484 seconds

Starting epoch 97


Epoch 97/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.61batch/s, batch loss=0.00058, mean epoch loss=0.000773]


Training loss: 0.000772562009901691


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.13batch/s]


Test loss: 0.001025582480513932
epoch time: 49.8388 seconds

Starting epoch 98


Epoch 98/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.60batch/s, batch loss=0.00013, mean epoch loss=0.000773]


Training loss: 0.0007728411756123942


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.82batch/s]


Test loss: 0.0010429144365173813
epoch time: 49.8516 seconds

Starting epoch 99


Epoch 99/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.59batch/s, batch loss=0.000897, mean epoch loss=0.000772]


Training loss: 0.0007720345022902904


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.88batch/s]


Test loss: 0.0010485144607771777
epoch time: 49.8627 seconds

Starting epoch 100


Epoch 100/500: 100%|██████████████████████████| 909/909 [00:48<00:00, 18.67batch/s, batch loss=0.000267, mean epoch loss=0.000772]


Training loss: 0.0007719346196691011


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.42batch/s]


Test loss: 0.0010559605557079379
epoch time: 49.6946 seconds

Starting epoch 101


Epoch 101/500: 100%|██████████████████████████| 909/909 [00:48<00:00, 18.67batch/s, batch loss=0.000562, mean epoch loss=0.000767]


Training loss: 0.0007671809753056511


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.43batch/s]


Test loss: 0.0010655724175433678
epoch time: 49.6711 seconds

Starting epoch 102


Epoch 102/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.63batch/s, batch loss=0.00215, mean epoch loss=0.000769]


Training loss: 0.0007688353030807395


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.52batch/s]


Test loss: 0.001038631329643785
epoch time: 49.7669 seconds

Starting epoch 103


Epoch 103/500: 100%|██████████████████████████| 909/909 [00:48<00:00, 18.73batch/s, batch loss=0.000415, mean epoch loss=0.000767]


Training loss: 0.0007674866568311107


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.19batch/s]


Test loss: 0.0010565145226121928
epoch time: 49.5251 seconds

Starting epoch 104


Epoch 104/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.59batch/s, batch loss=0.00181, mean epoch loss=0.000763]


Training loss: 0.0007625012988315811


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.31batch/s]


Test loss: 0.0010295734682586044
epoch time: 49.8775 seconds

Starting epoch 105


Epoch 105/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.58batch/s, batch loss=0.001, mean epoch loss=0.000762]


Training loss: 0.0007617361794199105


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.69batch/s]


Test loss: 0.0010430141773356712
epoch time: 49.9178 seconds

Starting epoch 106


Epoch 106/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.65batch/s, batch loss=0.000278, mean epoch loss=0.00076]


Training loss: 0.0007601725047297864


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.48batch/s]


Test loss: 0.0010641617486008296
epoch time: 49.7204 seconds

Starting epoch 107


Epoch 107/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.72batch/s, batch loss=0.00046, mean epoch loss=0.00076]


Training loss: 0.0007598550654089051


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.99batch/s]


Test loss: 0.0010642450914019718
epoch time: 49.5281 seconds

Starting epoch 108


Epoch 108/500: 100%|██████████████████████████| 909/909 [00:48<00:00, 18.65batch/s, batch loss=0.000501, mean epoch loss=0.000761]


Training loss: 0.0007610138371560289


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.03batch/s]


Test loss: 0.0010551310959272086
epoch time: 49.7115 seconds

Starting epoch 109


Epoch 109/500: 100%|██████████████████████████| 909/909 [00:48<00:00, 18.62batch/s, batch loss=0.000755, mean epoch loss=0.000759]


Training loss: 0.0007593236601894772


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.69batch/s]


Test loss: 0.0010564074483945182
epoch time: 49.7965 seconds

Starting epoch 110


Epoch 110/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.60batch/s, batch loss=0.00026, mean epoch loss=0.000759]


Training loss: 0.0007586561360028117


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.42batch/s]


Test loss: 0.0010520327131656047
epoch time: 49.8354 seconds

Starting epoch 111


Epoch 111/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.64batch/s, batch loss=0.00114, mean epoch loss=0.000758]


Training loss: 0.0007576334402875717


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.81batch/s]


Test loss: 0.0010305655979257274
epoch time: 49.7265 seconds

Starting epoch 112


Epoch 112/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.64batch/s, batch loss=0.00102, mean epoch loss=0.000757]


Training loss: 0.0007569357567883406


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.43batch/s]


Test loss: 0.0010660492392305873
epoch time: 49.7345 seconds

Starting epoch 113


Epoch 113/500: 100%|██████████████████████████| 909/909 [00:48<00:00, 18.58batch/s, batch loss=0.000988, mean epoch loss=0.000758]


Training loss: 0.0007576370249573823


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.86batch/s]


Test loss: 0.0010392324848860306
epoch time: 49.8774 seconds

Starting epoch 114


Epoch 114/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.63batch/s, batch loss=0.0018, mean epoch loss=0.000756]


Training loss: 0.0007562815540436116


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.59batch/s]


Test loss: 0.0010468441921004437
epoch time: 49.7971 seconds

Starting epoch 115


Epoch 115/500: 100%|██████████████████████████| 909/909 [00:49<00:00, 18.45batch/s, batch loss=0.000946, mean epoch loss=0.000754]


Training loss: 0.0007544544070789207


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.62batch/s]


Test loss: 0.0010511346017378137
epoch time: 50.2854 seconds

Starting epoch 116


Epoch 116/500: 100%|██████████████████████████| 909/909 [00:49<00:00, 18.45batch/s, batch loss=0.000361, mean epoch loss=0.000754]


Training loss: 0.0007535162604124745


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.70batch/s]


Test loss: 0.0010559610752879005
epoch time: 50.3047 seconds

Starting epoch 117


Epoch 117/500: 100%|██████████████████████████| 909/909 [00:49<00:00, 18.55batch/s, batch loss=0.000926, mean epoch loss=0.000753]


Training loss: 0.0007531049390583057


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.51batch/s]


Test loss: 0.0010668079911020437
epoch time: 50.0016 seconds

Starting epoch 118


Epoch 118/500: 100%|██████████████████████████| 909/909 [00:49<00:00, 18.52batch/s, batch loss=0.000111, mean epoch loss=0.000753]


Training loss: 0.0007525886792249131


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.42batch/s]


Test loss: 0.0010612252879103547
epoch time: 50.1092 seconds

Starting epoch 119


Epoch 119/500: 100%|██████████████████████████| 909/909 [00:49<00:00, 18.53batch/s, batch loss=0.000646, mean epoch loss=0.000754]


Training loss: 0.000753750479751482


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.71batch/s]


Test loss: 0.0010525465754510246
epoch time: 50.0510 seconds

Starting epoch 120


Epoch 120/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.61batch/s, batch loss=0.0002, mean epoch loss=0.000752]


Training loss: 0.0007515089397278288


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.77batch/s]


Test loss: 0.001043072282826822

Early stopping at epoch 120. No improvement in test loss for 50 epochs.
lr: 2.1104834703347795e-05, weight decay: 0.00012081495499235992, final epoch: 69, final test loss: 0.001020057675257129
---------------------------------------------------------
starting trial 2
lr: 0.000567164517238037, weight decay: 0.0004488643154359018

Starting epoch 1


Epoch 1/500: 100%|██████████████████████████████| 909/909 [00:48<00:00, 18.62batch/s, batch loss=0.00199, mean epoch loss=0.00184]


Training loss: 0.001837962945078974


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.04batch/s]


Test loss: 0.0014698846424978814
epoch time: 49.8204 seconds

Starting epoch 2


Epoch 2/500: 100%|███████████████████████████████| 909/909 [00:48<00:00, 18.63batch/s, batch loss=0.00358, mean epoch loss=0.0015]


Training loss: 0.0014988310475867268


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.89batch/s]


Test loss: 0.0014310202256494545
epoch time: 49.7652 seconds

Starting epoch 3


Epoch 3/500: 100%|██████████████████████████████| 909/909 [00:48<00:00, 18.61batch/s, batch loss=0.00142, mean epoch loss=0.00145]


Training loss: 0.0014517378081204252


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.88batch/s]


Test loss: 0.0013242674731085763
epoch time: 49.8325 seconds

Starting epoch 4


Epoch 4/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.57batch/s, batch loss=0.000974, mean epoch loss=0.00138]


Training loss: 0.0013837818480511702


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.61batch/s]


Test loss: 0.0014137600435213627
epoch time: 49.9402 seconds

Starting epoch 5


Epoch 5/500: 100%|██████████████████████████████| 909/909 [00:48<00:00, 18.59batch/s, batch loss=0.00196, mean epoch loss=0.00135]


Training loss: 0.0013511075916914199


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.41batch/s]


Test loss: 0.0013645879207424035
epoch time: 49.8529 seconds

Starting epoch 6


Epoch 6/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.62batch/s, batch loss=0.000585, mean epoch loss=0.00133]


Training loss: 0.0013260486219011706


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.70batch/s]


Test loss: 0.0013325226514624726
epoch time: 49.7899 seconds

Starting epoch 7


Epoch 7/500: 100%|██████████████████████████████| 909/909 [00:48<00:00, 18.58batch/s, batch loss=0.00144, mean epoch loss=0.00129]


Training loss: 0.0012870646539297646


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.73batch/s]


Test loss: 0.0012024192301875079
epoch time: 49.8931 seconds

Starting epoch 8


Epoch 8/500: 100%|███████████████████████████████| 909/909 [00:49<00:00, 18.55batch/s, batch loss=0.0016, mean epoch loss=0.00126]


Training loss: 0.0012585646193999617


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.32batch/s]


Test loss: 0.0012151872236771802
epoch time: 49.9597 seconds

Starting epoch 9


Epoch 9/500: 100%|██████████████████████████████| 909/909 [00:48<00:00, 18.59batch/s, batch loss=0.00172, mean epoch loss=0.00127]


Training loss: 0.0012692465671555603


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.58batch/s]


Test loss: 0.0011908092235803213
epoch time: 49.8782 seconds

Starting epoch 10


Epoch 10/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.59batch/s, batch loss=0.000554, mean epoch loss=0.00124]


Training loss: 0.0012442149761614694


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.37batch/s]


Test loss: 0.001213846500276735
epoch time: 49.8892 seconds

Starting epoch 11


Epoch 11/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.61batch/s, batch loss=0.00177, mean epoch loss=0.00121]


Training loss: 0.001208163252470726


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.79batch/s]


Test loss: 0.001507502218009904
epoch time: 49.8210 seconds

Starting epoch 12


Epoch 12/500: 100%|██████████████████████████████| 909/909 [00:48<00:00, 18.62batch/s, batch loss=0.00129, mean epoch loss=0.0012]


Training loss: 0.0012035943102763917


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.68batch/s]


Test loss: 0.0011524847858756977
epoch time: 49.7948 seconds

Starting epoch 13


Epoch 13/500: 100%|█████████████████████████████| 909/909 [00:49<00:00, 18.53batch/s, batch loss=0.00126, mean epoch loss=0.00119]


Training loss: 0.0011943504737611456


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.97batch/s]


Test loss: 0.0011551791818898269
epoch time: 50.0116 seconds

Starting epoch 14


Epoch 14/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.61batch/s, batch loss=0.00191, mean epoch loss=0.00118]


Training loss: 0.0011822417330815702


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.71batch/s]


Test loss: 0.001152340622655557
epoch time: 49.8223 seconds

Starting epoch 15


Epoch 15/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.61batch/s, batch loss=0.00085, mean epoch loss=0.00117]


Training loss: 0.0011671564868782987


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.93batch/s]


Test loss: 0.0012064237711264898
epoch time: 49.8085 seconds

Starting epoch 16


Epoch 16/500: 100%|█████████████████████████████| 909/909 [00:49<00:00, 18.49batch/s, batch loss=0.00121, mean epoch loss=0.00117]


Training loss: 0.0011720776187032626


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.84batch/s]


Test loss: 0.0013400196805473808
epoch time: 50.1234 seconds

Starting epoch 17


Epoch 17/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.58batch/s, batch loss=0.00148, mean epoch loss=0.00117]


Training loss: 0.0011654325266920284


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.82batch/s]


Test loss: 0.0011588634353278107
epoch time: 49.8779 seconds

Starting epoch 18


Epoch 18/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.62batch/s, batch loss=0.000472, mean epoch loss=0.00116]


Training loss: 0.0011588224598360391


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.63batch/s]


Test loss: 0.0011709344989963269
epoch time: 49.8077 seconds

Starting epoch 19


Epoch 19/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.52batch/s, batch loss=0.000867, mean epoch loss=0.00114]


Training loss: 0.001143983462975259


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.64batch/s]


Test loss: 0.0012305609529568373
epoch time: 50.0572 seconds

Starting epoch 20


Epoch 20/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.54batch/s, batch loss=0.000957, mean epoch loss=0.00114]


Training loss: 0.0011436755778431909


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.20batch/s]


Test loss: 0.001185668554880019
epoch time: 49.9939 seconds

Starting epoch 21


Epoch 21/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.63batch/s, batch loss=0.00089, mean epoch loss=0.00113]


Training loss: 0.0011318569587215365


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.58batch/s]


Test loss: 0.0011347335352758436
epoch time: 49.7469 seconds

Starting epoch 22


Epoch 22/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.59batch/s, batch loss=0.000858, mean epoch loss=0.00113]


Training loss: 0.0011304618773904575


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.17batch/s]


Test loss: 0.0011148917606700899
epoch time: 49.8914 seconds

Starting epoch 23


Epoch 23/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.60batch/s, batch loss=0.00153, mean epoch loss=0.00111]


Training loss: 0.001114651268368333


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.89batch/s]


Test loss: 0.0011301074256679338
epoch time: 49.8268 seconds

Starting epoch 24


Epoch 24/500: 100%|██████████████████████████████| 909/909 [00:48<00:00, 18.58batch/s, batch loss=0.0014, mean epoch loss=0.00111]


Training loss: 0.0011146124476525672


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.94batch/s]


Test loss: 0.001200881714957129
epoch time: 49.8800 seconds

Starting epoch 25


Epoch 25/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.62batch/s, batch loss=0.00145, mean epoch loss=0.00112]


Training loss: 0.001116748981338086


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.90batch/s]


Test loss: 0.0013425956057433626
epoch time: 49.8099 seconds

Starting epoch 26


Epoch 26/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.65batch/s, batch loss=0.000609, mean epoch loss=0.0011]


Training loss: 0.001100791565591328


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.34batch/s]


Test loss: 0.0011686515081428775
epoch time: 49.7077 seconds

Starting epoch 27


Epoch 27/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.65batch/s, batch loss=0.00112, mean epoch loss=0.00111]


Training loss: 0.0011111624351900753


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.89batch/s]


Test loss: 0.001122349640048158
epoch time: 49.7081 seconds

Starting epoch 28


Epoch 28/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.66batch/s, batch loss=0.000221, mean epoch loss=0.00109]


Training loss: 0.0010939455645875948


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.49batch/s]


Test loss: 0.001126760244675863
epoch time: 49.6715 seconds

Starting epoch 29


Epoch 29/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.64batch/s, batch loss=0.00217, mean epoch loss=0.00109]


Training loss: 0.0010895025608550124


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.15batch/s]


Test loss: 0.0011222618383870118
epoch time: 49.7397 seconds

Starting epoch 30


Epoch 30/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.60batch/s, batch loss=0.000661, mean epoch loss=0.00109]


Training loss: 0.0010855182371724307


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.18batch/s]


Test loss: 0.0011755281075908753
epoch time: 49.8308 seconds

Starting epoch 31


Epoch 31/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.66batch/s, batch loss=0.000947, mean epoch loss=0.00107]


Training loss: 0.0010732845957875708


Testing: 100%|██████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 100.12batch/s]


Test loss: 0.0011959851936951867
epoch time: 49.6723 seconds

Starting epoch 32


Epoch 32/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.62batch/s, batch loss=0.00054, mean epoch loss=0.00108]


Training loss: 0.001081557214980237


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.36batch/s]


Test loss: 0.0010843138576570996
epoch time: 49.8579 seconds

Starting epoch 33


Epoch 33/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.64batch/s, batch loss=0.00102, mean epoch loss=0.00108]


Training loss: 0.001078662638196069


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.63batch/s]


Test loss: 0.0013906614478113816
epoch time: 49.7341 seconds

Starting epoch 34


Epoch 34/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.66batch/s, batch loss=0.000801, mean epoch loss=0.00108]


Training loss: 0.0010751712688623198


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.01batch/s]


Test loss: 0.0011340556267992053
epoch time: 49.7064 seconds

Starting epoch 35


Epoch 35/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.59batch/s, batch loss=0.000362, mean epoch loss=0.00107]


Training loss: 0.0010653116113833604


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.62batch/s]


Test loss: 0.001329820650617445
epoch time: 49.8586 seconds

Starting epoch 36


Epoch 36/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.69batch/s, batch loss=0.000693, mean epoch loss=0.00106]


Training loss: 0.00106221784855986


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.97batch/s]


Test loss: 0.0010790492760287108
epoch time: 49.6368 seconds

Starting epoch 37


Epoch 37/500: 100%|██████████████████████████████| 909/909 [00:48<00:00, 18.62batch/s, batch loss=0.0015, mean epoch loss=0.00106]


Training loss: 0.0010562270129705514


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.75batch/s]


Test loss: 0.001136341980830031
epoch time: 49.7646 seconds

Starting epoch 38


Epoch 38/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.67batch/s, batch loss=0.00106, mean epoch loss=0.00106]


Training loss: 0.0010617130521137516


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.69batch/s]


Test loss: 0.0011659350138966387
epoch time: 49.6481 seconds

Starting epoch 39


Epoch 39/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.70batch/s, batch loss=0.00073, mean epoch loss=0.00106]


Training loss: 0.001060145529042376


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.84batch/s]


Test loss: 0.001132761901489606
epoch time: 49.5719 seconds

Starting epoch 40


Epoch 40/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.66batch/s, batch loss=0.000641, mean epoch loss=0.00106]


Training loss: 0.0010608673891680082


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.15batch/s]


Test loss: 0.0011476974588157118
epoch time: 49.6858 seconds

Starting epoch 41


Epoch 41/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.57batch/s, batch loss=0.000619, mean epoch loss=0.00105]


Training loss: 0.0010455727187365425


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.55batch/s]


Test loss: 0.001125779754702786
epoch time: 49.9298 seconds

Starting epoch 42


Epoch 42/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.44batch/s, batch loss=0.000991, mean epoch loss=0.00105]


Training loss: 0.0010495235840841202


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.13batch/s]


Test loss: 0.0011095347366981993
epoch time: 50.2643 seconds

Starting epoch 43


Epoch 43/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.61batch/s, batch loss=0.00143, mean epoch loss=0.00105]


Training loss: 0.0010463452409988482


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.96batch/s]


Test loss: 0.001192388543246412
epoch time: 49.8375 seconds

Starting epoch 44


Epoch 44/500: 100%|██████████████████████████████| 909/909 [00:48<00:00, 18.73batch/s, batch loss=0.0011, mean epoch loss=0.00104]


Training loss: 0.001042979021898109


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.75batch/s]


Test loss: 0.0010732916597350451
epoch time: 49.5688 seconds

Starting epoch 45


Epoch 45/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.75batch/s, batch loss=0.00102, mean epoch loss=0.00104]


Training loss: 0.0010368983033707424


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.11batch/s]


Test loss: 0.001069651506412284
epoch time: 49.5167 seconds

Starting epoch 46


Epoch 46/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.06batch/s, batch loss=0.000575, mean epoch loss=0.00104]


Training loss: 0.0010353016436590642


Testing: 100%|██████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 100.69batch/s]


Test loss: 0.0011770155700536347
epoch time: 48.6281 seconds

Starting epoch 47


Epoch 47/500: 100%|█████████████████████████████| 909/909 [00:47<00:00, 19.03batch/s, batch loss=0.00132, mean epoch loss=0.00103]


Training loss: 0.0010263941629139303


Testing: 100%|██████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 100.66batch/s]


Test loss: 0.0010483975191355535
epoch time: 48.7431 seconds

Starting epoch 48


Epoch 48/500: 100%|█████████████████████████████| 909/909 [00:47<00:00, 19.06batch/s, batch loss=0.00262, mean epoch loss=0.00104]


Training loss: 0.0010407509296511098


Testing: 100%|██████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 100.00batch/s]


Test loss: 0.0014214544318077204
epoch time: 48.6329 seconds

Starting epoch 49


Epoch 49/500: 100%|█████████████████████████████| 909/909 [00:47<00:00, 19.05batch/s, batch loss=0.00172, mean epoch loss=0.00103]


Training loss: 0.0010318359016167765


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.09batch/s]


Test loss: 0.0011152543770884605
epoch time: 48.6969 seconds

Starting epoch 50


Epoch 50/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.02batch/s, batch loss=0.000482, mean epoch loss=0.00102]


Training loss: 0.0010240998027257866


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.68batch/s]


Test loss: 0.0011099401699060476
epoch time: 48.7515 seconds

Starting epoch 51


Epoch 51/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.03batch/s, batch loss=0.000513, mean epoch loss=0.00102]


Training loss: 0.0010191654819189351


Testing: 100%|██████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 100.42batch/s]


Test loss: 0.001069233749417196
epoch time: 48.7058 seconds

Starting epoch 52


Epoch 52/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.05batch/s, batch loss=0.000487, mean epoch loss=0.00103]


Training loss: 0.0010252308884136224


Testing: 100%|██████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 100.16batch/s]


Test loss: 0.0011000166794187143
epoch time: 48.6557 seconds

Starting epoch 53


Epoch 53/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.02batch/s, batch loss=0.000428, mean epoch loss=0.00102]


Training loss: 0.0010156510424606448


Testing: 100%|██████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 100.56batch/s]


Test loss: 0.0010711202183493265
epoch time: 48.7296 seconds

Starting epoch 54


Epoch 54/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.08batch/s, batch loss=0.000567, mean epoch loss=0.00101]


Training loss: 0.0010139627352270975


Testing: 100%|██████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 100.19batch/s]


Test loss: 0.0010508843360615796
epoch time: 48.6036 seconds

Starting epoch 55


Epoch 55/500: 100%|█████████████████████████████| 909/909 [00:47<00:00, 18.99batch/s, batch loss=0.00021, mean epoch loss=0.00101]


Training loss: 0.0010067061684401737


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.65batch/s]


Test loss: 0.0010796573184626668
epoch time: 48.8952 seconds

Starting epoch 56


Epoch 56/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 18.94batch/s, batch loss=0.000873, mean epoch loss=0.00101]


Training loss: 0.0010120090168203577


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.99batch/s]


Test loss: 0.001030745390055113
epoch time: 49.0189 seconds

Starting epoch 57


Epoch 57/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.84batch/s, batch loss=0.000958, mean epoch loss=0.00101]


Training loss: 0.001008320756015361


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.25batch/s]


Test loss: 0.0010709687914258164
epoch time: 49.2405 seconds

Starting epoch 58


Epoch 58/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.90batch/s, batch loss=0.00171, mean epoch loss=0.000996]


Training loss: 0.0009955543501877504


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.14batch/s]


Test loss: 0.0011114867496010111
epoch time: 49.0704 seconds

Starting epoch 59


Epoch 59/500: 100%|██████████████████████████████| 909/909 [00:47<00:00, 18.97batch/s, batch loss=0.000252, mean epoch loss=0.001]


Training loss: 0.0009995010409926677


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.20batch/s]


Test loss: 0.001180095857278885
epoch time: 48.9092 seconds

Starting epoch 60


Epoch 60/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.34batch/s, batch loss=0.000657, mean epoch loss=0.000993]


Training loss: 0.0009925467436592739


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.98batch/s]


Test loss: 0.0010619062562718202
epoch time: 50.5716 seconds

Starting epoch 61


Epoch 61/500: 100%|█████████████████████████████| 909/909 [00:49<00:00, 18.19batch/s, batch loss=0.00181, mean epoch loss=0.00101]


Training loss: 0.0010070262130701618


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.95batch/s]


Test loss: 0.0011521278788629724
epoch time: 51.0046 seconds

Starting epoch 62


Epoch 62/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.37batch/s, batch loss=0.000436, mean epoch loss=0.000993]


Training loss: 0.0009926784143109379


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.81batch/s]


Test loss: 0.0010658092701832126
epoch time: 50.4847 seconds

Starting epoch 63


Epoch 63/500: 100%|████████████████████████████████| 909/909 [00:49<00:00, 18.34batch/s, batch loss=0.0016, mean epoch loss=0.001]


Training loss: 0.0009998018839983095


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 91.38batch/s]


Test loss: 0.0010270435865478297
epoch time: 50.6385 seconds

Starting epoch 64


Epoch 64/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.29batch/s, batch loss=0.000403, mean epoch loss=0.000996]


Training loss: 0.000996266948391542


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.72batch/s]


Test loss: 0.0011390301959564614
epoch time: 50.6928 seconds

Starting epoch 65


Epoch 65/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.63batch/s, batch loss=0.00038, mean epoch loss=0.000986]


Training loss: 0.0009855829821940516


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.45batch/s]


Test loss: 0.001124657571046172
epoch time: 49.7920 seconds

Starting epoch 66


Epoch 67/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.57batch/s, batch loss=0.00208, mean epoch loss=0.000985]


Training loss: 0.000985284233431532


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.56batch/s]


Test loss: 0.0010562873990765135
epoch time: 49.9296 seconds

Starting epoch 68


Epoch 68/500: 100%|█████████████████████████████| 909/909 [00:49<00:00, 18.42batch/s, batch loss=0.00119, mean epoch loss=0.00099]


Training loss: 0.0009903958121663507


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.73batch/s]


Test loss: 0.0011638671129108652
epoch time: 50.3254 seconds

Starting epoch 69


Epoch 69/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.27batch/s, batch loss=0.000719, mean epoch loss=0.000987]


Training loss: 0.000986740378280912


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.93batch/s]


Test loss: 0.001045865227627617
epoch time: 50.7678 seconds

Starting epoch 70


Epoch 70/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.33batch/s, batch loss=0.000257, mean epoch loss=0.000987]


Training loss: 0.0009867866501455838


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.95batch/s]


Test loss: 0.0010707877484444333
epoch time: 50.5756 seconds

Starting epoch 71


Epoch 71/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.36batch/s, batch loss=0.000881, mean epoch loss=0.000978]


Training loss: 0.0009783275017580268


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.69batch/s]


Test loss: 0.0010509141365458306
epoch time: 50.4936 seconds

Starting epoch 72


Epoch 72/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.37batch/s, batch loss=0.00103, mean epoch loss=0.000985]


Training loss: 0.0009851835795228162


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.04batch/s]


Test loss: 0.0010646643166087176
epoch time: 50.4875 seconds

Starting epoch 73


Epoch 73/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.36batch/s, batch loss=0.00335, mean epoch loss=0.000988]


Training loss: 0.0009877838812338401


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.19batch/s]


Test loss: 0.001083889024601759
epoch time: 50.4980 seconds

Starting epoch 74


Epoch 74/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.34batch/s, batch loss=0.000506, mean epoch loss=0.000976]


Training loss: 0.0009763582267535813


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.98batch/s]


Test loss: 0.0010250429408379684
epoch time: 50.5824 seconds

Starting epoch 75


Epoch 75/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.29batch/s, batch loss=0.000191, mean epoch loss=0.000972]


Training loss: 0.000971652722326904


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.98batch/s]


Test loss: 0.0010473262488008722
epoch time: 50.7000 seconds

Starting epoch 76


Epoch 76/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.27batch/s, batch loss=0.000347, mean epoch loss=0.000978]


Training loss: 0.0009781547110999434


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.31batch/s]


Test loss: 0.0011401096812302344
epoch time: 50.7611 seconds

Starting epoch 77


Epoch 77/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.22batch/s, batch loss=0.000679, mean epoch loss=0.000971]


Training loss: 0.0009707005263265986


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.71batch/s]


Test loss: 0.0010208587630921484
epoch time: 50.9233 seconds

Starting epoch 78


Epoch 78/500: 100%|███████████████████████████| 909/909 [00:50<00:00, 18.08batch/s, batch loss=0.000472, mean epoch loss=0.000968]


Training loss: 0.0009681551367359436


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.91batch/s]


Test loss: 0.0011380432210372467
epoch time: 51.2505 seconds

Starting epoch 79


Epoch 79/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.19batch/s, batch loss=0.00076, mean epoch loss=0.000972]


Training loss: 0.000972272967737208


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.62batch/s]


Test loss: 0.0010290750593412667
epoch time: 50.9502 seconds

Starting epoch 80


Epoch 80/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.32batch/s, batch loss=0.000877, mean epoch loss=0.000974]


Training loss: 0.0009736569858666759


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.14batch/s]


Test loss: 0.0011167344251206439
epoch time: 50.6025 seconds

Starting epoch 81


Epoch 81/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.29batch/s, batch loss=0.00194, mean epoch loss=0.000974]


Training loss: 0.0009735593785190769


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.16batch/s]


Test loss: 0.001062189163272514
epoch time: 50.6758 seconds

Starting epoch 82


Epoch 82/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.29batch/s, batch loss=0.000452, mean epoch loss=0.000962]


Training loss: 0.0009621189280148115


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.27batch/s]


Test loss: 0.0011402280507976875
epoch time: 50.6697 seconds

Starting epoch 83


Epoch 83/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.30batch/s, batch loss=0.00333, mean epoch loss=0.000966]


Training loss: 0.0009660832317119153


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.04batch/s]


Test loss: 0.001090117687004079
epoch time: 50.6812 seconds

Starting epoch 84


Epoch 84/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.32batch/s, batch loss=0.00101, mean epoch loss=0.000958]


Training loss: 0.0009583872604955857


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.37batch/s]


Test loss: 0.001061365556731624
epoch time: 50.6311 seconds

Starting epoch 85


Epoch 85/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.82batch/s, batch loss=0.000559, mean epoch loss=0.000959]


Training loss: 0.0009587921775342529


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.69batch/s]


Test loss: 0.001046563517363546
epoch time: 49.2880 seconds

Starting epoch 86


Epoch 86/500: 100%|█████████████████████████████| 909/909 [00:47<00:00, 19.07batch/s, batch loss=0.00574, mean epoch loss=0.00456]


Training loss: 0.004562588822950747


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.86batch/s]


Test loss: 0.0017611084953195561
epoch time: 48.6337 seconds

Starting epoch 87


Epoch 87/500: 100%|█████████████████████████████| 909/909 [00:47<00:00, 19.09batch/s, batch loss=0.00257, mean epoch loss=0.00158]


Training loss: 0.0015806389705670385


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.75batch/s]


Test loss: 0.0014959895343054086
epoch time: 48.6081 seconds

Starting epoch 88


Epoch 88/500: 100%|██████████████████████████████| 909/909 [00:47<00:00, 19.06batch/s, batch loss=0.0011, mean epoch loss=0.00144]


Training loss: 0.0014403381758264233


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.85batch/s]


Test loss: 0.001393569454605887
epoch time: 48.6695 seconds

Starting epoch 89


Epoch 89/500: 100%|█████████████████████████████| 909/909 [00:47<00:00, 19.07batch/s, batch loss=0.00179, mean epoch loss=0.00134]


Training loss: 0.0013449971810456087


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.29batch/s]


Test loss: 0.0013266878064697315
epoch time: 48.6587 seconds

Starting epoch 90


Epoch 90/500: 100%|█████████████████████████████| 909/909 [00:47<00:00, 18.96batch/s, batch loss=0.00125, mean epoch loss=0.00132]


Training loss: 0.0013165824264861701


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.20batch/s]


Test loss: 0.0013930248130284446
epoch time: 48.9084 seconds

Starting epoch 91


Epoch 91/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.85batch/s, batch loss=0.000935, mean epoch loss=0.00129]


Training loss: 0.0012949799196830488


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.06batch/s]


Test loss: 0.0014883329013460561
epoch time: 49.1837 seconds

Starting epoch 92


Epoch 92/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.78batch/s, batch loss=0.000372, mean epoch loss=0.00128]


Training loss: 0.0012756515809889868


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.68batch/s]


Test loss: 0.0012569568098498214
epoch time: 49.3698 seconds

Starting epoch 93


Epoch 93/500: 100%|█████████████████████████████| 909/909 [00:47<00:00, 19.03batch/s, batch loss=0.00246, mean epoch loss=0.00126]


Training loss: 0.0012562265618034712


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.64batch/s]


Test loss: 0.0012503783445266124
epoch time: 48.7349 seconds

Starting epoch 94


Epoch 94/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.05batch/s, batch loss=0.000905, mean epoch loss=0.00124]


Training loss: 0.0012420909338383818


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.21batch/s]


Test loss: 0.0011932556495977272
epoch time: 48.6716 seconds

Starting epoch 95


Epoch 95/500: 100%|█████████████████████████████| 909/909 [00:47<00:00, 19.05batch/s, batch loss=0.00029, mean epoch loss=0.00122]


Training loss: 0.0012207929343140118


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.23batch/s]


Test loss: 0.001206251381173436
epoch time: 48.7119 seconds

Starting epoch 96


Epoch 96/500: 100%|██████████████████████████████| 909/909 [00:47<00:00, 19.03batch/s, batch loss=0.00109, mean epoch loss=0.0012]


Training loss: 0.0012040720173637756


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.55batch/s]


Test loss: 0.0012482790325425172
epoch time: 48.7252 seconds

Starting epoch 97


Epoch 97/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.02batch/s, batch loss=0.000285, mean epoch loss=0.00119]


Training loss: 0.0011868238943301493


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.16batch/s]


Test loss: 0.0011791542981212076
epoch time: 48.7493 seconds

Starting epoch 98


Epoch 98/500: 100%|█████████████████████████████| 909/909 [00:47<00:00, 19.10batch/s, batch loss=0.00125, mean epoch loss=0.00118]


Training loss: 0.001182990655515213


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 99.85batch/s]


Test loss: 0.0012009792547599462
epoch time: 48.5419 seconds

Starting epoch 99


Epoch 99/500: 100%|██████████████████████████████| 909/909 [00:47<00:00, 19.11batch/s, batch loss=0.0017, mean epoch loss=0.00117]


Training loss: 0.0011686151485206385


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.82batch/s]


Test loss: 0.0012135270339632897
epoch time: 48.5288 seconds

Starting epoch 100


Epoch 100/500: 100%|███████████████████████████| 909/909 [00:47<00:00, 19.07batch/s, batch loss=0.000859, mean epoch loss=0.00113]


Training loss: 0.00112764354318094


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.34batch/s]


Test loss: 0.0011477162856241001
epoch time: 48.6677 seconds

Starting epoch 101


Epoch 101/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.04batch/s, batch loss=0.00159, mean epoch loss=0.00112]


Training loss: 0.0011208208938628973


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.40batch/s]


Test loss: 0.0011280372711266146
epoch time: 48.6981 seconds

Starting epoch 102


Epoch 102/500: 100%|███████████████████████████| 909/909 [00:47<00:00, 19.10batch/s, batch loss=0.000343, mean epoch loss=0.00111]


Training loss: 0.0011090756597055523


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.73batch/s]


Test loss: 0.0012211716292720091
epoch time: 48.5785 seconds

Starting epoch 103


Epoch 103/500: 100%|███████████████████████████| 909/909 [00:47<00:00, 19.10batch/s, batch loss=0.000479, mean epoch loss=0.00111]


Training loss: 0.0011058032260015372


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.14batch/s]


Test loss: 0.0011528773600921818
epoch time: 48.5669 seconds

Starting epoch 104


Epoch 104/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.14batch/s, batch loss=0.000951, mean epoch loss=0.0011]


Training loss: 0.0010956601399091524


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.04batch/s]


Test loss: 0.0012072725809718432
epoch time: 48.4893 seconds

Starting epoch 105


Epoch 105/500: 100%|███████████████████████████| 909/909 [00:47<00:00, 19.10batch/s, batch loss=0.000488, mean epoch loss=0.00109]


Training loss: 0.0010880327649884299


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.77batch/s]


Test loss: 0.0011212932050081068
epoch time: 48.5656 seconds

Starting epoch 106


Epoch 106/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.11batch/s, batch loss=0.00126, mean epoch loss=0.00108]


Training loss: 0.0010822883063590278


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.26batch/s]


Test loss: 0.0011104466963412338
epoch time: 48.5263 seconds

Starting epoch 107


Epoch 107/500: 100%|██████████████████████████████| 909/909 [00:47<00:00, 19.12batch/s, batch loss=0.002, mean epoch loss=0.00108]


Training loss: 0.0010795385336461892


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.75batch/s]


Test loss: 0.001121247813448702
epoch time: 48.5429 seconds

Starting epoch 108


Epoch 108/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.12batch/s, batch loss=0.00161, mean epoch loss=0.00107]


Training loss: 0.0010724806913355396


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.93batch/s]


Test loss: 0.001206460671719948
epoch time: 48.5256 seconds

Starting epoch 109


Epoch 109/500: 100%|███████████████████████████| 909/909 [00:47<00:00, 19.07batch/s, batch loss=0.000482, mean epoch loss=0.00107]


Training loss: 0.0010663720855594518


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.35batch/s]


Test loss: 0.0011384625909972544
epoch time: 48.6381 seconds

Starting epoch 110


Epoch 110/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.12batch/s, batch loss=0.00132, mean epoch loss=0.00106]


Training loss: 0.0010603761341955182


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.26batch/s]


Test loss: 0.0011086781855403004
epoch time: 48.5225 seconds

Starting epoch 111


Epoch 111/500: 100%|███████████████████████████| 909/909 [00:47<00:00, 19.09batch/s, batch loss=0.000129, mean epoch loss=0.00104]


Training loss: 0.0010441388771705953


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.28batch/s]


Test loss: 0.001105034056327943
epoch time: 48.5828 seconds

Starting epoch 112


Epoch 112/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.09batch/s, batch loss=0.00145, mean epoch loss=0.00104]


Training loss: 0.001043116277435562


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.67batch/s]


Test loss: 0.0010815337407525237
epoch time: 48.6326 seconds

Starting epoch 113


Epoch 113/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.12batch/s, batch loss=0.00153, mean epoch loss=0.00104]


Training loss: 0.0010401485454360519


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.28batch/s]


Test loss: 0.0010769146414914806
epoch time: 48.5341 seconds

Starting epoch 114


Epoch 114/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.12batch/s, batch loss=0.00144, mean epoch loss=0.00104]


Training loss: 0.0010360639799088885


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.60batch/s]


Test loss: 0.001085329752439927
epoch time: 48.5015 seconds

Starting epoch 115


Epoch 115/500: 100%|███████████████████████████| 909/909 [00:47<00:00, 19.14batch/s, batch loss=0.000288, mean epoch loss=0.00104]


Training loss: 0.0010358304965902248


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.67batch/s]


Test loss: 0.001123249043073309
epoch time: 48.4625 seconds

Starting epoch 116


Epoch 116/500: 100%|███████████████████████████| 909/909 [00:47<00:00, 19.14batch/s, batch loss=0.000186, mean epoch loss=0.00103]


Training loss: 0.001034277391665317


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.79batch/s]


Test loss: 0.001111184689522672
epoch time: 48.4887 seconds

Starting epoch 117


Epoch 117/500: 100%|███████████████████████████| 909/909 [00:47<00:00, 19.17batch/s, batch loss=0.000908, mean epoch loss=0.00103]


Training loss: 0.0010323703625903216


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.69batch/s]


Test loss: 0.0010725145657105666
epoch time: 48.4109 seconds

Starting epoch 118


Epoch 118/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.21batch/s, batch loss=0.00127, mean epoch loss=0.00103]


Training loss: 0.0010280200459210462


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.64batch/s]


Test loss: 0.001087342543331416
epoch time: 48.3040 seconds

Starting epoch 119


Epoch 119/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.15batch/s, batch loss=0.00151, mean epoch loss=0.00103]


Training loss: 0.0010281061142322129


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.00batch/s]


Test loss: 0.0010845818431239184
epoch time: 48.4504 seconds

Starting epoch 120


Epoch 120/500: 100%|███████████████████████████| 909/909 [00:47<00:00, 19.16batch/s, batch loss=0.000832, mean epoch loss=0.00103]


Training loss: 0.0010261674552567547


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.68batch/s]


Test loss: 0.0010757092346657853
epoch time: 48.4636 seconds

Starting epoch 121


Epoch 121/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.10batch/s, batch loss=0.00255, mean epoch loss=0.00102]


Training loss: 0.0010241452239677787


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.59batch/s]


Test loss: 0.0010936670323931858
epoch time: 48.5907 seconds

Starting epoch 122


Epoch 122/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.08batch/s, batch loss=0.00167, mean epoch loss=0.00102]


Training loss: 0.0010170979206376002


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.61batch/s]


Test loss: 0.0010630807438007507
epoch time: 48.6495 seconds

Starting epoch 123


Epoch 123/500: 100%|███████████████████████████| 909/909 [00:48<00:00, 18.58batch/s, batch loss=0.000933, mean epoch loss=0.00102]


Training loss: 0.001017162617196022


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.11batch/s]


Test loss: 0.0010766686822630857
epoch time: 49.9512 seconds

Starting epoch 124


Epoch 124/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.39batch/s, batch loss=0.00119, mean epoch loss=0.00102]


Training loss: 0.0010162341175088607


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.63batch/s]


Test loss: 0.0010794656461496886
epoch time: 50.4497 seconds

Starting epoch 125


Epoch 125/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.32batch/s, batch loss=0.000592, mean epoch loss=0.00101]


Training loss: 0.0010145290965362036


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.00batch/s]


Test loss: 0.0010866998538595477
epoch time: 50.6433 seconds

Starting epoch 126


Epoch 126/500: 100%|███████████████████████████| 909/909 [00:49<00:00, 18.32batch/s, batch loss=0.000942, mean epoch loss=0.00101]


Training loss: 0.0010143747667275365


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.67batch/s]


Test loss: 0.0010774665931852436
epoch time: 50.6432 seconds

Starting epoch 127


Epoch 127/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.25batch/s, batch loss=0.00154, mean epoch loss=0.00101]


Training loss: 0.001013844742031017


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.33batch/s]


Test loss: 0.0010933282720782843

Early stopping at epoch 127. No improvement in test loss for 50 epochs.
lr: 0.000567164517238037, weight decay: 0.0004488643154359018, final epoch: 76, final test loss: 0.0010208587630921484
---------------------------------------------------------
starting trial 3
lr: 0.0007284791014252432, weight decay: 5.076975211708687e-05

Starting epoch 1


Epoch 1/500: 100%|█████████████████████████████| 909/909 [00:49<00:00, 18.23batch/s, batch loss=0.000362, mean epoch loss=0.00193]


Training loss: 0.0019317610904331574


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.61batch/s]


Test loss: 0.0017083075283536393
epoch time: 50.8686 seconds

Starting epoch 2


Epoch 2/500: 100%|██████████████████████████████| 909/909 [00:49<00:00, 18.21batch/s, batch loss=0.00222, mean epoch loss=0.00152]


Training loss: 0.0015190900879256618


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.85batch/s]


Test loss: 0.0016070866347658202
epoch time: 50.9110 seconds

Starting epoch 3


Epoch 3/500: 100%|█████████████████████████████| 909/909 [00:49<00:00, 18.21batch/s, batch loss=0.000666, mean epoch loss=0.00143]


Training loss: 0.0014313724568597531


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.12batch/s]


Test loss: 0.0018076452834066004
epoch time: 50.9124 seconds

Starting epoch 4


Epoch 4/500: 100%|█████████████████████████████| 909/909 [00:49<00:00, 18.25batch/s, batch loss=0.000927, mean epoch loss=0.00136]


Training loss: 0.001356494180868765


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.55batch/s]


Test loss: 0.0017810130001682984
epoch time: 50.7786 seconds

Starting epoch 5


Epoch 5/500: 100%|██████████████████████████████| 909/909 [00:49<00:00, 18.38batch/s, batch loss=0.00151, mean epoch loss=0.00133]


Training loss: 0.0013304580224439582


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.02batch/s]


Test loss: 0.0015113230034905045
epoch time: 50.4620 seconds

Starting epoch 6


Epoch 6/500: 100%|█████████████████████████████| 909/909 [00:49<00:00, 18.24batch/s, batch loss=0.000419, mean epoch loss=0.00132]


Training loss: 0.0013168620292105782


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.20batch/s]


Test loss: 0.001237675017910078
epoch time: 50.8309 seconds

Starting epoch 7


Epoch 7/500: 100%|██████████████████████████████| 909/909 [00:49<00:00, 18.30batch/s, batch loss=0.00323, mean epoch loss=0.00129]


Training loss: 0.0012916409025462835


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.31batch/s]


Test loss: 0.0013016231293716516
epoch time: 50.6588 seconds

Starting epoch 8


Epoch 8/500: 100%|██████████████████████████████| 909/909 [00:49<00:00, 18.33batch/s, batch loss=0.00118, mean epoch loss=0.00129]


Training loss: 0.00128834153065377


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.29batch/s]


Test loss: 0.0013941271892307621
epoch time: 50.5686 seconds

Starting epoch 9


Epoch 9/500: 100%|█████████████████████████████| 909/909 [00:49<00:00, 18.36batch/s, batch loss=0.000686, mean epoch loss=0.00126]


Training loss: 0.0012593855916156677


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.46batch/s]


Test loss: 0.0012640209908376596
epoch time: 50.4951 seconds

Starting epoch 10


Epoch 10/500: 100%|█████████████████████████████| 909/909 [00:49<00:00, 18.39batch/s, batch loss=0.00089, mean epoch loss=0.00125]


Training loss: 0.001247478220170931


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.94batch/s]


Test loss: 0.00122914633983256
epoch time: 50.4228 seconds

Starting epoch 11


Epoch 11/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.39batch/s, batch loss=0.000846, mean epoch loss=0.00124]


Training loss: 0.0012384635386920645


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.99batch/s]


Test loss: 0.0014973927019654137
epoch time: 50.4237 seconds

Starting epoch 12


Epoch 12/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.36batch/s, batch loss=0.000542, mean epoch loss=0.00122]


Training loss: 0.0012187530874073667


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.13batch/s]


Test loss: 0.0012259041852207462
epoch time: 50.5028 seconds

Starting epoch 13


Epoch 13/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.39batch/s, batch loss=0.000865, mean epoch loss=0.00124]


Training loss: 0.0012391361730062834


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.51batch/s]


Test loss: 0.0013182456412132045
epoch time: 50.4089 seconds

Starting epoch 14


Epoch 14/500: 100%|████████████████████████████| 909/909 [00:49<00:00, 18.34batch/s, batch loss=0.000227, mean epoch loss=0.00123]


Training loss: 0.001234123210191657


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.65batch/s]


Test loss: 0.0011737594307449303
epoch time: 50.5714 seconds

Starting epoch 15


Epoch 15/500: 100%|█████████████████████████████| 909/909 [00:49<00:00, 18.35batch/s, batch loss=0.000566, mean epoch loss=0.0012]


Training loss: 0.0012035038455738942


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.60batch/s]


Test loss: 0.0012137823146890457
epoch time: 50.4893 seconds

Starting epoch 16


Epoch 16/500: 100%|██████████████████████████████| 909/909 [00:49<00:00, 18.45batch/s, batch loss=0.00211, mean epoch loss=0.0012]


Training loss: 0.0011978249983325175


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.48batch/s]


Test loss: 0.0012165525067279017
epoch time: 50.2651 seconds

Starting epoch 17


Epoch 17/500: 100%|█████████████████████████████| 909/909 [00:49<00:00, 18.45batch/s, batch loss=0.00148, mean epoch loss=0.00119]


Training loss: 0.0011897723955414498


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.76batch/s]


Test loss: 0.0012125772972419661
epoch time: 50.2652 seconds

Starting epoch 18


Epoch 18/500: 100%|█████████████████████████████| 909/909 [00:49<00:00, 18.47batch/s, batch loss=0.00101, mean epoch loss=0.00119]


Training loss: 0.0011857021213477765


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.76batch/s]


Test loss: 0.00122429532531992
epoch time: 50.1844 seconds

Starting epoch 19


Epoch 19/500: 100%|█████████████████████████████| 909/909 [00:49<00:00, 18.51batch/s, batch loss=0.00145, mean epoch loss=0.00117]


Training loss: 0.0011692697519393063


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 98.42batch/s]


Test loss: 0.0013209180930923476
epoch time: 50.0735 seconds

Starting epoch 20


Epoch 20/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.57batch/s, batch loss=0.00105, mean epoch loss=0.00117]


Training loss: 0.0011715902418121787


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.12batch/s]


Test loss: 0.0011299454861345064
epoch time: 49.9434 seconds

Starting epoch 21


Epoch 21/500: 100%|█████████████████████████████| 909/909 [00:47<00:00, 19.15batch/s, batch loss=0.00032, mean epoch loss=0.00116]


Training loss: 0.0011648568054037456


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.05batch/s]


Test loss: 0.0011596444332482
epoch time: 48.4660 seconds

Starting epoch 22


Epoch 22/500: 100%|█████████████████████████████| 909/909 [00:47<00:00, 19.21batch/s, batch loss=0.00574, mean epoch loss=0.00115]


Training loss: 0.0011491983052302403


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.40batch/s]


Test loss: 0.0011177583989736282
epoch time: 48.3277 seconds

Starting epoch 23


Epoch 23/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.20batch/s, batch loss=0.000541, mean epoch loss=0.00114]


Training loss: 0.0011423698278221228


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.88batch/s]


Test loss: 0.001151229393680727
epoch time: 48.3258 seconds

Starting epoch 24


Epoch 24/500: 100%|████████████████████████████| 909/909 [00:47<00:00, 19.15batch/s, batch loss=0.000294, mean epoch loss=0.00114]


Training loss: 0.0011375673162703258


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.72batch/s]


Test loss: 0.0011327985355532482
epoch time: 48.4659 seconds

Starting epoch 25


Epoch 25/500: 100%|█████████████████████████████| 909/909 [00:47<00:00, 18.94batch/s, batch loss=0.00047, mean epoch loss=0.00113]


Training loss: 0.0011254047852445484


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.97batch/s]


Test loss: 0.0011042368138748171
epoch time: 49.0103 seconds

Starting epoch 26


Epoch 26/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.72batch/s, batch loss=0.00192, mean epoch loss=0.00113]


Training loss: 0.0011296727507285147


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.62batch/s]


Test loss: 0.0014699653746854317
epoch time: 49.5940 seconds

Starting epoch 27


Epoch 27/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.70batch/s, batch loss=0.00282, mean epoch loss=0.00113]


Training loss: 0.001131041686782384


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.65batch/s]


Test loss: 0.001373188335166656
epoch time: 49.6250 seconds

Starting epoch 28


Epoch 28/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.68batch/s, batch loss=0.000726, mean epoch loss=0.0011]


Training loss: 0.0010992877990790803


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.96batch/s]


Test loss: 0.0010986243993485053
epoch time: 49.6877 seconds

Starting epoch 29


Epoch 29/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.71batch/s, batch loss=0.000238, mean epoch loss=0.00111]


Training loss: 0.00111298322103476


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.28batch/s]


Test loss: 0.0011876790082743882
epoch time: 49.5883 seconds

Starting epoch 30


Epoch 30/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.75batch/s, batch loss=0.00171, mean epoch loss=0.00111]


Training loss: 0.0011101159459328057


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.26batch/s]


Test loss: 0.0011422990563962805
epoch time: 49.5137 seconds

Starting epoch 31


Epoch 31/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.72batch/s, batch loss=0.00128, mean epoch loss=0.00109]


Training loss: 0.0010931013095716673


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 94.85batch/s]


Test loss: 0.0016035124040698926
epoch time: 49.5613 seconds

Starting epoch 32


Epoch 32/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.74batch/s, batch loss=0.000408, mean epoch loss=0.0011]


Training loss: 0.0011006750082562557


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 91.14batch/s]


Test loss: 0.0011944828346665752
epoch time: 49.5394 seconds

Starting epoch 33


Epoch 33/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.77batch/s, batch loss=0.000796, mean epoch loss=0.00109]


Training loss: 0.0010886951981539344


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.92batch/s]


Test loss: 0.0011564737167454472
epoch time: 49.4446 seconds

Starting epoch 34


Epoch 34/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.71batch/s, batch loss=0.000199, mean epoch loss=0.00109]


Training loss: 0.0010916013598314775


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 93.84batch/s]


Test loss: 0.0012476926580635144
epoch time: 49.5993 seconds

Starting epoch 35


Epoch 35/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.70batch/s, batch loss=0.00104, mean epoch loss=0.00109]


Training loss: 0.0010938525160876917


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.83batch/s]


Test loss: 0.0011906434803294313
epoch time: 49.6085 seconds

Starting epoch 36


Epoch 36/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.68batch/s, batch loss=0.00181, mean epoch loss=0.00109]


Training loss: 0.0010875414969248192


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.18batch/s]


Test loss: 0.0011379654739836328
epoch time: 49.6413 seconds

Starting epoch 37


Epoch 37/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.66batch/s, batch loss=0.000597, mean epoch loss=0.00108]


Training loss: 0.0010849887303495986


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 97.88batch/s]


Test loss: 0.001111936513150699
epoch time: 49.6758 seconds

Starting epoch 38


Epoch 38/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.66batch/s, batch loss=0.00105, mean epoch loss=0.00107]


Training loss: 0.0010698496966256618


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.18batch/s]


Test loss: 0.0010955699033250933
epoch time: 49.7570 seconds

Starting epoch 39


Epoch 39/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.65batch/s, batch loss=0.00235, mean epoch loss=0.00107]


Training loss: 0.001072241143742333


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.68batch/s]


Test loss: 0.0011061155130032841
epoch time: 49.7317 seconds

Starting epoch 40


Epoch 40/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.68batch/s, batch loss=0.00023, mean epoch loss=0.00108]


Training loss: 0.0010781289605526008


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.15batch/s]


Test loss: 0.0011755446125263054
epoch time: 49.6596 seconds

Starting epoch 41


Epoch 41/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.69batch/s, batch loss=0.000795, mean epoch loss=0.00106]


Training loss: 0.0010631394219275858


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.88batch/s]


Test loss: 0.0010711022266676944
epoch time: 49.6815 seconds

Starting epoch 42


Epoch 42/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.68batch/s, batch loss=0.000502, mean epoch loss=0.00105]


Training loss: 0.0010524941211453884


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 95.74batch/s]


Test loss: 0.0011043871417457825
epoch time: 49.6458 seconds

Starting epoch 43


Epoch 43/500: 100%|█████████████████████████████| 909/909 [00:48<00:00, 18.73batch/s, batch loss=3.34e-5, mean epoch loss=0.00106]


Training loss: 0.0010564927124565662


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:01<00:00, 92.88batch/s]


Test loss: 0.001146076949264266
epoch time: 49.5670 seconds

Starting epoch 44


Epoch 44/500: 100%|████████████████████████████| 909/909 [00:48<00:00, 18.70batch/s, batch loss=0.000929, mean epoch loss=0.00106]


Training loss: 0.0010600401988700985


Testing: 100%|███████████████████████████████████████████████████████████████████████| 95/95 [00:00<00:00, 96.02batch/s]


Test loss: 0.0010772041403565948
epoch time: 49.5932 seconds

Starting epoch 45


Epoch 45/500:  77%|██████████████████████▎      | 700/909 [00:37<00:11, 18.58batch/s, batch loss=0.00052, mean epoch loss=0.00107]