In [1]:
%load_ext autoreload
%autoreload 2
import sys, os, time, glob, time, pdb, cv2
import numpy as np
import torch
import torch.nn as nn
from tqdm import tqdm
import matplotlib.pyplot as plt
plt.switch_backend('agg') # for servers not supporting display

sys.path.insert(0,'..')

# import neccesary libraries for defining the optimizers
import torch.optim as optim
from torch.optim import lr_scheduler
from torchvision import transforms

from unet import UNet
from datasets import HAR_dataset
import config as cfg
from torch.utils.data import DataLoader



In [2]:
device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
print('device: ', device)

script_time = time.time()

def q(text = ''):
    print('> {}'.format(text))
    sys.exit()

data_dir = cfg.data_dir
train_dir = cfg.train_dir
val_dir = cfg.val_dir
    
models_dir = cfg.models_dir
if not os.path.exists(models_dir):
    os.mkdir(models_dir)

losses_dir = cfg.losses_dir
if not os.path.exists(losses_dir):
    os.mkdir(losses_dir)

def count_parameters(model):
    num_parameters = sum(p.numel() for p in model.parameters() if p.requires_grad)
    return num_parameters/1e6 # in terms of millions

def plot_losses(running_train_loss, running_val_loss, train_epoch_loss, val_epoch_loss, epoch):
    fig = plt.figure(figsize=(16,16))
    fig.suptitle('loss trends', fontsize=20)
    ax1 = fig.add_subplot(221)
    ax2 = fig.add_subplot(222)
    ax3 = fig.add_subplot(223)
    ax4 = fig.add_subplot(224)

    ax1.title.set_text('epoch train loss VS #epochs')
    ax1.set_xlabel('#epochs')
    ax1.set_ylabel('epoch train loss')
    ax1.plot(train_epoch_loss)
    
    ax2.title.set_text('epoch val loss VS #epochs')
    ax2.set_xlabel('#epochs')
    ax2.set_ylabel('epoch val loss')
    ax2.plot(val_epoch_loss)
 
    ax3.title.set_text('batch train loss VS #batches')
    ax3.set_xlabel('#batches')
    ax3.set_ylabel('batch train loss')
    ax3.plot(running_train_loss)

    ax4.title.set_text('batch val loss VS #batches')
    ax4.set_xlabel('#batches')
    ax4.set_ylabel('batch val loss')
    ax4.plot(running_val_loss)
    
    plt.savefig(os.path.join(losses_dir,'losses_{}.png'.format(str(epoch + 1).zfill(2))))

transform = transforms.Compose([transforms.ToPILImage(), transforms.ToTensor()])

dataset = HAR_dataset()
sz = int(0.8*len(dataset))

train_dataset, val_dataset = torch.utils.data.random_split(dataset, [sz, len(dataset)-sz])

#train_dataset       = HAR_dataset()
#val_dataset         = HAR_dataset()

print('\nlen(train_dataset) : ', len(train_dataset))
print('len(val_dataset)   : ', len(val_dataset))

device:  cuda

len(train_dataset) :  82346
len(val_dataset)   :  20587


In [3]:
batch_size = cfg.batch_size

train_loader = torch.utils.data.DataLoader(train_dataset, batch_size = batch_size, shuffle = True)

print('\nlen(train_loader): {}  @bs={}'.format(len(train_loader), batch_size))

for img, noised in train_loader:
    display(img.shape)
    display(noised.shape)
    #for img, noised in
    break
#print('len(val_loader)  : {}  @bs={}'.format(len(val_loader), batch_size))


len(train_loader): 2574  @bs=32


torch.Size([32, 3, 64])

torch.Size([32, 3, 64])

In [None]:
batch_size = cfg.batch_size

train_loader = torch.utils.data.DataLoader(train_dataset, batch_size = batch_size, shuffle = True)
val_loader = torch.utils.data.DataLoader(val_dataset, batch_size = batch_size, shuffle = not True)

print('\nlen(train_loader): {}  @bs={}'.format(len(train_loader), batch_size))
print('len(val_loader)  : {}  @bs={}'.format(len(val_loader), batch_size))

# defining the model
model = UNet(n_classes = 3, depth = cfg.depth, padding = True).to(device) # try decreasing the depth value if there is a memory error

resume = cfg.resume

if not resume:
    print('\nfrom scratch')
    train_epoch_loss = []
    val_epoch_loss = []
    running_train_loss = []
    running_val_loss = []
    epochs_till_now = 0
else:
    ckpt_path = os.path.join(models_dir, cfg.ckpt)
    ckpt = torch.load(ckpt_path)
    print(f'\nckpt loaded: {ckpt_path}')
    model_state_dict = ckpt['model_state_dict']
    model.load_state_dict(model_state_dict)
    model.to(device)
    losses = ckpt['losses']
    running_train_loss = losses['running_train_loss']
    running_val_loss = losses['running_val_loss']
    train_epoch_loss = losses['train_epoch_loss']
    val_epoch_loss = losses['val_epoch_loss']
    epochs_till_now = ckpt['epochs_till_now']

lr = cfg.lr
optimizer = optim.Adam(filter(lambda p: p.requires_grad, model.parameters()), lr = lr)
loss_fn = nn.MSELoss()

log_interval = cfg.log_interval
epochs = cfg.epochs

###
print('\nmodel has {} M parameters'.format(count_parameters(model)))
print(f'\nloss_fn        : {loss_fn}')
print(f'lr             : {lr}')
print(f'epochs_till_now: {epochs_till_now}')
print(f'epochs from now: {epochs}')
###

for epoch in range(epochs_till_now, epochs_till_now+epochs):
    print('\n===== EPOCH {}/{} ====='.format(epoch + 1, epochs_till_now + epochs))    
    print('\nTRAINING...')
    epoch_train_start_time = time.time()
    model.train()
    for batch_idx, (imgs, noisy_imgs) in enumerate(train_loader):
        batch_start_time = time.time()
        imgs = imgs.to(device)
        noisy_imgs = noisy_imgs.to(device)

        optimizer.zero_grad()
        out = model(noisy_imgs)
        print(out.shape)
        print(noisy_imgs.shape)
        loss = loss_fn(out, imgs)
        running_train_loss.append(loss.item())
        loss.backward()
        optimizer.step()

        if (batch_idx + 1)%log_interval == 0:
            batch_time = time.time() - batch_start_time
            m,s = divmod(batch_time, 60)
            print('train loss @batch_idx {}/{}: {} in {} mins {} secs (per batch)'.format(str(batch_idx+1).zfill(len(str(len(train_loader)))), len(train_loader), loss.item(), int(m), round(s, 2)))

    train_epoch_loss.append(np.array(running_train_loss).mean())

    epoch_train_time = time.time() - epoch_train_start_time
    m,s = divmod(epoch_train_time, 60)
    h,m = divmod(m, 60)
    print('\nepoch train time: {} hrs {} mins {} secs'.format(int(h), int(m), int(s)))

    print('\nVALIDATION...')
    epoch_val_start_time = time.time()
    model.eval()
    with torch.no_grad():
        for batch_idx, (imgs, noisy_imgs) in enumerate(val_loader):

            imgs = imgs.to(device)
            noisy_imgs = noisy_imgs.to(device)

            out = model(noisy_imgs)
            loss = loss_fn(out, imgs)

            running_val_loss.append(loss.item())

            if (batch_idx + 1)%log_interval == 0:
                print('val loss   @batch_idx {}/{}: {}'.format(str(batch_idx+1).zfill(len(str(len(val_loader)))), len(val_loader), loss.item()))

    val_epoch_loss.append(np.array(running_val_loss).mean())

    epoch_val_time = time.time() - epoch_val_start_time
    m,s = divmod(epoch_val_time, 60)
    h,m = divmod(m, 60)
    print('\nepoch val   time: {} hrs {} mins {} secs'.format(int(h), int(m), int(s)))

    plot_losses(running_train_loss, running_val_loss, train_epoch_loss, val_epoch_loss,  epoch)   

    torch.save({'model_state_dict': model.state_dict(), 
                'losses': {'running_train_loss': running_train_loss, 
                           'running_val_loss': running_val_loss, 
                           'train_epoch_loss': train_epoch_loss, 
                           'val_epoch_loss': val_epoch_loss}, 
                'epochs_till_now': epoch+1}, 
                os.path.join(models_dir, 'model{}.pth'.format(str(epoch + 1).zfill(2))))

total_script_time = time.time() - script_time
m, s = divmod(total_script_time, 60)
h, m = divmod(m, 60)
print(f'\ntotal time taken for running this script: {int(h)} hrs {int(m)} mins {int(s)} secs')
  
print('\nFin.')


len(train_loader): 2574  @bs=32
len(val_loader)  : 644  @bs=32

from scratch

model has 2.682819 M parameters

loss_fn        : MSELoss()
lr             : 1e-05
epochs_till_now: 0
epochs from now: 12

===== EPOCH 1/12 =====

TRAINING...
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3,

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0175/2574: 606905.375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

train loss @batch_idx 0500/2574: 368618.84375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0675/2574: 258237.21875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1000/2574: 169752.34375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1175/2574: 157165.28125 in 0 mins 0.02 secs (per batch)
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1325/2574: 181365.609375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1500/2574: 87688.1484375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1650/2574: 125273.125 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1825/2574: 113302.9296875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2150/2574: 75336.765625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2325/2574: 92631.265625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2475/2574: 63566.96484375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0050/2574: 107910.609375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0225/2574: 81696.53125 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size(

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0550/2574: 62972.0 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32,

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0725/2574: 85777.78125 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size(

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1050/2574: 50870.10546875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1225/2574: 52464.515625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1550/2574: 86764.984375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1725/2574: 64823.8359375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2050/2574: 71703.515625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2375/2574: 43511.83203125 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2550/2574: 51594.54296875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0125/2574: 52204.02734375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0275/2574: 42861.41015625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0450/2574: 74800.3671875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0775/2574: 48839.76171875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1100/2574: 53424.13671875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1275/2574: 51271.77734375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1425/2574: 48101.88671875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1600/2574: 38888.62109375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

train loss @batch_idx 1750/2574: 56841.6015625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1925/2574: 56799.5546875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2250/2574: 49879.1484375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2425/2574: 57139.3046875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([10, 3, 64])
torch.Size([10, 3, 64])

epoch train time: 0 hrs 0 mins 50 secs

VALIDATION...
val loss   @batch_idx 025/644: 94909.296875
val loss   @batch_idx 050/644: 93804.65625
val loss   @batch_idx 075/644: 97507.125
val loss   @batch_idx 100/644: 93861.4296875
val loss   @batch_idx 125/644: 93930.921875
val loss   @batch_idx 150/644: 94274.9375
val loss   @batch_idx 175/644: 94386.8359375
val loss   @batch_idx 200/644: 95933.6875
val loss   @batch_idx 225/644: 94589.9609375
val loss   @batch_idx 250/644: 95346.046875
val loss   @batch_idx 275/644: 93712.921875
val loss   @batch_idx 300/644: 94763.5
val loss   @batch_idx 325/644: 94122.0859375
val loss   @batch_idx 350/644: 94502.9375
val loss   @batch_idx 375/644: 95476.796875
val loss   @batch_idx 400/644: 96113.8125
val loss   @batch_idx 425/644: 95862.28125
val loss   @batch_i

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0150/2574: 39633.8046875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0475/2574: 35875.296875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0650/2574: 71493.4

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0800/2574: 48599.7109375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0975/2574: 48584.8515625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1125/2574: 46673.1328125 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1300/2574: 47689.87109375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1625/2574: 58148.16796875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1950/2574: 49167.65625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size(

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2125/2574: 48761.54296875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2275/2574: 48759.80859375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2450/2574: 55209.90234375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si


===== EPOCH 5/12 =====

TRAINING...
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
tor

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0175/2574: 35358.4765625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0500/2574: 50313.4765625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0675/2574: 50811.24609375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0850/2574: 43769.6953125 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1175/2574: 29201.421875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1350/2574: 42876.05859375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1675/2574: 39765.25 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1850/2574: 28413.576171875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.S

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2175/2574: 42492.04296875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2500/2574: 36246.765625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0075/2574: 43751.578125 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0400/2574: 36101.3203125 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0575/2574: 32721.50390625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0725/2574: 36620.63671875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0900/2574: 45483.7421875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1225/2574: 46374.40625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size(

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1550/2574: 46101.1640625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1725/2574: 28587.982421875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.S

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1875/2574: 27919.953125 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2050/2574: 37896.2421875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

train loss @batch_idx 2200/2574: 23655.625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([3

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2375/2574: 42050.7265625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0100/2574: 23320.890625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0275/2574: 42607.63671875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0600/2574: 42919.515625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0775/2574: 34814.03125 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size(

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0925/2574: 35106.6796875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1100/2574: 32440.87109375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1425/2574: 38921.9140625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1600/2574: 37197.3671875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1750/2574: 44003.3125 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1925/2574: 33856.90625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size(

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2250/2574: 28016.265625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2425/2574: 33308.16796875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([10, 3, 64])
torch.Size([10, 3, 64])

epoch train time: 0 hrs 0 mins 49 secs

VALIDATION...
val loss   @batch_idx 025/644: 82607.34375
val loss   @batch_idx 050/644: 81927.171875
val loss   @batch_idx 075/644: 84612.5
val loss   @batch_idx 100/644: 81902.421875
val loss   @batch_idx 125/644: 82210.34375
val loss   @batch_idx 150/644: 82511.71875
val loss   @batch_idx 175/644: 82301.9765625
val loss   @batch_idx 200/644: 83625.640625
val loss   @batch_idx 225/644: 82144.09375
val loss   @batch_idx 250/644: 83251.0234375
val loss   @batch_idx 275/644: 81557.046875
val loss   @batch_idx 300/644: 82219.5
val loss   @batch_idx 325/644: 82025.296875
val loss   @batch_idx 350/644: 82568.46875
val loss   @batch_idx 375/644: 82729.015625
val loss   @batch_idx 400/644: 84125.90625
val loss   @batch_idx 425/644: 83572.265625
val loss   @batch_idx 450/644: 82754.7734375
val loss   @batch_idx 475/644: 82717.75
val loss   @batch_idx 500/644: 82525.3125
val loss   @batch_idx 525/644: 82590

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0150/2574: 35787.87890625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0325/2574: 43661.203125 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0475/2574: 41923.37109375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0650/2574: 35136.6875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0975/2574: 37164.75390625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1150/2574: 36638.3515625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1300/2574: 33249.640625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1475/2574: 30635.58984375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1800/2574: 38357.55078125 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1975/2574: 29408.484375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2125/2574: 38533.1015625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2300/2574: 35706.58984375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0025/2574: 27007.255859375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.S

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0200/2574: 34471.6171875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0525/2574: 42417.5703125 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0700/2574: 29990.224609375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.S

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0850/2574: 26372.974609375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.S

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1025/2574: 38558.73046875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1350/2574: 35320.3125 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1525/2574: 41972.8828125 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1675/2574: 33569.0234375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1850/2574: 29055.59375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size(

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2175/2574: 26316.12109375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2350/2574: 27642.71875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size(

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2500/2574: 29001.90625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size(

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0075/2574: 23874.841796875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.S

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0250/2574: 32870.5

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0400/2574: 42381.98046875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0575/2574: 25176.609375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0750/2574: 24439.4765625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1075/2574: 38792.7578125 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1250/2574: 46317.8515625 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1575/2574: 28975.044921875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.S

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 1750/2574: 33972.8828125 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2075/2574: 23373.0078125 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 2250/2574: 22807.171875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([10, 3, 64])
torch.Size([10, 3, 64])

epoch train time: 0 hrs 0 mins 53 secs

VALIDATION...
val loss   @batch_idx 025/644: 99008.8359375
val loss   @batch_idx 050/644: 98293.5234375
val loss   @batch_idx 075/644: 100391.2421875
val loss   @batch_idx 100/644: 98391.1875
val loss   @batch_idx 125/644: 98730.7109375
val loss   @batch_idx 150/644: 98928.125
val loss   @batch_idx 175/644: 98550.296875
val loss   @batch_idx 200/644: 99780.6484375
val loss   @batch_idx 225/644: 98526.75
val loss   @batch_idx 250/644: 99564.234375
val loss   @batch_idx 275/644: 97921.109375
val loss   @batch_idx 300/644: 98401.15625
val loss   @batch_idx 325/644: 98463.6796875
val loss   @batch_idx 350/644: 98934.171875
val loss   @batch_idx 375/644: 98975.359375
val loss   @batch_idx 400/644: 100322.734375
val loss   @batch_idx 425/644: 99746.71875
val loss   @batch_idx 450/644: 99082.109375
val loss   @batch_idx 475/644: 99140.8359375
val loss   @bat

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0150/2574: 25809.68359375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Si

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0475/2574: 33863.8046875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0650/2574: 25728.3

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0800/2574: 24249.84375 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size(

torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
train loss @batch_idx 0975/2574: 34109.1796875 in 0 mins 0.02 secs (per batch)
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Size([32, 3, 64])
torch.Siz