In [3]:
import os
import time
import argparse

import torchvision
import torch
import torch.nn as nn

from util import AverageMeter
from encoder import SmallAlexNetLbls
from align_uniform import align_loss, uniform_loss_prelog
from tqdm import tqdm
from collections import defaultdict
import copy

import matplotlib.pyplot as plt


class TwoAugUnsupervisedDatasetLbl(torch.utils.data.Dataset):
    r"""Returns two augmentation and no labels."""

    def __init__(self, dataset, transform, lblmap=None):
        self.dataset = dataset
        self.transform = transform
        self.lblmap = copy.deepcopy(lblmap)

    def __getitem__(self, index):
        image, lbl = self.dataset[index]
        lbl2return = lbl if self.lblmap is None else self.lblmap[lbl]
        return self.transform(image), self.transform(image), lbl2return

    def __len__(self):
        return len(self.dataset)

def parse_option():
    parser = argparse.ArgumentParser('STL-10 Representation Learning with Alignment and Uniformity Losses')

    parser.add_argument('--align_w', type=float, default=1, help='Alignment loss weight')
    parser.add_argument('--unif_w', type=float, default=1, help='Uniformity loss weight')
    parser.add_argument('--align_alpha', type=float, default=2, help='alpha in alignment loss')
    parser.add_argument('--unif_t', type=float, default=2, help='t in uniformity loss')

    parser.add_argument('--batch_size', type=int, default=256, help='Batch size')
    parser.add_argument('--epochs', type=int, default=300, help='Number of training epochs')
    parser.add_argument('--iter', type=int, default=0, help='Number of training epochs')
    parser.add_argument('--lr', type=float, default=None,
                        help='Learning rate. Default is linear scaling 0.12 per 256 batch size')
    parser.add_argument('--lr_decay_rate', type=float, default=0.1, help='Learning rate decay rate')
    parser.add_argument('--lr_decay_epochs', default=[155, 170, 185], nargs='*', type=int,
                        help='When to decay learning rate')
    parser.add_argument('--momentum', type=float, default=0.9, help='SGD momentum')
    parser.add_argument('--weight_decay', type=float, default=1e-4, help='L2 weight decay')
    parser.add_argument('--feat_dim', type=int, default=128, help='Feature dimensionality')

    parser.add_argument('--num_workers', type=int, default=4, help='Number of data loader workers to use')
    parser.add_argument('--log_interval', type=int, default=40, help='Number of iterations between logs')
    parser.add_argument('--gpus', default=[0], nargs='*', type=int,
                        help='List of GPU indices to use, e.g., --gpus 0 1 2 3')

    parser.add_argument('--data_folder', type=str, default='./data', help='Path to data')
    parser.add_argument('--result_folder', type=str, default='./results', help='Base directory to save model')

    opt = parser.parse_args("")

    if opt.lr is None:
        opt.lr = 0.12 * (opt.batch_size / 256)

    opt.gpus = list(map(lambda x: torch.device('cuda', x), opt.gpus))

    opt.save_folder = os.path.join(
        opt.result_folder,
        f"base_joint_256_{opt.epochs}_4_sideinformation_align{opt.align_w:g}alpha{opt.align_alpha:g}_unif{opt.unif_w:g}t{opt.unif_t:g}_iter{opt.iter}"
    )
    os.makedirs(opt.save_folder, exist_ok=True)

    return opt


opt = parse_option()

In [4]:
transform = torchvision.transforms.Compose([
        torchvision.transforms.RandomResizedCrop(64, scale=(0.08, 1)),
        torchvision.transforms.RandomHorizontalFlip(),
        torchvision.transforms.ColorJitter(0.4, 0.4, 0.4, 0.4),
        torchvision.transforms.RandomGrayscale(p=0.2),
        torchvision.transforms.ToTensor(),
        torchvision.transforms.Normalize(
            (0.44087801806139126, 0.42790631331699347, 0.3867879370752931),
            (0.26826768628079806, 0.2610450402318512, 0.26866836876860795),
        ),
    ])

old_lbls = list(range(10))
labels_2_keep = [0,1]

old2new = {}
count = 0
for old_lbl in old_lbls:
    if old_lbl in labels_2_keep: 
        old2new[old_lbl] = count
        count += 1

for old_lbl in old_lbls:
    if old_lbl not in labels_2_keep: 
        old2new[old_lbl] = count

new_lbls = list(range(count+1))

In [5]:
lbl_one_hot.shape

NameError: name 'lbl_one_hot' is not defined

In [None]:
torch.cat([im_x.to(opt.gpus[0]), im_y.to(opt.gpus[0])]).shape

In [6]:
def get_data_loader(opt):
    transform = torchvision.transforms.Compose([
        torchvision.transforms.RandomResizedCrop(64, scale=(0.08, 1)),
        torchvision.transforms.RandomHorizontalFlip(),
        torchvision.transforms.ColorJitter(0.4, 0.4, 0.4, 0.4),
        torchvision.transforms.RandomGrayscale(p=0.2),
        torchvision.transforms.ToTensor(),
        torchvision.transforms.Normalize(
            (0.44087801806139126, 0.42790631331699347, 0.3867879370752931),
            (0.26826768628079806, 0.2610450402318512, 0.26866836876860795),
        ),
    ])
    dataset = TwoAugUnsupervisedDatasetLbl(
        torchvision.datasets.STL10(opt.data_folder, 'train', download=True), 
        transform=transform, 
        lblmap=old2new )
    
    return torch.utils.data.DataLoader(dataset, batch_size=opt.batch_size, num_workers=opt.num_workers,
                                       shuffle=True, pin_memory=True)


print(f'Optimize: {opt.align_w:g} * loss_align(alpha={opt.align_alpha:g}) + {opt.unif_w:g} * loss_uniform(t={opt.unif_t:g})')

torch.cuda.set_device(opt.gpus[0])
torch.backends.cudnn.deterministic = True
torch.backends.cudnn.benchmark = True

encoder = SmallAlexNetLbls(n_lbls=len(labels_2_keep)+1,feat_dim=opt.feat_dim).to(opt.gpus[0])

optim = torch.optim.SGD(encoder.parameters(), lr=opt.lr,
                        momentum=opt.momentum, weight_decay=opt.weight_decay)
scheduler = torch.optim.lr_scheduler.MultiStepLR(optim, gamma=opt.lr_decay_rate,
                                                 milestones=opt.lr_decay_epochs)

loader = get_data_loader(opt)
align_meter = AverageMeter('align_loss')
unif_meter = AverageMeter('uniform_loss')
loss_meter = AverageMeter('total_loss')
it_time_meter = AverageMeter('iter_time')

for epoch in range(opt.epochs):
    align_meter.reset()
    unif_meter.reset()
    loss_meter.reset()
    it_time_meter.reset()
    t0 = time.time()
    for ii, (im_x, im_y, lbl) in enumerate(loader):
        optim.zero_grad()
        lbl_one_hot = torch.nn.functional.one_hot(lbl, num_classes=len(labels_2_keep) + 1).to(opt.gpus[0]).repeat(2,1)
        x, y = encoder(torch.cat([im_x.to(opt.gpus[0]), im_y.to(opt.gpus[0])]), lbl_one_hot).chunk(2)
        
        align_loss_val = align_loss(x, y, alpha=opt.align_alpha)
        # group according to new_lbls

        z = torch.cat( [x, y])
        lbl_z = torch.cat([lbl, lbl])
        unif_losses = torch.cat([uniform_loss_prelog(z[lbl_z==new_lbl]) for new_lbl in new_lbls])
        unif_loss_val = torch.log( torch.mean(unif_losses) )
        
        loss = align_loss_val * opt.align_w + unif_loss_val * opt.unif_w
        align_meter.update(align_loss_val, x.shape[0])
        unif_meter.update(unif_loss_val)
        loss_meter.update(loss, x.shape[0])
        loss.backward()
        optim.step()
        it_time_meter.update(time.time() - t0)
        if ii % opt.log_interval == 0:
            print(f"Epoch {epoch}/{opt.epochs}\tIt {ii}/{len(loader)}\t" +
                  f"{align_meter}\t{unif_meter}\t{loss_meter}\t{it_time_meter}")
        t0 = time.time()
    scheduler.step()

ckpt_file = os.path.join(opt.save_folder, 'encoder.pth')
torch.save(encoder.state_dict(), ckpt_file)
print(f'Saved to {ckpt_file}')

Optimize: 1 * loss_align(alpha=2) + 1 * loss_uniform(t=2)
Files already downloaded and verified
Epoch 0/300	It 0/20	align_loss 1.184173 (1.184173)	uniform_loss -2.479436 (-2.479436)	total_loss -1.295263 (-1.295263)	iter_time 7.916977 (7.916977)
Epoch 1/300	It 0/20	align_loss 1.373172 (1.373172)	uniform_loss -3.479840 (-3.479840)	total_loss -2.106668 (-2.106668)	iter_time 0.657442 (0.657442)
Epoch 2/300	It 0/20	align_loss 1.223088 (1.223088)	uniform_loss -3.494987 (-3.494987)	total_loss -2.271898 (-2.271898)	iter_time 0.648514 (0.648514)
Epoch 3/300	It 0/20	align_loss 1.146487 (1.146487)	uniform_loss -3.549249 (-3.549249)	total_loss -2.402762 (-2.402762)	iter_time 0.668317 (0.668317)
Epoch 4/300	It 0/20	align_loss 1.119925 (1.119925)	uniform_loss -3.576893 (-3.576893)	total_loss -2.456969 (-2.456969)	iter_time 0.647234 (0.647234)
Epoch 5/300	It 0/20	align_loss 1.108054 (1.108054)	uniform_loss -3.582218 (-3.582218)	total_loss -2.474164 (-2.474164)	iter_time 0.709203 (0.709203)
Epoch 6/30

In [7]:
"""
    Here we  do the linear evaluation, the old labels are provided to the linear objective as one hot
"""
import time
import argparse

import torchvision
import torch
import torch.nn as nn
import torch.nn.functional as F

from util import AverageMeter
from encoder import SmallAlexNetLbls
MODEL_2_LOAD = "./results/base_200_sideinformation_align1alpha2_unif1t2_iter0/encoder.pth"
MODEL_2_LOAD="./results/manual_labels_align1alpha2_unif1t2_iter0/encoder.pth"
MODEL_2_LOAD = "./results/base_joint_200_4_sideinformation_align1alpha2_unif1t2_iter0/encoder.pth"
MODEL_2_LOAD= "./results/base_joint_256_300_4_sideinformation_align1alpha2_unif1t2_iter0/encoder.pth"
USE_MOD_LBL = True
encoder = SmallAlexNetLbls(n_lbls=len(labels_2_keep) + 1,feat_dim=opt.feat_dim).to(opt.gpus[0])
encoder.load_state_dict(torch.load(MODEL_2_LOAD))

<All keys matched successfully>

In [8]:
type(encoder)

encoder.SmallAlexNetLbls

In [9]:
def parse_option():
    parser = argparse.ArgumentParser('STL-10 Representation Learning with Alignment and Uniformity Losses')

    parser.add_argument('--encoder_checkpoint', type=str, help='Encoder checkpoint to evaluate', default=MODEL_2_LOAD)
    parser.add_argument('--feat_dim', type=int, default=128, help='Encoder feature dimensionality')
    parser.add_argument('--layer_index', type=int, default=-2, help='Evaluation layer')

    parser.add_argument('--batch_size', type=int, default=128, help='Batch size')
    parser.add_argument('--epochs', type=int, default=100, help='Number of training epochs')
    parser.add_argument('--lr', type=float, default=1e-3, help='Learning rate')
    parser.add_argument('--lr_decay_rate', type=float, default=0.2, help='Learning rate decay rate')
    parser.add_argument('--lr_decay_epochs', type=str, default='60,80', help='When to decay learning rate')

    parser.add_argument('--num_workers', type=int, default=6, help='Number of data loader workers to use')
    parser.add_argument('--log_interval', type=int, default=40, help='Number of iterations between logs')
    parser.add_argument('--gpus', default=[0], nargs='*', type=int,
                        help='List of GPU indices to use, e.g., --gpus 0 1 2 3')

    parser.add_argument('--data_folder', type=str, default='./data', help='Path to data')

    opt = parser.parse_args("")

    if opt.lr is None:
        opt.lr = 0.12 * (opt.batch_size / 256)

    opt.gpu = torch.device('cuda', opt.gpus[0])
    opt.lr_decay_epochs = list(map(int, opt.lr_decay_epochs.split(',')))

    return opt


class DatasetModifiedLbl(torch.utils.data.Dataset):
    r"""Returns two augmentation and no labels."""

    def __init__(self, dataset, lblmap=None):
        self.dataset = dataset
        self.lblmap = copy.deepcopy(lblmap)

    def __getitem__(self, index):
        image, lbl = self.dataset[index]
        lbl2return = lbl if self.lblmap is None else self.lblmap[lbl]
        return image, lbl2return

    def __len__(self):
        return len(self.dataset)

In [10]:
class DatasetModifiedLblandLbl(torch.utils.data.Dataset):
    r"""Returns two augmentation and no labels."""

    def __init__(self, dataset, lblmap):
        self.dataset = dataset
        self.lblmap = copy.deepcopy(lblmap)

    def __getitem__(self, index):
        image, lbl = self.dataset[index]
        return image, self.lblmap[lbl], lbl

    def __len__(self):
        return len(self.dataset)

In [11]:
def get_data_loaders(opt):
    train_transform = torchvision.transforms.Compose([
        torchvision.transforms.RandomResizedCrop(64, scale=(0.08, 1)),
        torchvision.transforms.ToTensor(),
        torchvision.transforms.Normalize(
            (0.44087801806139126, 0.42790631331699347, 0.3867879370752931),
            (0.26826768628079806, 0.2610450402318512, 0.26866836876860795),
        ),
        torchvision.transforms.RandomHorizontalFlip()
    ])
    val_transform = torchvision.transforms.Compose([
        torchvision.transforms.Resize(70),
        torchvision.transforms.CenterCrop(64),
        torchvision.transforms.ToTensor(),
        torchvision.transforms.Normalize(
            (0.44087801806139126, 0.42790631331699347, 0.3867879370752931),
            (0.26826768628079806, 0.2610450402318512, 0.26866836876860795),
        ),
    ])
    train_dataset = DatasetModifiedLblandLbl( torchvision.datasets.STL10(opt.data_folder, 'train', download=True, transform=train_transform), lblmap=old2new)
    val_dataset =  DatasetModifiedLblandLbl( torchvision.datasets.STL10(opt.data_folder, 'test', transform=val_transform), lblmap=old2new)
    train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=opt.batch_size,
                                               num_workers=opt.num_workers, shuffle=True, pin_memory=True)
    val_loader = torch.utils.data.DataLoader(val_dataset, batch_size=opt.batch_size,
                                             num_workers=opt.num_workers, pin_memory=True)
    return train_loader, val_loader


def validate_comb(opt, encoder, classifier, val_loader):
    correct = 0
    with torch.no_grad():
        for images, labels_mod, labels_act in val_loader:
            labels_mod_onehot = torch.nn.functional.one_hot(labels_mod,num_classes=len(labels_2_keep) + 1).to(opt.gpus[0])
            pred = classifier(torch.cat( (encoder(images.to(opt.gpus[0]), labels_mod_onehot, layer_index=opt.layer_index).flatten(1),  labels_mod_onehot ), dim=1)).argmax(dim=1)
            correct += (pred.cpu() == labels_act).sum().item()
    return correct / len(val_loader.dataset)

def validate(opt, encoder, classifier, val_loader):
    correct = 0
    with torch.no_grad():
        for images, labels_mod, labels_act in val_loader:
            labels_mod_onehot = torch.nn.functional.one_hot(labels_mod,num_classes=len(labels_2_keep) + 1).to(opt.gpus[0])
            pred = classifier( encoder(images.to(opt.gpus[0]),labels_mod_onehot, layer_index=opt.layer_index).flatten(1) ).argmax(dim=1)
            correct += (pred.cpu() == labels_act).sum().item()
    return correct / len(val_loader.dataset)

In [12]:
opt.gpu=opt.gpus[0]

In [13]:
_

encoder.SmallAlexNetLbls

In [15]:
opt = parse_option()

opt.gpu=opt.gpus[0]
torch.cuda.set_device(opt.gpus[0])
torch.backends.cudnn.deterministic = True
torch.backends.cudnn.benchmark = True

encoder.eval()
train_loader, val_loader = get_data_loaders(opt)

with torch.no_grad():
    sample, _ = train_loader.dataset.dataset[0]
    eval_numel = encoder(sample.unsqueeze(0).to(opt.gpus[0]),torch.ones((1,len(labels_2_keep)+1)).to(opt.gpus[0]), layer_index=opt.layer_index).numel()
print(f'Feature dimension: {eval_numel}')


classifier = nn.Linear(eval_numel, 10).to(opt.gpus[0]) if not USE_MOD_LBL else nn.Linear( eval_numel + len(labels_2_keep) + 1,10).to(opt.gpus[0])

optim = torch.optim.Adam(classifier.parameters(), lr=opt.lr, betas=(0.5, 0.999))
scheduler = torch.optim.lr_scheduler.MultiStepLR(optim, gamma=opt.lr_decay_rate,
                                                 milestones=opt.lr_decay_epochs)

val_accs = []
loss_meter = AverageMeter('loss')
it_time_meter = AverageMeter('iter_time')
for epoch in tqdm(range(300)):
    loss_meter.reset()
    it_time_meter.reset()
    t0 = time.time()
    for ii, (images, labels_mod, labels) in enumerate(train_loader):
        optim.zero_grad()
        with torch.no_grad():
            labels_mod_onehot = torch.nn.functional.one_hot(labels_mod,num_classes=len(labels_2_keep) + 1).to(opt.gpus[0])
            feats = encoder(images.to(opt.gpus[0]),labels_mod_onehot,layer_index=opt.layer_index).flatten(1)

        if USE_MOD_LBL:
            logits = classifier(torch.cat( (feats, torch.nn.functional.one_hot(labels_mod.to(opt.gpus[0]), num_classes=len(labels_2_keep)+1 )),dim=1))
        else:
            logits = classifier(feats)
        
        loss = F.cross_entropy(logits, labels.to(opt.gpus[0]))
        loss_meter.update(loss, images.shape[0])
        loss.backward()
        optim.step()
        it_time_meter.update(time.time() - t0)
        if ii % opt.log_interval == 0:
            print(f"Epoch {epoch}/{opt.epochs}\tIt {ii}/{len(train_loader)}\t{loss_meter}\t{it_time_meter}")
        t0 = time.time()
    scheduler.step()
    val_acc = validate_comb(opt,encoder,classifier,val_loader) if USE_MOD_LBL else validate(opt, encoder, classifier, val_loader) 
    val_accs.append(val_acc)
    print(f"Epoch {epoch}/{opt.epochs}\tval_acc {val_acc*100:.4g}%")
print(f"Best validation accuracy {max(val_accs)}")

Files already downloaded and verified
Feature dimension: 4096


  0%|                                                                                                                                                  | 0/300 [00:00<?, ?it/s]

Epoch 0/100	It 0/40	loss 2.339645 (2.339645)	iter_time 0.162641 (0.162641)


  0%|▍                                                                                                                                         | 1/300 [00:01<09:30,  1.91s/it]

Epoch 0/100	val_acc 55.34%
Epoch 1/100	It 0/40	loss 1.105307 (1.105307)	iter_time 0.196209 (0.196209)


  1%|▉                                                                                                                                         | 2/300 [00:03<09:29,  1.91s/it]

Epoch 1/100	val_acc 67.2%
Epoch 2/100	It 0/40	loss 0.908647 (0.908647)	iter_time 0.191728 (0.191728)


  1%|█▍                                                                                                                                        | 3/300 [00:05<09:31,  1.92s/it]

Epoch 2/100	val_acc 66.65%
Epoch 3/100	It 0/40	loss 1.181084 (1.181084)	iter_time 0.196106 (0.196106)


  1%|█▊                                                                                                                                        | 4/300 [00:07<09:29,  1.93s/it]

Epoch 3/100	val_acc 69.51%
Epoch 4/100	It 0/40	loss 0.945611 (0.945611)	iter_time 0.160824 (0.160824)


  2%|██▎                                                                                                                                       | 5/300 [00:09<09:23,  1.91s/it]

Epoch 4/100	val_acc 68.69%
Epoch 5/100	It 0/40	loss 0.894147 (0.894147)	iter_time 0.193712 (0.193712)


  2%|██▊                                                                                                                                       | 6/300 [00:11<09:23,  1.92s/it]

Epoch 5/100	val_acc 69.33%
Epoch 6/100	It 0/40	loss 0.788599 (0.788599)	iter_time 0.178849 (0.178849)


  2%|███▏                                                                                                                                      | 7/300 [00:13<09:20,  1.91s/it]

Epoch 6/100	val_acc 69.46%
Epoch 7/100	It 0/40	loss 0.952060 (0.952060)	iter_time 0.164080 (0.164080)


  3%|███▋                                                                                                                                      | 8/300 [00:15<09:20,  1.92s/it]

Epoch 7/100	val_acc 74.12%
Epoch 8/100	It 0/40	loss 0.750865 (0.750865)	iter_time 0.162941 (0.162941)


  3%|████▏                                                                                                                                     | 9/300 [00:17<09:15,  1.91s/it]

Epoch 8/100	val_acc 70.01%
Epoch 9/100	It 0/40	loss 0.775425 (0.775425)	iter_time 0.181781 (0.181781)


  3%|████▌                                                                                                                                    | 10/300 [00:19<09:13,  1.91s/it]

Epoch 9/100	val_acc 70.96%
Epoch 10/100	It 0/40	loss 0.784923 (0.784923)	iter_time 0.161942 (0.161942)


  4%|█████                                                                                                                                    | 11/300 [00:21<09:12,  1.91s/it]

Epoch 10/100	val_acc 70.51%
Epoch 11/100	It 0/40	loss 1.050940 (1.050940)	iter_time 0.164846 (0.164846)


  4%|█████▍                                                                                                                                   | 12/300 [00:22<09:10,  1.91s/it]

Epoch 11/100	val_acc 71.29%
Epoch 12/100	It 0/40	loss 0.651591 (0.651591)	iter_time 0.161737 (0.161737)


  4%|█████▉                                                                                                                                   | 13/300 [00:24<09:08,  1.91s/it]

Epoch 12/100	val_acc 67.8%
Epoch 13/100	It 0/40	loss 0.811114 (0.811114)	iter_time 0.168574 (0.168574)


  5%|██████▍                                                                                                                                  | 14/300 [00:26<09:07,  1.91s/it]

Epoch 13/100	val_acc 63.08%
Epoch 14/100	It 0/40	loss 1.150851 (1.150851)	iter_time 0.196935 (0.196935)


  5%|██████▊                                                                                                                                  | 15/300 [00:28<09:05,  1.91s/it]

Epoch 14/100	val_acc 71.51%
Epoch 15/100	It 0/40	loss 0.769827 (0.769827)	iter_time 0.164417 (0.164417)


  5%|███████▎                                                                                                                                 | 16/300 [00:30<09:01,  1.91s/it]

Epoch 15/100	val_acc 67.89%
Epoch 16/100	It 0/40	loss 0.915262 (0.915262)	iter_time 0.196934 (0.196934)


  6%|███████▊                                                                                                                                 | 17/300 [00:32<09:01,  1.91s/it]

Epoch 16/100	val_acc 72.76%
Epoch 17/100	It 0/40	loss 0.748106 (0.748106)	iter_time 0.160312 (0.160312)


  6%|████████▏                                                                                                                                | 18/300 [00:34<08:57,  1.90s/it]

Epoch 17/100	val_acc 71.43%
Epoch 18/100	It 0/40	loss 0.791917 (0.791917)	iter_time 0.171667 (0.171667)


  6%|████████▋                                                                                                                                | 19/300 [00:36<08:56,  1.91s/it]

Epoch 18/100	val_acc 72.8%
Epoch 19/100	It 0/40	loss 0.651512 (0.651512)	iter_time 0.195307 (0.195307)


  7%|█████████▏                                                                                                                               | 20/300 [00:38<08:55,  1.91s/it]

Epoch 19/100	val_acc 70.33%
Epoch 20/100	It 0/40	loss 0.861616 (0.861616)	iter_time 0.160445 (0.160445)


  7%|█████████▌                                                                                                                               | 21/300 [00:40<08:53,  1.91s/it]

Epoch 20/100	val_acc 73.17%
Epoch 21/100	It 0/40	loss 0.702018 (0.702018)	iter_time 0.161341 (0.161341)


  7%|██████████                                                                                                                               | 22/300 [00:42<08:52,  1.91s/it]

Epoch 21/100	val_acc 73.86%
Epoch 22/100	It 0/40	loss 0.833591 (0.833591)	iter_time 0.164433 (0.164433)


  8%|██████████▌                                                                                                                              | 23/300 [00:43<08:47,  1.90s/it]

Epoch 22/100	val_acc 73.04%
Epoch 23/100	It 0/40	loss 0.532020 (0.532020)	iter_time 0.199179 (0.199179)


  8%|██████████▉                                                                                                                              | 24/300 [00:45<08:48,  1.92s/it]

Epoch 23/100	val_acc 74.49%
Epoch 24/100	It 0/40	loss 0.663429 (0.663429)	iter_time 0.197477 (0.197477)


  8%|███████████▍                                                                                                                             | 25/300 [00:47<08:49,  1.93s/it]

Epoch 24/100	val_acc 75.34%
Epoch 25/100	It 0/40	loss 0.569364 (0.569364)	iter_time 0.203192 (0.203192)


  9%|███████████▊                                                                                                                             | 26/300 [00:49<08:47,  1.92s/it]

Epoch 25/100	val_acc 73.05%
Epoch 26/100	It 0/40	loss 0.679083 (0.679083)	iter_time 0.174297 (0.174297)


  9%|████████████▎                                                                                                                            | 27/300 [00:51<08:45,  1.92s/it]

Epoch 26/100	val_acc 75.52%
Epoch 27/100	It 0/40	loss 0.563095 (0.563095)	iter_time 0.200249 (0.200249)


  9%|████████████▊                                                                                                                            | 28/300 [00:53<08:45,  1.93s/it]

Epoch 27/100	val_acc 71.09%
Epoch 28/100	It 0/40	loss 0.753445 (0.753445)	iter_time 0.195487 (0.195487)


 10%|█████████████▏                                                                                                                           | 29/300 [00:55<08:44,  1.94s/it]

Epoch 28/100	val_acc 75.96%
Epoch 29/100	It 0/40	loss 0.548206 (0.548206)	iter_time 0.178424 (0.178424)


 10%|█████████████▋                                                                                                                           | 30/300 [00:57<08:38,  1.92s/it]

Epoch 29/100	val_acc 75.94%
Epoch 30/100	It 0/40	loss 0.563700 (0.563700)	iter_time 0.167848 (0.167848)


 10%|██████████████▏                                                                                                                          | 31/300 [00:59<08:35,  1.92s/it]

Epoch 30/100	val_acc 72.61%
Epoch 31/100	It 0/40	loss 0.709929 (0.709929)	iter_time 0.195707 (0.195707)


 11%|██████████████▌                                                                                                                          | 32/300 [01:01<08:36,  1.93s/it]

Epoch 31/100	val_acc 75.51%
Epoch 32/100	It 0/40	loss 0.575070 (0.575070)	iter_time 0.165015 (0.165015)


 11%|███████████████                                                                                                                          | 33/300 [01:03<08:34,  1.93s/it]

Epoch 32/100	val_acc 68.46%
Epoch 33/100	It 0/40	loss 0.793839 (0.793839)	iter_time 0.195134 (0.195134)


 11%|███████████████▌                                                                                                                         | 34/300 [01:05<08:33,  1.93s/it]

Epoch 33/100	val_acc 75.19%
Epoch 34/100	It 0/40	loss 0.642774 (0.642774)	iter_time 0.176584 (0.176584)


 12%|███████████████▉                                                                                                                         | 35/300 [01:07<08:31,  1.93s/it]

Epoch 34/100	val_acc 74.5%
Epoch 35/100	It 0/40	loss 0.521672 (0.521672)	iter_time 0.163620 (0.163620)


 12%|████████████████▍                                                                                                                        | 36/300 [01:09<08:28,  1.93s/it]

Epoch 35/100	val_acc 70.34%
Epoch 36/100	It 0/40	loss 0.726657 (0.726657)	iter_time 0.197120 (0.197120)


 12%|████████████████▉                                                                                                                        | 37/300 [01:11<08:28,  1.93s/it]

Epoch 36/100	val_acc 75.69%
Epoch 37/100	It 0/40	loss 0.685239 (0.685239)	iter_time 0.166139 (0.166139)


 13%|█████████████████▎                                                                                                                       | 38/300 [01:12<08:25,  1.93s/it]

Epoch 37/100	val_acc 71.71%
Epoch 38/100	It 0/40	loss 0.847664 (0.847664)	iter_time 0.163364 (0.163364)


 13%|█████████████████▊                                                                                                                       | 39/300 [01:14<08:21,  1.92s/it]

Epoch 38/100	val_acc 68.15%
Epoch 39/100	It 0/40	loss 0.836805 (0.836805)	iter_time 0.200916 (0.200916)


 13%|██████████████████▎                                                                                                                      | 40/300 [01:16<08:20,  1.93s/it]

Epoch 39/100	val_acc 72.56%
Epoch 40/100	It 0/40	loss 0.626631 (0.626631)	iter_time 0.197263 (0.197263)


 14%|██████████████████▋                                                                                                                      | 41/300 [01:18<08:18,  1.93s/it]

Epoch 40/100	val_acc 67.71%
Epoch 41/100	It 0/40	loss 0.767045 (0.767045)	iter_time 0.196594 (0.196594)


 14%|███████████████████▏                                                                                                                     | 42/300 [01:20<08:18,  1.93s/it]

Epoch 41/100	val_acc 70.19%
Epoch 42/100	It 0/40	loss 0.861194 (0.861194)	iter_time 0.194753 (0.194753)


 14%|███████████████████▋                                                                                                                     | 43/300 [01:22<08:16,  1.93s/it]

Epoch 42/100	val_acc 73.91%
Epoch 43/100	It 0/40	loss 0.685336 (0.685336)	iter_time 0.178963 (0.178963)


 15%|████████████████████                                                                                                                     | 44/300 [01:24<08:14,  1.93s/it]

Epoch 43/100	val_acc 71.35%
Epoch 44/100	It 0/40	loss 0.676929 (0.676929)	iter_time 0.181473 (0.181473)


 15%|████████████████████▌                                                                                                                    | 45/300 [01:26<08:12,  1.93s/it]

Epoch 44/100	val_acc 70.06%
Epoch 45/100	It 0/40	loss 0.601702 (0.601702)	iter_time 0.164586 (0.164586)


 15%|█████████████████████                                                                                                                    | 46/300 [01:28<08:08,  1.92s/it]

Epoch 45/100	val_acc 72.34%
Epoch 46/100	It 0/40	loss 0.480714 (0.480714)	iter_time 0.172827 (0.172827)


 16%|█████████████████████▍                                                                                                                   | 47/300 [01:30<08:04,  1.92s/it]

Epoch 46/100	val_acc 75.88%
Epoch 47/100	It 0/40	loss 0.535451 (0.535451)	iter_time 0.198700 (0.198700)


 16%|█████████████████████▉                                                                                                                   | 48/300 [01:32<08:04,  1.92s/it]

Epoch 47/100	val_acc 65.29%
Epoch 48/100	It 0/40	loss 0.856559 (0.856559)	iter_time 0.196808 (0.196808)


 16%|██████████████████████▍                                                                                                                  | 49/300 [01:34<08:04,  1.93s/it]

Epoch 48/100	val_acc 71.09%
Epoch 49/100	It 0/40	loss 0.611419 (0.611419)	iter_time 0.191519 (0.191519)


 17%|██████████████████████▊                                                                                                                  | 50/300 [01:36<08:00,  1.92s/it]

Epoch 49/100	val_acc 76.64%
Epoch 50/100	It 0/40	loss 0.413929 (0.413929)	iter_time 0.160407 (0.160407)


 17%|███████████████████████▎                                                                                                                 | 51/300 [01:37<07:58,  1.92s/it]

Epoch 50/100	val_acc 74.71%
Epoch 51/100	It 0/40	loss 0.456731 (0.456731)	iter_time 0.175637 (0.175637)


 17%|███████████████████████▋                                                                                                                 | 52/300 [01:39<07:55,  1.92s/it]

Epoch 51/100	val_acc 71.05%
Epoch 52/100	It 0/40	loss 0.611841 (0.611841)	iter_time 0.165087 (0.165087)


 18%|████████████████████████▏                                                                                                                | 53/300 [01:41<07:51,  1.91s/it]

Epoch 52/100	val_acc 70.66%
Epoch 53/100	It 0/40	loss 0.719655 (0.719655)	iter_time 0.160030 (0.160030)


 18%|████████████████████████▋                                                                                                                | 54/300 [01:43<07:48,  1.90s/it]

Epoch 53/100	val_acc 63.59%
Epoch 54/100	It 0/40	loss 0.864085 (0.864085)	iter_time 0.159310 (0.159310)


 18%|█████████████████████████                                                                                                                | 55/300 [01:45<07:45,  1.90s/it]

Epoch 54/100	val_acc 67.79%
Epoch 55/100	It 0/40	loss 0.787096 (0.787096)	iter_time 0.196391 (0.196391)


 19%|█████████████████████████▌                                                                                                               | 56/300 [01:47<07:45,  1.91s/it]

Epoch 55/100	val_acc 72.19%
Epoch 56/100	It 0/40	loss 0.624031 (0.624031)	iter_time 0.160790 (0.160790)


 19%|██████████████████████████                                                                                                               | 57/300 [01:49<07:44,  1.91s/it]

Epoch 56/100	val_acc 70.35%
Epoch 57/100	It 0/40	loss 0.710192 (0.710192)	iter_time 0.161025 (0.161025)


 19%|██████████████████████████▍                                                                                                              | 58/300 [01:51<07:42,  1.91s/it]

Epoch 57/100	val_acc 74.42%
Epoch 58/100	It 0/40	loss 0.559201 (0.559201)	iter_time 0.161946 (0.161946)


 20%|██████████████████████████▉                                                                                                              | 59/300 [01:53<07:39,  1.91s/it]

Epoch 58/100	val_acc 73.06%
Epoch 59/100	It 0/40	loss 0.768336 (0.768336)	iter_time 0.183095 (0.183095)


 20%|███████████████████████████▍                                                                                                             | 60/300 [01:55<07:37,  1.90s/it]

Epoch 59/100	val_acc 72.8%
Epoch 60/100	It 0/40	loss 0.595649 (0.595649)	iter_time 0.180991 (0.180991)


 20%|███████████████████████████▊                                                                                                             | 61/300 [01:56<07:34,  1.90s/it]

Epoch 60/100	val_acc 78%
Epoch 61/100	It 0/40	loss 0.462458 (0.462458)	iter_time 0.167952 (0.167952)


 21%|████████████████████████████▎                                                                                                            | 62/300 [01:58<07:33,  1.90s/it]

Epoch 61/100	val_acc 77.36%
Epoch 62/100	It 0/40	loss 0.601639 (0.601639)	iter_time 0.195005 (0.195005)


 21%|████████████████████████████▊                                                                                                            | 63/300 [02:00<07:32,  1.91s/it]

Epoch 62/100	val_acc 78.22%
Epoch 63/100	It 0/40	loss 0.522745 (0.522745)	iter_time 0.184485 (0.184485)


 21%|█████████████████████████████▏                                                                                                           | 64/300 [02:02<07:33,  1.92s/it]

Epoch 63/100	val_acc 77.15%
Epoch 64/100	It 0/40	loss 0.333047 (0.333047)	iter_time 0.194693 (0.194693)


 22%|█████████████████████████████▋                                                                                                           | 65/300 [02:04<07:31,  1.92s/it]

Epoch 64/100	val_acc 78.05%
Epoch 65/100	It 0/40	loss 0.461483 (0.461483)	iter_time 0.197472 (0.197472)


 22%|██████████████████████████████▏                                                                                                          | 66/300 [02:06<07:31,  1.93s/it]

Epoch 65/100	val_acc 77.95%
Epoch 66/100	It 0/40	loss 0.337620 (0.337620)	iter_time 0.198164 (0.198164)


 22%|██████████████████████████████▌                                                                                                          | 67/300 [02:08<07:28,  1.93s/it]

Epoch 66/100	val_acc 78.04%
Epoch 67/100	It 0/40	loss 0.387474 (0.387474)	iter_time 0.165886 (0.165886)


 23%|███████████████████████████████                                                                                                          | 68/300 [02:10<07:25,  1.92s/it]

Epoch 67/100	val_acc 78.03%
Epoch 68/100	It 0/40	loss 0.555400 (0.555400)	iter_time 0.176702 (0.176702)


 23%|███████████████████████████████▌                                                                                                         | 69/300 [02:12<07:22,  1.92s/it]

Epoch 68/100	val_acc 78.2%
Epoch 69/100	It 0/40	loss 0.545468 (0.545468)	iter_time 0.172498 (0.172498)


 23%|███████████████████████████████▉                                                                                                         | 70/300 [02:14<07:21,  1.92s/it]

Epoch 69/100	val_acc 77.83%
Epoch 70/100	It 0/40	loss 0.554352 (0.554352)	iter_time 0.195573 (0.195573)


 24%|████████████████████████████████▍                                                                                                        | 71/300 [02:16<07:21,  1.93s/it]

Epoch 70/100	val_acc 78.45%
Epoch 71/100	It 0/40	loss 0.406198 (0.406198)	iter_time 0.169655 (0.169655)


 24%|████████████████████████████████▉                                                                                                        | 72/300 [02:18<07:18,  1.92s/it]

Epoch 71/100	val_acc 78.51%
Epoch 72/100	It 0/40	loss 0.577630 (0.577630)	iter_time 0.205028 (0.205028)


 24%|█████████████████████████████████▎                                                                                                       | 73/300 [02:20<07:16,  1.92s/it]

Epoch 72/100	val_acc 77.34%
Epoch 73/100	It 0/40	loss 0.503990 (0.503990)	iter_time 0.197431 (0.197431)


 25%|█████████████████████████████████▊                                                                                                       | 74/300 [02:21<07:14,  1.92s/it]

Epoch 73/100	val_acc 78.05%
Epoch 74/100	It 0/40	loss 0.448555 (0.448555)	iter_time 0.203357 (0.203357)


 25%|██████████████████████████████████▎                                                                                                      | 75/300 [02:23<07:13,  1.93s/it]

Epoch 74/100	val_acc 78.17%
Epoch 75/100	It 0/40	loss 0.496408 (0.496408)	iter_time 0.194499 (0.194499)


 25%|██████████████████████████████████▋                                                                                                      | 76/300 [02:25<07:11,  1.93s/it]

Epoch 75/100	val_acc 78.06%
Epoch 76/100	It 0/40	loss 0.388265 (0.388265)	iter_time 0.196291 (0.196291)


 26%|███████████████████████████████████▏                                                                                                     | 77/300 [02:27<07:09,  1.92s/it]

Epoch 76/100	val_acc 78.22%
Epoch 77/100	It 0/40	loss 0.589281 (0.589281)	iter_time 0.195219 (0.195219)


 26%|███████████████████████████████████▌                                                                                                     | 78/300 [02:29<07:06,  1.92s/it]

Epoch 77/100	val_acc 78.31%
Epoch 78/100	It 0/40	loss 0.560108 (0.560108)	iter_time 0.176059 (0.176059)


 26%|████████████████████████████████████                                                                                                     | 79/300 [02:31<07:02,  1.91s/it]

Epoch 78/100	val_acc 78.45%
Epoch 79/100	It 0/40	loss 0.346133 (0.346133)	iter_time 0.166720 (0.166720)


 27%|████████████████████████████████████▌                                                                                                    | 80/300 [02:33<06:59,  1.91s/it]

Epoch 79/100	val_acc 78.15%
Epoch 80/100	It 0/40	loss 0.491644 (0.491644)	iter_time 0.159605 (0.159605)


 27%|████████████████████████████████████▉                                                                                                    | 81/300 [02:35<06:57,  1.91s/it]

Epoch 80/100	val_acc 78.34%
Epoch 81/100	It 0/40	loss 0.512349 (0.512349)	iter_time 0.182082 (0.182082)


 27%|█████████████████████████████████████▍                                                                                                   | 82/300 [02:37<06:57,  1.91s/it]

Epoch 81/100	val_acc 78.45%
Epoch 82/100	It 0/40	loss 0.418894 (0.418894)	iter_time 0.165463 (0.165463)


 28%|█████████████████████████████████████▉                                                                                                   | 83/300 [02:39<06:53,  1.91s/it]

Epoch 82/100	val_acc 78.26%
Epoch 83/100	It 0/40	loss 0.504078 (0.504078)	iter_time 0.179247 (0.179247)


 28%|██████████████████████████████████████▎                                                                                                  | 84/300 [02:41<06:50,  1.90s/it]

Epoch 83/100	val_acc 78.41%
Epoch 84/100	It 0/40	loss 0.570640 (0.570640)	iter_time 0.194570 (0.194570)


 28%|██████████████████████████████████████▊                                                                                                  | 85/300 [02:42<06:49,  1.90s/it]

Epoch 84/100	val_acc 78.29%
Epoch 85/100	It 0/40	loss 0.516358 (0.516358)	iter_time 0.199173 (0.199173)


 29%|███████████████████████████████████████▎                                                                                                 | 86/300 [02:44<06:50,  1.92s/it]

Epoch 85/100	val_acc 78.46%
Epoch 86/100	It 0/40	loss 0.373774 (0.373774)	iter_time 0.167516 (0.167516)


 29%|███████████████████████████████████████▋                                                                                                 | 87/300 [02:46<06:46,  1.91s/it]

Epoch 86/100	val_acc 78.29%
Epoch 87/100	It 0/40	loss 0.507456 (0.507456)	iter_time 0.196975 (0.196975)


 29%|████████████████████████████████████████▏                                                                                                | 88/300 [02:48<06:47,  1.92s/it]

Epoch 87/100	val_acc 78.54%
Epoch 88/100	It 0/40	loss 0.534094 (0.534094)	iter_time 0.197204 (0.197204)


 30%|████████████████████████████████████████▋                                                                                                | 89/300 [02:50<06:46,  1.93s/it]

Epoch 88/100	val_acc 78.44%
Epoch 89/100	It 0/40	loss 0.417706 (0.417706)	iter_time 0.194492 (0.194492)


 30%|█████████████████████████████████████████                                                                                                | 90/300 [02:52<06:44,  1.93s/it]

Epoch 89/100	val_acc 78.42%
Epoch 90/100	It 0/40	loss 0.508354 (0.508354)	iter_time 0.196307 (0.196307)


 30%|█████████████████████████████████████████▌                                                                                               | 91/300 [02:54<06:42,  1.92s/it]

Epoch 90/100	val_acc 78.47%
Epoch 91/100	It 0/40	loss 0.518649 (0.518649)	iter_time 0.161921 (0.161921)


 31%|██████████████████████████████████████████                                                                                               | 92/300 [02:56<06:39,  1.92s/it]

Epoch 91/100	val_acc 78.38%
Epoch 92/100	It 0/40	loss 0.516637 (0.516637)	iter_time 0.159432 (0.159432)


 31%|██████████████████████████████████████████▍                                                                                              | 93/300 [02:58<06:35,  1.91s/it]

Epoch 92/100	val_acc 78.39%
Epoch 93/100	It 0/40	loss 0.515171 (0.515171)	iter_time 0.196063 (0.196063)


 31%|██████████████████████████████████████████▉                                                                                              | 94/300 [03:00<06:36,  1.92s/it]

Epoch 93/100	val_acc 78.54%
Epoch 94/100	It 0/40	loss 0.480285 (0.480285)	iter_time 0.164690 (0.164690)


 32%|███████████████████████████████████████████▍                                                                                             | 95/300 [03:02<06:34,  1.93s/it]

Epoch 94/100	val_acc 78.3%
Epoch 95/100	It 0/40	loss 0.525917 (0.525917)	iter_time 0.196891 (0.196891)


 32%|███████████████████████████████████████████▊                                                                                             | 96/300 [03:04<06:33,  1.93s/it]

Epoch 95/100	val_acc 78.35%
Epoch 96/100	It 0/40	loss 0.615306 (0.615306)	iter_time 0.193340 (0.193340)


 32%|████████████████████████████████████████████▎                                                                                            | 97/300 [03:06<06:30,  1.92s/it]

Epoch 96/100	val_acc 78.33%
Epoch 97/100	It 0/40	loss 0.356446 (0.356446)	iter_time 0.160687 (0.160687)


 33%|████████████████████████████████████████████▊                                                                                            | 98/300 [03:07<06:27,  1.92s/it]

Epoch 97/100	val_acc 78.38%
Epoch 98/100	It 0/40	loss 0.376741 (0.376741)	iter_time 0.196711 (0.196711)


 33%|█████████████████████████████████████████████▏                                                                                           | 99/300 [03:09<06:25,  1.92s/it]

Epoch 98/100	val_acc 78.49%
Epoch 99/100	It 0/40	loss 0.449468 (0.449468)	iter_time 0.164806 (0.164806)


 33%|█████████████████████████████████████████████▎                                                                                          | 100/300 [03:11<06:22,  1.91s/it]

Epoch 99/100	val_acc 78.47%
Epoch 100/100	It 0/40	loss 0.381624 (0.381624)	iter_time 0.196541 (0.196541)


 34%|█████████████████████████████████████████████▊                                                                                          | 101/300 [03:13<06:23,  1.93s/it]

Epoch 100/100	val_acc 78.64%
Epoch 101/100	It 0/40	loss 0.362568 (0.362568)	iter_time 0.168052 (0.168052)


 34%|██████████████████████████████████████████████▏                                                                                         | 102/300 [03:15<06:19,  1.92s/it]

Epoch 101/100	val_acc 78.53%
Epoch 102/100	It 0/40	loss 0.370550 (0.370550)	iter_time 0.160975 (0.160975)


 34%|██████████████████████████████████████████████▋                                                                                         | 103/300 [03:17<06:16,  1.91s/it]

Epoch 102/100	val_acc 78.53%
Epoch 103/100	It 0/40	loss 0.429971 (0.429971)	iter_time 0.181682 (0.181682)


 35%|███████████████████████████████████████████████▏                                                                                        | 104/300 [03:19<06:16,  1.92s/it]

Epoch 103/100	val_acc 78.59%
Epoch 104/100	It 0/40	loss 0.367353 (0.367353)	iter_time 0.200170 (0.200170)


 35%|███████████████████████████████████████████████▌                                                                                        | 105/300 [03:21<06:14,  1.92s/it]

Epoch 104/100	val_acc 78.49%
Epoch 105/100	It 0/40	loss 0.439524 (0.439524)	iter_time 0.195984 (0.195984)


 35%|████████████████████████████████████████████████                                                                                        | 106/300 [03:23<06:15,  1.94s/it]

Epoch 105/100	val_acc 78.57%
Epoch 106/100	It 0/40	loss 0.343785 (0.343785)	iter_time 0.197330 (0.197330)


 36%|████████████████████████████████████████████████▌                                                                                       | 107/300 [03:25<06:15,  1.95s/it]

Epoch 106/100	val_acc 78.51%
Epoch 107/100	It 0/40	loss 0.482713 (0.482713)	iter_time 0.163105 (0.163105)


 36%|████████████████████████████████████████████████▉                                                                                       | 108/300 [03:27<06:19,  1.98s/it]

Epoch 107/100	val_acc 78.54%
Epoch 108/100	It 0/40	loss 0.391690 (0.391690)	iter_time 0.193018 (0.193018)


 36%|█████████████████████████████████████████████████▍                                                                                      | 109/300 [03:29<06:15,  1.97s/it]

Epoch 108/100	val_acc 78.56%
Epoch 109/100	It 0/40	loss 0.447234 (0.447234)	iter_time 0.164951 (0.164951)


 37%|█████████████████████████████████████████████████▊                                                                                      | 110/300 [03:31<06:11,  1.95s/it]

Epoch 109/100	val_acc 78.45%
Epoch 110/100	It 0/40	loss 0.437058 (0.437058)	iter_time 0.184692 (0.184692)


 37%|██████████████████████████████████████████████████▎                                                                                     | 111/300 [03:33<06:07,  1.94s/it]

Epoch 110/100	val_acc 78.49%
Epoch 111/100	It 0/40	loss 0.603182 (0.603182)	iter_time 0.178817 (0.178817)


 37%|██████████████████████████████████████████████████▊                                                                                     | 112/300 [03:35<06:04,  1.94s/it]

Epoch 111/100	val_acc 78.59%
Epoch 112/100	It 0/40	loss 0.439820 (0.439820)	iter_time 0.202223 (0.202223)


 38%|███████████████████████████████████████████████████▏                                                                                    | 113/300 [03:37<06:04,  1.95s/it]

Epoch 112/100	val_acc 78.55%
Epoch 113/100	It 0/40	loss 0.431521 (0.431521)	iter_time 0.163477 (0.163477)


 38%|███████████████████████████████████████████████████▋                                                                                    | 114/300 [03:39<06:01,  1.94s/it]

Epoch 113/100	val_acc 78.39%
Epoch 114/100	It 0/40	loss 0.435380 (0.435380)	iter_time 0.178789 (0.178789)


 38%|████████████████████████████████████████████████████▏                                                                                   | 115/300 [03:40<05:57,  1.93s/it]

Epoch 114/100	val_acc 78.49%
Epoch 115/100	It 0/40	loss 0.503938 (0.503938)	iter_time 0.164700 (0.164700)


 39%|████████████████████████████████████████████████████▌                                                                                   | 116/300 [03:42<05:54,  1.93s/it]

Epoch 115/100	val_acc 78.44%
Epoch 116/100	It 0/40	loss 0.493067 (0.493067)	iter_time 0.181591 (0.181591)


 39%|█████████████████████████████████████████████████████                                                                                   | 117/300 [03:44<05:51,  1.92s/it]

Epoch 116/100	val_acc 78.39%
Epoch 117/100	It 0/40	loss 0.474566 (0.474566)	iter_time 0.188787 (0.188787)


 39%|█████████████████████████████████████████████████████▍                                                                                  | 118/300 [03:46<05:49,  1.92s/it]

Epoch 117/100	val_acc 78.36%
Epoch 118/100	It 0/40	loss 0.512752 (0.512752)	iter_time 0.201020 (0.201020)


 40%|█████████████████████████████████████████████████████▉                                                                                  | 119/300 [03:48<05:47,  1.92s/it]

Epoch 118/100	val_acc 78.39%
Epoch 119/100	It 0/40	loss 0.472589 (0.472589)	iter_time 0.160451 (0.160451)


 40%|██████████████████████████████████████████████████████▍                                                                                 | 120/300 [03:50<05:43,  1.91s/it]

Epoch 119/100	val_acc 78.38%
Epoch 120/100	It 0/40	loss 0.393208 (0.393208)	iter_time 0.169493 (0.169493)


 40%|██████████████████████████████████████████████████████▊                                                                                 | 121/300 [03:52<05:42,  1.91s/it]

Epoch 120/100	val_acc 78.46%
Epoch 121/100	It 0/40	loss 0.447318 (0.447318)	iter_time 0.185899 (0.185899)


 41%|███████████████████████████████████████████████████████▎                                                                                | 122/300 [03:54<05:41,  1.92s/it]

Epoch 121/100	val_acc 78.34%
Epoch 122/100	It 0/40	loss 0.586199 (0.586199)	iter_time 0.174759 (0.174759)


 41%|███████████████████████████████████████████████████████▊                                                                                | 123/300 [03:56<05:40,  1.92s/it]

Epoch 122/100	val_acc 78.31%
Epoch 123/100	It 0/40	loss 0.459709 (0.459709)	iter_time 0.177722 (0.177722)


 41%|████████████████████████████████████████████████████████▏                                                                               | 124/300 [03:58<05:37,  1.91s/it]

Epoch 123/100	val_acc 78.61%
Epoch 124/100	It 0/40	loss 0.360896 (0.360896)	iter_time 0.160513 (0.160513)


 42%|████████████████████████████████████████████████████████▋                                                                               | 125/300 [04:00<05:35,  1.92s/it]

Epoch 124/100	val_acc 78.4%
Epoch 125/100	It 0/40	loss 0.471813 (0.471813)	iter_time 0.160771 (0.160771)


 42%|█████████████████████████████████████████████████████████                                                                               | 126/300 [04:02<05:34,  1.92s/it]

Epoch 125/100	val_acc 78.41%
Epoch 126/100	It 0/40	loss 0.510554 (0.510554)	iter_time 0.166588 (0.166588)


 42%|█████████████████████████████████████████████████████████▌                                                                              | 127/300 [04:03<05:30,  1.91s/it]

Epoch 126/100	val_acc 78.55%
Epoch 127/100	It 0/40	loss 0.433713 (0.433713)	iter_time 0.165609 (0.165609)


 43%|██████████████████████████████████████████████████████████                                                                              | 128/300 [04:05<05:28,  1.91s/it]

Epoch 127/100	val_acc 78.51%
Epoch 128/100	It 0/40	loss 0.457552 (0.457552)	iter_time 0.177906 (0.177906)


 43%|██████████████████████████████████████████████████████████▍                                                                             | 129/300 [04:07<05:26,  1.91s/it]

Epoch 128/100	val_acc 78.39%
Epoch 129/100	It 0/40	loss 0.330788 (0.330788)	iter_time 0.162864 (0.162864)


 43%|██████████████████████████████████████████████████████████▉                                                                             | 130/300 [04:09<05:23,  1.90s/it]

Epoch 129/100	val_acc 78.5%
Epoch 130/100	It 0/40	loss 0.557065 (0.557065)	iter_time 0.162370 (0.162370)


 44%|███████████████████████████████████████████████████████████▍                                                                            | 131/300 [04:11<05:21,  1.91s/it]

Epoch 130/100	val_acc 78.53%
Epoch 131/100	It 0/40	loss 0.397261 (0.397261)	iter_time 0.178265 (0.178265)


 44%|███████████████████████████████████████████████████████████▊                                                                            | 132/300 [04:13<05:20,  1.91s/it]

Epoch 131/100	val_acc 78.35%
Epoch 132/100	It 0/40	loss 0.391268 (0.391268)	iter_time 0.196323 (0.196323)


 44%|████████████████████████████████████████████████████████████▎                                                                           | 133/300 [04:15<05:20,  1.92s/it]

Epoch 132/100	val_acc 78.5%
Epoch 133/100	It 0/40	loss 0.485168 (0.485168)	iter_time 0.160889 (0.160889)


 45%|████████████████████████████████████████████████████████████▋                                                                           | 134/300 [04:17<05:18,  1.92s/it]

Epoch 133/100	val_acc 78.49%
Epoch 134/100	It 0/40	loss 0.440450 (0.440450)	iter_time 0.162059 (0.162059)


 45%|█████████████████████████████████████████████████████████████▏                                                                          | 135/300 [04:19<05:17,  1.92s/it]

Epoch 134/100	val_acc 78.55%
Epoch 135/100	It 0/40	loss 0.519141 (0.519141)	iter_time 0.185553 (0.185553)


 45%|█████████████████████████████████████████████████████████████▋                                                                          | 136/300 [04:21<05:15,  1.92s/it]

Epoch 135/100	val_acc 78.4%
Epoch 136/100	It 0/40	loss 0.465263 (0.465263)	iter_time 0.194814 (0.194814)


 46%|██████████████████████████████████████████████████████████████                                                                          | 137/300 [04:23<05:13,  1.92s/it]

Epoch 136/100	val_acc 78.51%
Epoch 137/100	It 0/40	loss 0.489112 (0.489112)	iter_time 0.194548 (0.194548)


 46%|██████████████████████████████████████████████████████████████▌                                                                         | 138/300 [04:25<05:12,  1.93s/it]

Epoch 137/100	val_acc 78.39%
Epoch 138/100	It 0/40	loss 0.354380 (0.354380)	iter_time 0.192966 (0.192966)


 46%|███████████████████████████████████████████████████████████████                                                                         | 139/300 [04:26<05:11,  1.93s/it]

Epoch 138/100	val_acc 78.21%
Epoch 139/100	It 0/40	loss 0.514442 (0.514442)	iter_time 0.162334 (0.162334)


 47%|███████████████████████████████████████████████████████████████▍                                                                        | 140/300 [04:28<05:06,  1.91s/it]

Epoch 139/100	val_acc 78.33%
Epoch 140/100	It 0/40	loss 0.637624 (0.637624)	iter_time 0.160376 (0.160376)


 47%|███████████████████████████████████████████████████████████████▉                                                                        | 141/300 [04:30<05:03,  1.91s/it]

Epoch 140/100	val_acc 78.41%
Epoch 141/100	It 0/40	loss 0.355125 (0.355125)	iter_time 0.166460 (0.166460)


 47%|████████████████████████████████████████████████████████████████▎                                                                       | 142/300 [04:32<05:00,  1.90s/it]

Epoch 141/100	val_acc 78.36%
Epoch 142/100	It 0/40	loss 0.408856 (0.408856)	iter_time 0.164411 (0.164411)


 48%|████████████████████████████████████████████████████████████████▊                                                                       | 143/300 [04:34<04:57,  1.90s/it]

Epoch 142/100	val_acc 78.44%
Epoch 143/100	It 0/40	loss 0.450997 (0.450997)	iter_time 0.198339 (0.198339)


 48%|█████████████████████████████████████████████████████████████████▎                                                                      | 144/300 [04:36<04:56,  1.90s/it]

Epoch 143/100	val_acc 78.35%
Epoch 144/100	It 0/40	loss 0.400749 (0.400749)	iter_time 0.201474 (0.201474)


 48%|█████████████████████████████████████████████████████████████████▋                                                                      | 145/300 [04:38<04:56,  1.91s/it]

Epoch 144/100	val_acc 78.27%
Epoch 145/100	It 0/40	loss 0.448783 (0.448783)	iter_time 0.161224 (0.161224)


 49%|██████████████████████████████████████████████████████████████████▏                                                                     | 146/300 [04:40<04:54,  1.91s/it]

Epoch 145/100	val_acc 78.49%
Epoch 146/100	It 0/40	loss 0.534825 (0.534825)	iter_time 0.197791 (0.197791)


 49%|██████████████████████████████████████████████████████████████████▋                                                                     | 147/300 [04:42<04:53,  1.92s/it]

Epoch 146/100	val_acc 78.34%
Epoch 147/100	It 0/40	loss 0.359366 (0.359366)	iter_time 0.197635 (0.197635)


 49%|███████████████████████████████████████████████████████████████████                                                                     | 148/300 [04:44<04:53,  1.93s/it]

Epoch 147/100	val_acc 78.36%
Epoch 148/100	It 0/40	loss 0.441555 (0.441555)	iter_time 0.158466 (0.158466)


 50%|███████████████████████████████████████████████████████████████████▌                                                                    | 149/300 [04:46<04:50,  1.92s/it]

Epoch 148/100	val_acc 78.4%
Epoch 149/100	It 0/40	loss 0.432210 (0.432210)	iter_time 0.160003 (0.160003)


 50%|████████████████████████████████████████████████████████████████████                                                                    | 150/300 [04:47<04:47,  1.92s/it]

Epoch 149/100	val_acc 78.45%
Epoch 150/100	It 0/40	loss 0.406542 (0.406542)	iter_time 0.196085 (0.196085)


 50%|████████████████████████████████████████████████████████████████████▍                                                                   | 151/300 [04:49<04:46,  1.92s/it]

Epoch 150/100	val_acc 78.45%
Epoch 151/100	It 0/40	loss 0.446905 (0.446905)	iter_time 0.165407 (0.165407)


 51%|████████████████████████████████████████████████████████████████████▉                                                                   | 152/300 [04:51<04:43,  1.91s/it]

Epoch 151/100	val_acc 78.3%
Epoch 152/100	It 0/40	loss 0.518876 (0.518876)	iter_time 0.196520 (0.196520)


 51%|█████████████████████████████████████████████████████████████████████▎                                                                  | 153/300 [04:53<04:41,  1.91s/it]

Epoch 152/100	val_acc 78.38%
Epoch 153/100	It 0/40	loss 0.444754 (0.444754)	iter_time 0.196752 (0.196752)


 51%|█████████████████████████████████████████████████████████████████████▊                                                                  | 154/300 [04:55<04:40,  1.92s/it]

Epoch 153/100	val_acc 78.21%
Epoch 154/100	It 0/40	loss 0.457143 (0.457143)	iter_time 0.161075 (0.161075)


 52%|██████████████████████████████████████████████████████████████████████▎                                                                 | 155/300 [04:57<04:37,  1.92s/it]

Epoch 154/100	val_acc 78.26%
Epoch 155/100	It 0/40	loss 0.426943 (0.426943)	iter_time 0.200879 (0.200879)


 52%|██████████████████████████████████████████████████████████████████████▋                                                                 | 156/300 [04:59<04:37,  1.93s/it]

Epoch 155/100	val_acc 78.3%
Epoch 156/100	It 0/40	loss 0.499235 (0.499235)	iter_time 0.160932 (0.160932)


 52%|███████████████████████████████████████████████████████████████████████▏                                                                | 157/300 [05:01<04:35,  1.93s/it]

Epoch 156/100	val_acc 78.29%
Epoch 157/100	It 0/40	loss 0.381206 (0.381206)	iter_time 0.199914 (0.199914)


 53%|███████████████████████████████████████████████████████████████████████▋                                                                | 158/300 [05:03<04:34,  1.93s/it]

Epoch 157/100	val_acc 78.33%
Epoch 158/100	It 0/40	loss 0.486512 (0.486512)	iter_time 0.196036 (0.196036)


 53%|████████████████████████████████████████████████████████████████████████                                                                | 159/300 [05:05<04:32,  1.93s/it]

Epoch 158/100	val_acc 78.33%
Epoch 159/100	It 0/40	loss 0.417639 (0.417639)	iter_time 0.168513 (0.168513)


 53%|████████████████████████████████████████████████████████████████████████▌                                                               | 160/300 [05:07<04:30,  1.93s/it]

Epoch 159/100	val_acc 78.36%
Epoch 160/100	It 0/40	loss 0.471621 (0.471621)	iter_time 0.162444 (0.162444)


 54%|████████████████████████████████████████████████████████████████████████▉                                                               | 161/300 [05:09<04:27,  1.93s/it]

Epoch 160/100	val_acc 78.57%
Epoch 161/100	It 0/40	loss 0.410989 (0.410989)	iter_time 0.183811 (0.183811)


 54%|█████████████████████████████████████████████████████████████████████████▍                                                              | 162/300 [05:11<04:25,  1.92s/it]

Epoch 161/100	val_acc 78.45%
Epoch 162/100	It 0/40	loss 0.397707 (0.397707)	iter_time 0.160191 (0.160191)


 54%|█████████████████████████████████████████████████████████████████████████▉                                                              | 163/300 [05:12<04:22,  1.92s/it]

Epoch 162/100	val_acc 78.21%
Epoch 163/100	It 0/40	loss 0.509826 (0.509826)	iter_time 0.172121 (0.172121)


 55%|██████████████████████████████████████████████████████████████████████████▎                                                             | 164/300 [05:14<04:20,  1.92s/it]

Epoch 163/100	val_acc 78.26%
Epoch 164/100	It 0/40	loss 0.399505 (0.399505)	iter_time 0.160765 (0.160765)


 55%|██████████████████████████████████████████████████████████████████████████▊                                                             | 165/300 [05:16<04:18,  1.92s/it]

Epoch 164/100	val_acc 78.34%
Epoch 165/100	It 0/40	loss 0.502388 (0.502388)	iter_time 0.179321 (0.179321)


 55%|███████████████████████████████████████████████████████████████████████████▎                                                            | 166/300 [05:18<04:16,  1.91s/it]

Epoch 165/100	val_acc 78.36%
Epoch 166/100	It 0/40	loss 0.382289 (0.382289)	iter_time 0.167648 (0.167648)


 56%|███████████████████████████████████████████████████████████████████████████▋                                                            | 167/300 [05:20<04:13,  1.91s/it]

Epoch 166/100	val_acc 78.38%
Epoch 167/100	It 0/40	loss 0.434409 (0.434409)	iter_time 0.162990 (0.162990)


 56%|████████████████████████████████████████████████████████████████████████████▏                                                           | 168/300 [05:22<04:10,  1.90s/it]

Epoch 167/100	val_acc 78.38%
Epoch 168/100	It 0/40	loss 0.508736 (0.508736)	iter_time 0.164422 (0.164422)


 56%|████████████████████████████████████████████████████████████████████████████▌                                                           | 169/300 [05:24<04:07,  1.89s/it]

Epoch 168/100	val_acc 78.42%
Epoch 169/100	It 0/40	loss 0.559053 (0.559053)	iter_time 0.181843 (0.181843)


 57%|█████████████████████████████████████████████████████████████████████████████                                                           | 170/300 [05:26<04:06,  1.90s/it]

Epoch 169/100	val_acc 78.4%
Epoch 170/100	It 0/40	loss 0.460238 (0.460238)	iter_time 0.159507 (0.159507)


 57%|█████████████████████████████████████████████████████████████████████████████▌                                                          | 171/300 [05:28<04:06,  1.91s/it]

Epoch 170/100	val_acc 78.42%
Epoch 171/100	It 0/40	loss 0.605311 (0.605311)	iter_time 0.170142 (0.170142)


 57%|█████████████████████████████████████████████████████████████████████████████▉                                                          | 172/300 [05:30<04:04,  1.91s/it]

Epoch 171/100	val_acc 78.41%
Epoch 172/100	It 0/40	loss 0.437615 (0.437615)	iter_time 0.170973 (0.170973)


 58%|██████████████████████████████████████████████████████████████████████████████▍                                                         | 173/300 [05:31<04:01,  1.90s/it]

Epoch 172/100	val_acc 78.42%
Epoch 173/100	It 0/40	loss 0.511395 (0.511395)	iter_time 0.196207 (0.196207)


 58%|██████████████████████████████████████████████████████████████████████████████▉                                                         | 174/300 [05:33<04:00,  1.91s/it]

Epoch 173/100	val_acc 78.4%
Epoch 174/100	It 0/40	loss 0.408307 (0.408307)	iter_time 0.200584 (0.200584)


 58%|███████████████████████████████████████████████████████████████████████████████▎                                                        | 175/300 [05:35<04:00,  1.92s/it]

Epoch 174/100	val_acc 78.36%
Epoch 175/100	It 0/40	loss 0.338404 (0.338404)	iter_time 0.194724 (0.194724)


 59%|███████████████████████████████████████████████████████████████████████████████▊                                                        | 176/300 [05:37<03:59,  1.93s/it]

Epoch 175/100	val_acc 78.38%
Epoch 176/100	It 0/40	loss 0.575018 (0.575018)	iter_time 0.195501 (0.195501)


 59%|████████████████████████████████████████████████████████████████████████████████▏                                                       | 177/300 [05:39<03:58,  1.94s/it]

Epoch 176/100	val_acc 78.21%
Epoch 177/100	It 0/40	loss 0.353136 (0.353136)	iter_time 0.165772 (0.165772)


 59%|████████████████████████████████████████████████████████████████████████████████▋                                                       | 178/300 [05:41<03:55,  1.93s/it]

Epoch 177/100	val_acc 78.26%
Epoch 178/100	It 0/40	loss 0.378152 (0.378152)	iter_time 0.180582 (0.180582)


 60%|█████████████████████████████████████████████████████████████████████████████████▏                                                      | 179/300 [05:43<03:53,  1.93s/it]

Epoch 178/100	val_acc 78.27%
Epoch 179/100	It 0/40	loss 0.477829 (0.477829)	iter_time 0.195793 (0.195793)


 60%|█████████████████████████████████████████████████████████████████████████████████▌                                                      | 180/300 [05:45<03:50,  1.92s/it]

Epoch 179/100	val_acc 78.29%
Epoch 180/100	It 0/40	loss 0.392516 (0.392516)	iter_time 0.186219 (0.186219)


 60%|██████████████████████████████████████████████████████████████████████████████████                                                      | 181/300 [05:47<03:49,  1.92s/it]

Epoch 180/100	val_acc 78.27%
Epoch 181/100	It 0/40	loss 0.430068 (0.430068)	iter_time 0.160291 (0.160291)


 61%|██████████████████████████████████████████████████████████████████████████████████▌                                                     | 182/300 [05:49<03:46,  1.92s/it]

Epoch 181/100	val_acc 78.38%
Epoch 182/100	It 0/40	loss 0.455377 (0.455377)	iter_time 0.158900 (0.158900)


 61%|██████████████████████████████████████████████████████████████████████████████████▉                                                     | 183/300 [05:51<03:43,  1.91s/it]

Epoch 182/100	val_acc 78.35%
Epoch 183/100	It 0/40	loss 0.441603 (0.441603)	iter_time 0.197718 (0.197718)


 61%|███████████████████████████████████████████████████████████████████████████████████▍                                                    | 184/300 [05:53<03:42,  1.92s/it]

Epoch 183/100	val_acc 78.3%
Epoch 184/100	It 0/40	loss 0.554444 (0.554444)	iter_time 0.163738 (0.163738)


 62%|███████████████████████████████████████████████████████████████████████████████████▊                                                    | 185/300 [05:55<03:40,  1.92s/it]

Epoch 184/100	val_acc 78.45%
Epoch 185/100	It 0/40	loss 0.479514 (0.479514)	iter_time 0.165009 (0.165009)


 62%|████████████████████████████████████████████████████████████████████████████████████▎                                                   | 186/300 [05:57<03:38,  1.91s/it]

Epoch 185/100	val_acc 78.54%
Epoch 186/100	It 0/40	loss 0.435737 (0.435737)	iter_time 0.198255 (0.198255)


 62%|████████████████████████████████████████████████████████████████████████████████████▊                                                   | 187/300 [05:58<03:36,  1.92s/it]

Epoch 186/100	val_acc 78.24%
Epoch 187/100	It 0/40	loss 0.337894 (0.337894)	iter_time 0.183883 (0.183883)


 63%|█████████████████████████████████████████████████████████████████████████████████████▏                                                  | 188/300 [06:00<03:35,  1.93s/it]

Epoch 187/100	val_acc 78.44%
Epoch 188/100	It 0/40	loss 0.457180 (0.457180)	iter_time 0.164811 (0.164811)


 63%|█████████████████████████████████████████████████████████████████████████████████████▋                                                  | 189/300 [06:02<03:33,  1.92s/it]

Epoch 188/100	val_acc 78.51%
Epoch 189/100	It 0/40	loss 0.423163 (0.423163)	iter_time 0.195548 (0.195548)


 63%|██████████████████████████████████████████████████████████████████████████████████████▏                                                 | 190/300 [06:04<03:31,  1.92s/it]

Epoch 189/100	val_acc 78.56%
Epoch 190/100	It 0/40	loss 0.527550 (0.527550)	iter_time 0.162611 (0.162611)


 64%|██████████████████████████████████████████████████████████████████████████████████████▌                                                 | 191/300 [06:06<03:28,  1.91s/it]

Epoch 190/100	val_acc 78.4%
Epoch 191/100	It 0/40	loss 0.435822 (0.435822)	iter_time 0.178503 (0.178503)


 64%|███████████████████████████████████████████████████████████████████████████████████████                                                 | 192/300 [06:08<03:26,  1.91s/it]

Epoch 191/100	val_acc 78.56%
Epoch 192/100	It 0/40	loss 0.494434 (0.494434)	iter_time 0.160968 (0.160968)


 64%|███████████████████████████████████████████████████████████████████████████████████████▍                                                | 193/300 [06:10<03:24,  1.91s/it]

Epoch 192/100	val_acc 78.46%
Epoch 193/100	It 0/40	loss 0.394850 (0.394850)	iter_time 0.198210 (0.198210)


 65%|███████████████████████████████████████████████████████████████████████████████████████▉                                                | 194/300 [06:12<03:23,  1.92s/it]

Epoch 193/100	val_acc 78.46%
Epoch 194/100	It 0/40	loss 0.379445 (0.379445)	iter_time 0.186795 (0.186795)


 65%|████████████████████████████████████████████████████████████████████████████████████████▍                                               | 195/300 [06:14<03:20,  1.91s/it]

Epoch 194/100	val_acc 78.62%
Epoch 195/100	It 0/40	loss 0.561190 (0.561190)	iter_time 0.167425 (0.167425)


 65%|████████████████████████████████████████████████████████████████████████████████████████▊                                               | 196/300 [06:16<03:18,  1.91s/it]

Epoch 195/100	val_acc 78.56%
Epoch 196/100	It 0/40	loss 0.552800 (0.552800)	iter_time 0.196655 (0.196655)


 66%|█████████████████████████████████████████████████████████████████████████████████████████▎                                              | 197/300 [06:18<03:16,  1.91s/it]

Epoch 196/100	val_acc 78.61%
Epoch 197/100	It 0/40	loss 0.373312 (0.373312)	iter_time 0.161818 (0.161818)


 66%|█████████████████████████████████████████████████████████████████████████████████████████▊                                              | 198/300 [06:19<03:14,  1.91s/it]

Epoch 197/100	val_acc 78.34%
Epoch 198/100	It 0/40	loss 0.457704 (0.457704)	iter_time 0.171459 (0.171459)


 66%|██████████████████████████████████████████████████████████████████████████████████████████▏                                             | 199/300 [06:21<03:12,  1.91s/it]

Epoch 198/100	val_acc 78.4%
Epoch 199/100	It 0/40	loss 0.397596 (0.397596)	iter_time 0.194930 (0.194930)


 67%|██████████████████████████████████████████████████████████████████████████████████████████▋                                             | 200/300 [06:23<03:10,  1.91s/it]

Epoch 199/100	val_acc 78.3%
Epoch 200/100	It 0/40	loss 0.379509 (0.379509)	iter_time 0.195173 (0.195173)


 67%|███████████████████████████████████████████████████████████████████████████████████████████                                             | 201/300 [06:25<03:09,  1.92s/it]

Epoch 200/100	val_acc 78.54%
Epoch 201/100	It 0/40	loss 0.423094 (0.423094)	iter_time 0.181851 (0.181851)


 67%|███████████████████████████████████████████████████████████████████████████████████████████▌                                            | 202/300 [06:27<03:08,  1.92s/it]

Epoch 201/100	val_acc 78.56%
Epoch 202/100	It 0/40	loss 0.410393 (0.410393)	iter_time 0.189337 (0.189337)


 68%|████████████████████████████████████████████████████████████████████████████████████████████                                            | 203/300 [06:29<03:06,  1.92s/it]

Epoch 202/100	val_acc 78.4%
Epoch 203/100	It 0/40	loss 0.449440 (0.449440)	iter_time 0.161693 (0.161693)


 68%|████████████████████████████████████████████████████████████████████████████████████████████▍                                           | 204/300 [06:31<03:04,  1.92s/it]

Epoch 203/100	val_acc 78.36%
Epoch 204/100	It 0/40	loss 0.531314 (0.531314)	iter_time 0.180834 (0.180834)


 68%|████████████████████████████████████████████████████████████████████████████████████████████▉                                           | 205/300 [06:33<03:02,  1.92s/it]

Epoch 204/100	val_acc 78.35%
Epoch 205/100	It 0/40	loss 0.433238 (0.433238)	iter_time 0.195461 (0.195461)


 69%|█████████████████████████████████████████████████████████████████████████████████████████████▍                                          | 206/300 [06:35<03:01,  1.93s/it]

Epoch 205/100	val_acc 78.45%
Epoch 206/100	It 0/40	loss 0.470499 (0.470499)	iter_time 0.197606 (0.197606)


 69%|█████████████████████████████████████████████████████████████████████████████████████████████▊                                          | 207/300 [06:37<02:59,  1.93s/it]

Epoch 206/100	val_acc 78.4%
Epoch 207/100	It 0/40	loss 0.442632 (0.442632)	iter_time 0.200137 (0.200137)


 69%|██████████████████████████████████████████████████████████████████████████████████████████████▎                                         | 208/300 [06:39<02:57,  1.93s/it]

Epoch 207/100	val_acc 78.45%
Epoch 208/100	It 0/40	loss 0.375014 (0.375014)	iter_time 0.179626 (0.179626)


 70%|██████████████████████████████████████████████████████████████████████████████████████████████▋                                         | 209/300 [06:41<02:55,  1.92s/it]

Epoch 208/100	val_acc 78.41%
Epoch 209/100	It 0/40	loss 0.518472 (0.518472)	iter_time 0.199191 (0.199191)


 70%|███████████████████████████████████████████████████████████████████████████████████████████████▏                                        | 210/300 [06:43<02:54,  1.94s/it]

Epoch 209/100	val_acc 78.49%
Epoch 210/100	It 0/40	loss 0.349212 (0.349212)	iter_time 0.197538 (0.197538)


 70%|███████████████████████████████████████████████████████████████████████████████████████████████▋                                        | 211/300 [06:45<02:51,  1.93s/it]

Epoch 210/100	val_acc 78.47%
Epoch 211/100	It 0/40	loss 0.496263 (0.496263)	iter_time 0.194279 (0.194279)


 71%|████████████████████████████████████████████████████████████████████████████████████████████████                                        | 212/300 [06:46<02:49,  1.93s/it]

Epoch 211/100	val_acc 78.35%
Epoch 212/100	It 0/40	loss 0.516004 (0.516004)	iter_time 0.160806 (0.160806)


 71%|████████████████████████████████████████████████████████████████████████████████████████████████▌                                       | 213/300 [06:48<02:47,  1.92s/it]

Epoch 212/100	val_acc 78.54%
Epoch 213/100	It 0/40	loss 0.489574 (0.489574)	iter_time 0.164445 (0.164445)


 71%|█████████████████████████████████████████████████████████████████████████████████████████████████                                       | 214/300 [06:50<02:45,  1.92s/it]

Epoch 213/100	val_acc 78.42%
Epoch 214/100	It 0/40	loss 0.502414 (0.502414)	iter_time 0.176598 (0.176598)


 72%|█████████████████████████████████████████████████████████████████████████████████████████████████▍                                      | 215/300 [06:52<02:42,  1.92s/it]

Epoch 214/100	val_acc 78.4%
Epoch 215/100	It 0/40	loss 0.413278 (0.413278)	iter_time 0.162287 (0.162287)


 72%|█████████████████████████████████████████████████████████████████████████████████████████████████▉                                      | 216/300 [06:54<02:40,  1.92s/it]

Epoch 215/100	val_acc 78.33%
Epoch 216/100	It 0/40	loss 0.554563 (0.554563)	iter_time 0.168607 (0.168607)


 72%|██████████████████████████████████████████████████████████████████████████████████████████████████▎                                     | 217/300 [06:56<02:39,  1.92s/it]

Epoch 216/100	val_acc 78.41%
Epoch 217/100	It 0/40	loss 0.489160 (0.489160)	iter_time 0.165786 (0.165786)


 73%|██████████████████████████████████████████████████████████████████████████████████████████████████▊                                     | 218/300 [06:58<02:36,  1.91s/it]

Epoch 217/100	val_acc 78.36%
Epoch 218/100	It 0/40	loss 0.350374 (0.350374)	iter_time 0.195748 (0.195748)


 73%|███████████████████████████████████████████████████████████████████████████████████████████████████▎                                    | 219/300 [07:00<02:35,  1.91s/it]

Epoch 218/100	val_acc 78.33%
Epoch 219/100	It 0/40	loss 0.388233 (0.388233)	iter_time 0.167005 (0.167005)


 73%|███████████████████████████████████████████████████████████████████████████████████████████████████▋                                    | 220/300 [07:02<02:32,  1.91s/it]

Epoch 219/100	val_acc 78.47%
Epoch 220/100	It 0/40	loss 0.491535 (0.491535)	iter_time 0.197484 (0.197484)


 74%|████████████████████████████████████████████████████████████████████████████████████████████████████▏                                   | 221/300 [07:04<02:31,  1.91s/it]

Epoch 220/100	val_acc 78.51%
Epoch 221/100	It 0/40	loss 0.475818 (0.475818)	iter_time 0.195669 (0.195669)


 74%|████████████████████████████████████████████████████████████████████████████████████████████████████▋                                   | 222/300 [07:06<02:30,  1.92s/it]

Epoch 221/100	val_acc 78.41%
Epoch 222/100	It 0/40	loss 0.371824 (0.371824)	iter_time 0.197796 (0.197796)


 74%|█████████████████████████████████████████████████████████████████████████████████████████████████████                                   | 223/300 [07:08<02:28,  1.93s/it]

Epoch 222/100	val_acc 78.41%
Epoch 223/100	It 0/40	loss 0.347975 (0.347975)	iter_time 0.163744 (0.163744)


 75%|█████████████████████████████████████████████████████████████████████████████████████████████████████▌                                  | 224/300 [07:09<02:26,  1.93s/it]

Epoch 223/100	val_acc 78.33%
Epoch 224/100	It 0/40	loss 0.321356 (0.321356)	iter_time 0.165751 (0.165751)


 75%|██████████████████████████████████████████████████████████████████████████████████████████████████████                                  | 225/300 [07:11<02:24,  1.93s/it]

Epoch 224/100	val_acc 78.51%
Epoch 225/100	It 0/40	loss 0.475428 (0.475428)	iter_time 0.160250 (0.160250)


 75%|██████████████████████████████████████████████████████████████████████████████████████████████████████▍                                 | 226/300 [07:13<02:22,  1.93s/it]

Epoch 225/100	val_acc 78.51%
Epoch 226/100	It 0/40	loss 0.410671 (0.410671)	iter_time 0.201873 (0.201873)


 76%|██████████████████████████████████████████████████████████████████████████████████████████████████████▉                                 | 227/300 [07:15<02:21,  1.94s/it]

Epoch 226/100	val_acc 78.42%
Epoch 227/100	It 0/40	loss 0.447217 (0.447217)	iter_time 0.195642 (0.195642)


 76%|███████████████████████████████████████████████████████████████████████████████████████████████████████▎                                | 228/300 [07:17<02:19,  1.93s/it]

Epoch 227/100	val_acc 78.27%
Epoch 228/100	It 0/40	loss 0.390107 (0.390107)	iter_time 0.177942 (0.177942)


 76%|███████████████████████████████████████████████████████████████████████████████████████████████████████▊                                | 229/300 [07:19<02:16,  1.92s/it]

Epoch 228/100	val_acc 78.62%
Epoch 229/100	It 0/40	loss 0.475773 (0.475773)	iter_time 0.161024 (0.161024)


 77%|████████████████████████████████████████████████████████████████████████████████████████████████████████▎                               | 230/300 [07:21<02:14,  1.92s/it]

Epoch 229/100	val_acc 78.57%
Epoch 230/100	It 0/40	loss 0.295959 (0.295959)	iter_time 0.159939 (0.159939)


 77%|████████████████████████████████████████████████████████████████████████████████████████████████████████▋                               | 231/300 [07:23<02:11,  1.91s/it]

Epoch 230/100	val_acc 78.49%
Epoch 231/100	It 0/40	loss 0.408905 (0.408905)	iter_time 0.195161 (0.195161)


 77%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▏                              | 232/300 [07:25<02:10,  1.92s/it]

Epoch 231/100	val_acc 78.57%
Epoch 232/100	It 0/40	loss 0.466298 (0.466298)	iter_time 0.195844 (0.195844)


 78%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▋                              | 233/300 [07:27<02:09,  1.93s/it]

Epoch 232/100	val_acc 78.35%
Epoch 233/100	It 0/40	loss 0.482784 (0.482784)	iter_time 0.164679 (0.164679)


 78%|██████████████████████████████████████████████████████████████████████████████████████████████████████████                              | 234/300 [07:29<02:06,  1.92s/it]

Epoch 233/100	val_acc 78.46%
Epoch 234/100	It 0/40	loss 0.452844 (0.452844)	iter_time 0.194729 (0.194729)


 78%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▌                             | 235/300 [07:31<02:04,  1.92s/it]

Epoch 234/100	val_acc 78.5%
Epoch 235/100	It 0/40	loss 0.476294 (0.476294)	iter_time 0.165967 (0.165967)


 79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▉                             | 236/300 [07:33<02:02,  1.92s/it]

Epoch 235/100	val_acc 78.49%
Epoch 236/100	It 0/40	loss 0.336030 (0.336030)	iter_time 0.196309 (0.196309)


 79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▍                            | 237/300 [07:34<02:01,  1.93s/it]

Epoch 236/100	val_acc 78.7%
Epoch 237/100	It 0/40	loss 0.441331 (0.441331)	iter_time 0.169463 (0.169463)


 79%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▉                            | 238/300 [07:36<01:59,  1.93s/it]

Epoch 237/100	val_acc 78.66%
Epoch 238/100	It 0/40	loss 0.532445 (0.532445)	iter_time 0.191345 (0.191345)


 80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                           | 239/300 [07:38<01:57,  1.92s/it]

Epoch 238/100	val_acc 78.56%
Epoch 239/100	It 0/40	loss 0.502483 (0.502483)	iter_time 0.195459 (0.195459)


 80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                           | 240/300 [07:40<01:55,  1.92s/it]

Epoch 239/100	val_acc 78.42%
Epoch 240/100	It 0/40	loss 0.374590 (0.374590)	iter_time 0.199710 (0.199710)


 80%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                          | 241/300 [07:42<01:54,  1.93s/it]

Epoch 240/100	val_acc 78.49%
Epoch 241/100	It 0/40	loss 0.367709 (0.367709)	iter_time 0.188687 (0.188687)


 81%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                          | 242/300 [07:44<01:52,  1.93s/it]

Epoch 241/100	val_acc 78.47%
Epoch 242/100	It 0/40	loss 0.459979 (0.459979)	iter_time 0.185758 (0.185758)


 81%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                         | 243/300 [07:46<01:50,  1.93s/it]

Epoch 242/100	val_acc 78.59%
Epoch 243/100	It 0/40	loss 0.393202 (0.393202)	iter_time 0.193707 (0.193707)


 81%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                         | 244/300 [07:48<01:48,  1.93s/it]

Epoch 243/100	val_acc 78.51%
Epoch 244/100	It 0/40	loss 0.406222 (0.406222)	iter_time 0.164315 (0.164315)


 82%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████                         | 245/300 [07:50<01:45,  1.92s/it]

Epoch 244/100	val_acc 78.38%
Epoch 245/100	It 0/40	loss 0.330685 (0.330685)	iter_time 0.190170 (0.190170)


 82%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                        | 246/300 [07:52<01:43,  1.92s/it]

Epoch 245/100	val_acc 78.59%
Epoch 246/100	It 0/40	loss 0.505635 (0.505635)	iter_time 0.198400 (0.198400)


 82%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                        | 247/300 [07:54<01:41,  1.92s/it]

Epoch 246/100	val_acc 78.56%
Epoch 247/100	It 0/40	loss 0.490566 (0.490566)	iter_time 0.163130 (0.163130)


 83%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                       | 248/300 [07:56<01:39,  1.92s/it]

Epoch 247/100	val_acc 78.59%
Epoch 248/100	It 0/40	loss 0.510514 (0.510514)	iter_time 0.180475 (0.180475)


 83%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                       | 249/300 [07:58<01:37,  1.92s/it]

Epoch 248/100	val_acc 78.46%
Epoch 249/100	It 0/40	loss 0.485024 (0.485024)	iter_time 0.161142 (0.161142)


 83%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                      | 250/300 [07:59<01:35,  1.92s/it]

Epoch 249/100	val_acc 78.6%
Epoch 250/100	It 0/40	loss 0.417922 (0.417922)	iter_time 0.167912 (0.167912)


 84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                      | 251/300 [08:01<01:33,  1.91s/it]

Epoch 250/100	val_acc 78.36%
Epoch 251/100	It 0/40	loss 0.445796 (0.445796)	iter_time 0.164083 (0.164083)


 84%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                     | 252/300 [08:03<01:31,  1.90s/it]

Epoch 251/100	val_acc 78.47%
Epoch 252/100	It 0/40	loss 0.513649 (0.513649)	iter_time 0.180380 (0.180380)


 84%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                     | 253/300 [08:05<01:29,  1.91s/it]

Epoch 252/100	val_acc 78.53%
Epoch 253/100	It 0/40	loss 0.479545 (0.479545)	iter_time 0.160972 (0.160972)


 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                    | 254/300 [08:07<01:27,  1.90s/it]

Epoch 253/100	val_acc 78.44%
Epoch 254/100	It 0/40	loss 0.392522 (0.392522)	iter_time 0.169984 (0.169984)


 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                    | 255/300 [08:09<01:25,  1.90s/it]

Epoch 254/100	val_acc 78.59%
Epoch 255/100	It 0/40	loss 0.518870 (0.518870)	iter_time 0.195132 (0.195132)


 85%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                    | 256/300 [08:11<01:23,  1.91s/it]

Epoch 255/100	val_acc 78.61%
Epoch 256/100	It 0/40	loss 0.475375 (0.475375)	iter_time 0.196680 (0.196680)


 86%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                   | 257/300 [08:13<01:22,  1.92s/it]

Epoch 256/100	val_acc 78.44%
Epoch 257/100	It 0/40	loss 0.467630 (0.467630)	iter_time 0.169675 (0.169675)


 86%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                   | 258/300 [08:15<01:20,  1.92s/it]

Epoch 257/100	val_acc 78.45%
Epoch 258/100	It 0/40	loss 0.418456 (0.418456)	iter_time 0.164023 (0.164023)


 86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                  | 259/300 [08:17<01:18,  1.91s/it]

Epoch 258/100	val_acc 78.4%
Epoch 259/100	It 0/40	loss 0.514753 (0.514753)	iter_time 0.164438 (0.164438)


 87%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                  | 260/300 [08:19<01:16,  1.91s/it]

Epoch 259/100	val_acc 78.46%
Epoch 260/100	It 0/40	loss 0.387234 (0.387234)	iter_time 0.200227 (0.200227)


 87%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                 | 261/300 [08:21<01:15,  1.92s/it]

Epoch 260/100	val_acc 78.65%
Epoch 261/100	It 0/40	loss 0.358511 (0.358511)	iter_time 0.195798 (0.195798)


 87%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                 | 262/300 [08:22<01:12,  1.92s/it]

Epoch 261/100	val_acc 78.56%
Epoch 262/100	It 0/40	loss 0.388047 (0.388047)	iter_time 0.171133 (0.171133)


 88%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                | 263/300 [08:24<01:11,  1.92s/it]

Epoch 262/100	val_acc 78.59%
Epoch 263/100	It 0/40	loss 0.330030 (0.330030)	iter_time 0.165962 (0.165962)


 88%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                | 264/300 [08:26<01:08,  1.91s/it]

Epoch 263/100	val_acc 78.59%
Epoch 264/100	It 0/40	loss 0.485032 (0.485032)	iter_time 0.203363 (0.203363)


 88%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏               | 265/300 [08:28<01:07,  1.92s/it]

Epoch 264/100	val_acc 78.65%
Epoch 265/100	It 0/40	loss 0.394431 (0.394431)	iter_time 0.170178 (0.170178)


 89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌               | 266/300 [08:30<01:05,  1.92s/it]

Epoch 265/100	val_acc 78.56%
Epoch 266/100	It 0/40	loss 0.434888 (0.434888)	iter_time 0.175552 (0.175552)


 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████               | 267/300 [08:32<01:03,  1.92s/it]

Epoch 266/100	val_acc 78.5%
Epoch 267/100	It 0/40	loss 0.441220 (0.441220)	iter_time 0.161936 (0.161936)


 89%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍              | 268/300 [08:34<01:01,  1.92s/it]

Epoch 267/100	val_acc 78.57%
Epoch 268/100	It 0/40	loss 0.605922 (0.605922)	iter_time 0.200134 (0.200134)


 90%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉              | 269/300 [08:36<00:59,  1.93s/it]

Epoch 268/100	val_acc 78.47%
Epoch 269/100	It 0/40	loss 0.423282 (0.423282)	iter_time 0.189328 (0.189328)


 90%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍             | 270/300 [08:38<00:57,  1.92s/it]

Epoch 269/100	val_acc 78.54%
Epoch 270/100	It 0/40	loss 0.440964 (0.440964)	iter_time 0.169123 (0.169123)


 90%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊             | 271/300 [08:40<00:55,  1.92s/it]

Epoch 270/100	val_acc 78.5%
Epoch 271/100	It 0/40	loss 0.598762 (0.598762)	iter_time 0.182680 (0.182680)


 91%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎            | 272/300 [08:42<00:53,  1.92s/it]

Epoch 271/100	val_acc 78.49%
Epoch 272/100	It 0/40	loss 0.445914 (0.445914)	iter_time 0.169240 (0.169240)


 91%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊            | 273/300 [08:44<00:51,  1.92s/it]

Epoch 272/100	val_acc 78.47%
Epoch 273/100	It 0/40	loss 0.452519 (0.452519)	iter_time 0.178741 (0.178741)


 91%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏           | 274/300 [08:45<00:49,  1.92s/it]

Epoch 273/100	val_acc 78.61%
Epoch 274/100	It 0/40	loss 0.507587 (0.507587)	iter_time 0.194490 (0.194490)


 92%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋           | 275/300 [08:47<00:48,  1.93s/it]

Epoch 274/100	val_acc 78.61%
Epoch 275/100	It 0/40	loss 0.498272 (0.498272)	iter_time 0.196247 (0.196247)


 92%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████           | 276/300 [08:49<00:46,  1.93s/it]

Epoch 275/100	val_acc 78.56%
Epoch 276/100	It 0/40	loss 0.494691 (0.494691)	iter_time 0.164703 (0.164703)


 92%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌          | 277/300 [08:51<00:44,  1.92s/it]

Epoch 276/100	val_acc 78.53%
Epoch 277/100	It 0/40	loss 0.596561 (0.596561)	iter_time 0.191740 (0.191740)


 93%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████          | 278/300 [08:53<00:42,  1.93s/it]

Epoch 277/100	val_acc 78.59%
Epoch 278/100	It 0/40	loss 0.388002 (0.388002)	iter_time 0.197738 (0.197738)


 93%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍         | 279/300 [08:55<00:40,  1.92s/it]

Epoch 278/100	val_acc 78.47%
Epoch 279/100	It 0/40	loss 0.438046 (0.438046)	iter_time 0.196969 (0.196969)


 93%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉         | 280/300 [08:57<00:38,  1.93s/it]

Epoch 279/100	val_acc 78.38%
Epoch 280/100	It 0/40	loss 0.447443 (0.447443)	iter_time 0.170430 (0.170430)


 94%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍        | 281/300 [08:59<00:36,  1.92s/it]

Epoch 280/100	val_acc 78.47%
Epoch 281/100	It 0/40	loss 0.530268 (0.530268)	iter_time 0.162121 (0.162121)


 94%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊        | 282/300 [09:01<00:34,  1.92s/it]

Epoch 281/100	val_acc 78.42%
Epoch 282/100	It 0/40	loss 0.597281 (0.597281)	iter_time 0.176183 (0.176183)


 94%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎       | 283/300 [09:03<00:32,  1.92s/it]

Epoch 282/100	val_acc 78.34%
Epoch 283/100	It 0/40	loss 0.474035 (0.474035)	iter_time 0.194766 (0.194766)


 95%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋       | 284/300 [09:05<00:30,  1.93s/it]

Epoch 283/100	val_acc 78.47%
Epoch 284/100	It 0/40	loss 0.415582 (0.415582)	iter_time 0.181913 (0.181913)


 95%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏      | 285/300 [09:07<00:28,  1.92s/it]

Epoch 284/100	val_acc 78.53%
Epoch 285/100	It 0/40	loss 0.483575 (0.483575)	iter_time 0.200302 (0.200302)


 95%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋      | 286/300 [09:09<00:26,  1.92s/it]

Epoch 285/100	val_acc 78.5%
Epoch 286/100	It 0/40	loss 0.531639 (0.531639)	iter_time 0.172313 (0.172313)


 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████      | 287/300 [09:10<00:25,  1.92s/it]

Epoch 286/100	val_acc 78.5%
Epoch 287/100	It 0/40	loss 0.386731 (0.386731)	iter_time 0.166940 (0.166940)


 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌     | 288/300 [09:12<00:22,  1.91s/it]

Epoch 287/100	val_acc 78.45%
Epoch 288/100	It 0/40	loss 0.461550 (0.461550)	iter_time 0.164539 (0.164539)


 96%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████     | 289/300 [09:14<00:21,  1.92s/it]

Epoch 288/100	val_acc 78.33%
Epoch 289/100	It 0/40	loss 0.379210 (0.379210)	iter_time 0.161001 (0.161001)


 97%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍    | 290/300 [09:16<00:19,  1.91s/it]

Epoch 289/100	val_acc 78.62%
Epoch 290/100	It 0/40	loss 0.463907 (0.463907)	iter_time 0.195376 (0.195376)


 97%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉    | 291/300 [09:18<00:17,  1.92s/it]

Epoch 290/100	val_acc 78.66%
Epoch 291/100	It 0/40	loss 0.381830 (0.381830)	iter_time 0.195576 (0.195576)


 97%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎   | 292/300 [09:20<00:15,  1.92s/it]

Epoch 291/100	val_acc 78.54%
Epoch 292/100	It 0/40	loss 0.431647 (0.431647)	iter_time 0.160975 (0.160975)


 98%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊   | 293/300 [09:22<00:13,  1.91s/it]

Epoch 292/100	val_acc 78.51%
Epoch 293/100	It 0/40	loss 0.365600 (0.365600)	iter_time 0.159918 (0.159918)


 98%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎  | 294/300 [09:24<00:11,  1.90s/it]

Epoch 293/100	val_acc 78.55%
Epoch 294/100	It 0/40	loss 0.500999 (0.500999)	iter_time 0.162096 (0.162096)


 98%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋  | 295/300 [09:26<00:09,  1.90s/it]

Epoch 294/100	val_acc 78.54%
Epoch 295/100	It 0/40	loss 0.467611 (0.467611)	iter_time 0.197102 (0.197102)


 99%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 296/300 [09:28<00:07,  1.92s/it]

Epoch 295/100	val_acc 78.53%
Epoch 296/100	It 0/40	loss 0.382900 (0.382900)	iter_time 0.187022 (0.187022)


 99%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋ | 297/300 [09:30<00:05,  1.92s/it]

Epoch 296/100	val_acc 78.47%
Epoch 297/100	It 0/40	loss 0.467877 (0.467877)	iter_time 0.199445 (0.199445)


 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ | 298/300 [09:32<00:03,  1.93s/it]

Epoch 297/100	val_acc 78.42%
Epoch 298/100	It 0/40	loss 0.452458 (0.452458)	iter_time 0.170992 (0.170992)


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌| 299/300 [09:33<00:01,  1.93s/it]

Epoch 298/100	val_acc 78.42%
Epoch 299/100	It 0/40	loss 0.560639 (0.560639)	iter_time 0.197676 (0.197676)


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 300/300 [09:35<00:00,  1.92s/it]

Epoch 299/100	val_acc 78.39%
Best validation accuracy 0.787





In [50]:
feats.shape

torch.Size([128, 128])

In [25]:
type(encoder)

encoder.SmallAlexNet