In [1]:
import torch
import torch.nn as nn
from torchvision import datasets, transforms

import matplotlib
import matplotlib.pyplot as plt
import numpy as np

import os, sys, pathlib, random, time, pickle, copy, json
# from tqdm.autonotebook import tqdm
from tqdm import tqdm

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
# os.environ['CUDA_LAUNCH_BLOCKING'] = "1"

In [3]:
# torch.backends.cuda.matmul.allow_tf32 = True
# torch.backends.cudnn.benchmark = True
# torch.backends.cudnn.deterministic = False
# torch.backends.cudnn.allow_tf32 = True

In [4]:
import torch.optim as optim
from torch.utils import data

In [5]:
from transformers_lib import TransformerBlock, \
        Mixer_TransformerBlock_Encoder, \
        PositionalEncoding

In [6]:
class TinyImageNet_Preload(data.Dataset):
#     https://gist.github.com/z-a-f/b862013c0dc2b540cf96a123a6766e54
    
    def __init__(self, root, mode='train', transform=None, preload=False):
        super().__init__()
        self.preload = preload
        dataset = datasets.ImageFolder(
            root=os.path.join(root, mode),
            transform=None
        )
        self.transform = transform
        self.images, self.labels = [], []
        print("Dataset Size:",len(dataset))
        
        if preload:
            for i in tqdm(range(len(dataset))):
                x, y = dataset[i]
                self.images.append(x)
                self.labels.append(y)
                
#         del dataset
        self.dataset = dataset
            
    def _add_channels(img, total_channels=3):
        while len(img.shape) < 3:  # third axis is the channels
            img = np.expand_dims(img, axis=-1)
        while(img.shape[-1]) < 3:
            img = np.concatenate([img, img[:, :, -1:]], axis=-1)
        return img
        
    def __len__(self):
        return len(self.dataset)
    
    def __getitem__(self, idx):
        if self.preload:
            img, lbl = self.images[idx], self.labels[idx]
        else:
            img, lbl = self.dataset[idx]
        return self.transform(img), lbl

# Model

In [7]:
### add randomize patches for clear benefit
class Mixer_ViT_Classifier(nn.Module):
    
    def __init__(self, image_dim:tuple, patch_size:tuple, hidden_channel:int, num_blocks:int, num_classes:int, block_seq_size:int, block_mlp_size:int, forward_expansion:float=2.0, pos_emb=True, dropout:float=0.0, randomize_patch:bool=False):
        super().__init__()
        
        self.img_dim = image_dim ### must contain (C, H, W) or (H, W)
        
        ### find patch dim
        d0 = int(image_dim[-2]/patch_size[0])
        d1 = int(image_dim[-1]/patch_size[1])
        assert d0*patch_size[0]==image_dim[-2], "Image must be divisible into patch size"
        assert d1*patch_size[1]==image_dim[-1], "Image must be divisible into patch size"
        
#         self.d0, self.d1 = d0, d1 ### number of patches in each axis
        __patch_size = patch_size[0]*patch_size[1]*image_dim[0] ## number of channels in each patch
    
        ### find channel dim
        channel_size = d0*d1 ## number of patches
        
        ### after the number of channels are changed
        init_dim = __patch_size
        final_dim = hidden_channel
        self.unfold = nn.Unfold(kernel_size=patch_size, stride=patch_size)
        #### rescale the patches (patch wise image non preserving transform, unlike bilinear interpolation)
        self.channel_change = nn.Linear(init_dim, final_dim)
        print(f"ViT Mixer : Channels per patch -> Initial:{init_dim} Final:{final_dim}")
        
        
        self.channel_dim = final_dim
        self.patch_dim = channel_size
        
        self.transformer_blocks = []
        
        f = self.get_factors(self.channel_dim)
        print(f)
        fi = np.abs(np.array(f) - np.sqrt(self.channel_dim)).argmin()
        
        _n_heads = f[fi]
        
        ## number of dims per channel -> channel_dim
#         print('Num patches:', self.patch_dim)
        print(f'Sequence len: {self.patch_dim} ; Block size: {block_seq_size}')
        print('Channel dim:', self.channel_dim, 'num heads:',_n_heads)
            
        
        if block_seq_size is None or block_seq_size<2:
            ### Find the block size for sequence:
            block_seq_size = int(2**np.ceil(np.log2(np.sqrt(self.patch_dim))))
            
        print(f'MLP dim: {self.channel_dim} ; Block size: {block_mlp_size}')

        for i in range(num_blocks):
            L = Mixer_TransformerBlock_Encoder(self.patch_dim, block_seq_size, self.channel_dim, _n_heads, dropout, forward_expansion, nn.GELU, block_mlp_size)
            self.transformer_blocks.append(L)
        self.transformer_blocks = nn.Sequential(*self.transformer_blocks)
        
        self.linear = nn.Linear(self.patch_dim*self.channel_dim, num_classes)
        
        self.positional_encoding = PositionalEncoding(self.channel_dim, dropout=0)
        if not pos_emb:
            self.positional_encoding = nn.Identity()
            
        self.randomize = None
        if randomize_patch is not None:
            self.randomize = torch.randperm(self.patch_dim)
        
        
    def get_factors(self, n):
        facts = []
        for i in range(2, n+1):
            if n%i == 0:
                facts.append(i)
        return facts
    
    def forward(self, x):
        bs = x.shape[0]
        x = self.unfold(x).swapaxes(-1, -2)
        x = self.channel_change(x)
        x = self.positional_encoding(x)
        ## swap position of patches here
        if self.randomize is not None:
            x = x[..., self.randomize, :]
        x = self.transformer_blocks(x)
        x = self.linear(x.view(bs, -1))
        return x

In [8]:
# a = torch.randn(8, 5)
# a

In [9]:
# a[..., torch.randperm(8), :]
# # a.index_select(0, torch.randperm(8))

In [10]:
def experiment_skip(model_name, ep):
    
    filename = f"./output/benchmark/{model_name}_data.json"
    if os.path.exists(filename):
        with open(filename) as f:
            data = json.load(f)
        ## data consists of lists and dicts.
        epochs = data['train_stat'][-1][0]
        if epochs == ep-1:
            return True
    
    return False

In [11]:
def benchmark(dataset:str, patch_size:int, num_layers:int, SEED:int, sparse_att:bool=False, sparse_mlp:bool=False, pos_emb:bool=False, cuda:int=0):
    device = torch.device(f"cuda:{cuda}")
    
    if sparse_att:
        assert num_layers%2 == 0, 'number of blocks on sparse transformer is (x2)/2 hence it must be even'
        num_layers_ = num_layers//2
    else:
        num_layers_ = num_layers
    
    BS = 256
    NC = -1
    EPOCHS = 300
    imsize = (3, 32, 32)
    expansion_dict = {16:1024, 8:256, 4:128, 2:64, 1:64}
    expansion = expansion_dict[patch_size]

    
    torch.manual_seed(SEED)
    np.random.seed(SEED)
    ##### Data Transforms
    if dataset == 'tiny':
        NC = 200
        EPOCHS = 400
        imsize = (3, 64, 64)
        tiny_train = transforms.Compose([
        transforms.RandAugment(),
        transforms.ToTensor(),
        transforms.Normalize(
            mean=[0.5]*3,
            std=[0.2]*3,
            ),
        ])

        tiny_test = transforms.Compose([
            transforms.ToTensor(),
            transforms.Normalize(
                mean=[0.5]*3,
                std=[0.2]*3,
            ),
        ])
        
        train_dataset = TinyImageNet_Preload(root="../../../../../_Datasets/tiny-imagenet-200",
                                     mode='train', transform=tiny_train)
        test_dataset = TinyImageNet_Preload(root="../../../../../_Datasets/tiny-imagenet-200",
                                     mode='val', transform=tiny_test)
        
    elif dataset == 'cifar10':
        NC = 10
        BS = 128
        cifar_train = transforms.Compose([
            transforms.RandomCrop(size=32, padding=4),
            transforms.RandomHorizontalFlip(),
            transforms.ToTensor(),
            transforms.Normalize(
                mean=[0.4914, 0.4822, 0.4465], # mean=[0.5071, 0.4865, 0.4409] for cifar100
                std=[0.2023, 0.1994, 0.2010], # std=[0.2009, 0.1984, 0.2023] for cifar100
            ),
        ])

        cifar_test = transforms.Compose([
            transforms.ToTensor(),
            transforms.Normalize(
                mean=[0.4914, 0.4822, 0.4465], # mean=[0.5071, 0.4865, 0.4409] for cifar100
                std=[0.2023, 0.1994, 0.2010], # std=[0.2009, 0.1984, 0.2023] for cifar100
            ),
        ])

        train_dataset = datasets.CIFAR10(root="../../../../../_Datasets/cifar10/", train=True, download=True, transform=cifar_train)
        test_dataset = datasets.CIFAR10(root="../../../../../_Datasets/cifar10/", train=False, download=True, transform=cifar_test)

    elif dataset == 'cifar100':
        NC = 100
        BS = 128
        cifar_train = transforms.Compose([
            transforms.RandomCrop(size=32, padding=4),
            transforms.RandomHorizontalFlip(),
            transforms.ToTensor(),
            transforms.Normalize(
                mean=[0.5071, 0.4865, 0.4409],
                std=[0.2009, 0.1984, 0.2023],
            ),
        ])

        cifar_test = transforms.Compose([
            transforms.ToTensor(),
            transforms.Normalize(
                mean=[0.5071, 0.4865, 0.4409],
                std=[0.2009, 0.1984, 0.2023],
            ),
        ])

        train_dataset = datasets.CIFAR100(root="../../../../../_Datasets/cifar100/", train=True, download=True, transform=cifar_train)
        test_dataset = datasets.CIFAR100(root="../../../../../_Datasets/cifar100/", train=False, download=True, transform=cifar_test)
        
    ##### Now create data loaders
    train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=BS, shuffle=True, num_workers=4)
    test_loader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=BS, shuffle=False, num_workers=4)
    
    ### Now create models
    
    seq_len = (imsize[-1]*imsize[-2])//(patch_size*patch_size)
    mlp_dim = expansion
    print(seq_len, mlp_dim)
    
    if sparse_att:
        seq_len = int(2**np.ceil(np.log2(np.sqrt(seq_len))))
    if sparse_mlp:
        mlp_dim = int(2**np.ceil(np.log2(np.sqrt(expansion))))
    
    
    torch.manual_seed(SEED)
    model = Mixer_ViT_Classifier(imsize, 
                                 patch_size=[patch_size]*2, 
                                 hidden_channel=expansion, 
                                 num_blocks=num_layers_, 
                                 num_classes=NC, 
                                 block_seq_size=seq_len, 
                                 block_mlp_size=mlp_dim,
                                 pos_emb=pos_emb, randomize_patch=True).to(device)
    
#     _x = torch.randn(BS, *imsize).to(device)
#     print("Output: ",vit_mixer(_x).shape)
    num_params = sum(p.numel() for p in model.parameters())
    print("number of params: ", num_params)
    
    _a, _b, _c = 'att', 'mlp', 'nPE'
    if sparse_att: _a = 'sAtt'
    if sparse_mlp: _b = 'sMlp'
    if pos_emb: _c = 'PE'
    model_name = f'01.3_ViT_{_c}_{dataset}_patch{patch_size}_l{num_layers}_{_a}_{_b}_s{SEED}_rand'
    print(f"Model Name: {model_name}")
    
    if experiment_skip(model_name, EPOCHS):
        print(f'EXPERIMENT DONE... SKIPPING : {model_name}')
        return
    
    
    criterion = nn.CrossEntropyLoss()
    optimizer = torch.optim.Adam(model.parameters(), lr=0.0001)
    scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=EPOCHS)

    STAT ={'train_stat':[], 'test_stat':[], 'params':num_params, }

    ## Following is copied from 
    ### https://github.com/kuangliu/pytorch-cifar/blob/master/main.py

    # Training
    def train(epoch):
        model.train()
        train_loss = 0
        correct = 0
        total = 0

        for batch_idx, (inputs, targets) in enumerate(tqdm(train_loader)):
            inputs, targets = inputs.to(device), targets.to(device)
            optimizer.zero_grad()
            outputs = model(inputs)
            loss = criterion(outputs, targets)
            loss.backward()
            optimizer.step()

            train_loss += loss.item()
            _, predicted = outputs.max(1)
            total += targets.size(0)
            correct += predicted.eq(targets).sum().item()
#             break

        STAT['train_stat'].append((epoch, train_loss/(batch_idx+1), 100.*correct/total)) ### (Epochs, Loss, Acc)
        print(f"[Train] {epoch} Loss: {train_loss/(batch_idx+1):.3f} | Acc: {100.*correct/total:.3f} {correct}/{total}")
        return

    global best_acc
    best_acc = -1
    def test(epoch):
        global best_acc
        model.eval()
        test_loss = 0
        correct = 0
        total = 0
        time_taken = []
        with torch.no_grad():
            for batch_idx, (inputs, targets) in enumerate(tqdm(test_loader)):
                inputs, targets = inputs.to(device), targets.to(device)

                start = time.time()

                outputs = model(inputs)

                start = time.time()-start
                time_taken.append(start)

                loss = criterion(outputs, targets)

                test_loss += loss.item()
                _, predicted = outputs.max(1)
                total += targets.size(0)
                correct += predicted.eq(targets).sum().item()

        STAT['test_stat'].append((epoch, test_loss/(batch_idx+1), 100.*correct/total, np.mean(time_taken))) ### (Epochs, Loss, Acc, time)
        print(f"[Test] {epoch} Loss: {test_loss/(batch_idx+1):.3f} | Acc: {100.*correct/total:.3f} {correct}/{total}")

        # Save checkpoint.
        acc = 100.*correct/total
        if acc > best_acc:
            print('Saving..')
            state = {
                'model': model.state_dict(),
                'acc': acc,
                'epoch': epoch
            }
            if not os.path.isdir('models'):
                os.mkdir('models')
            torch.save(state, f'./models/benchmark/{model_name}.pth')
            best_acc = acc

        with open(f"./output/benchmark/{model_name}_data.json", 'w') as f:
            json.dump(STAT, f, indent=0)

    ### Train the whole damn thing
#     EPOCHS = 1
    for epoch in range(0, EPOCHS):
        train(epoch)
        test(epoch)
        scheduler.step()
        
    
    train_stat = np.array(STAT['train_stat'])
    test_stat = np.array(STAT['test_stat'])

    plt.plot(train_stat[:,1], label='train')
    plt.plot(test_stat[:,1], label='test')
    plt.ylabel("Loss")
    plt.legend()
    plt.savefig(f"./output/benchmark/plots/{model_name}_loss.svg")
    plt.show()

    plt.plot(train_stat[:,2], label='train')
    plt.plot(test_stat[:,2], label='test')
    plt.ylabel("Accuracy")
    plt.legend()
    plt.savefig(f"./output/benchmark/plots/{model_name}_accs.svg")
    plt.show()
    
    del model, optimizer
    return

In [12]:
# benchmark(dataset='tiny', 
#           patch_size=4, num_layers=10, SEED=123, sparse_att=True, sparse_mlp=True, cuda=0
#          )

In [13]:
# ### Automate the benchmark
# ###### for tiny
# cuda_idx = 0
# # for seed in [147, 258, 369]:
# for seed in [147]:
#     for patch_size in [16, 8, 4]:
#         for sparse_attention in [False, True]:
#             for sparse_mlp in [False, True]:
# #                 for nlayers in [6, 10, 14]:
#                 for nlayers in [6]:
#                     print(f'''
#                         Experimenting on Tiny Dataset 
#                         patch:{patch_size},
#                         sparse_att: {sparse_attention},
#                         sparse_mlp: {sparse_mlp},
#                         num_layers : {nlayers},
#                         seed: {seed}
#                     ''')
            
#                     benchmark(dataset='tiny', 
#                               patch_size=patch_size, 
#                               num_layers=nlayers, 
#                               SEED=seed, 
#                               sparse_att=sparse_attention, sparse_mlp=sparse_mlp, 
#                               cuda=cuda_idx
#                              )


In [14]:
# ### Automate the benchmark
# ###### for tiny

# not_working = [
#     (4, False, True, 6),
#     (4, False, False, 10),
#     (4, False, False, 14),
#     (4, False, True, 10),
#     (4, False, True, 14),
#     (4, True, True, 14),
# ]

# cuda_idx = 0
# # for seed in [147, 258, 369]:
# for seed in [147]:
#     for patch_size in [16, 8, 4]:
#         for sparse_attention in [False, True]:
#             for sparse_mlp in [False, True]:
#                 for nlayers in [6, 10, 14]:

#                     print(f'''
#                         Experimenting on Tiny Dataset 
#                         patch:{patch_size},
#                         sparse_att: {sparse_attention},
#                         sparse_mlp: {sparse_mlp},
#                         num_layers : {nlayers},
#                         seed: {seed}
#                     ''')
            
#                 ### check if config is in not_working case
#                     exit = False
#                     for nw in not_working:
#                         if patch_size==nw[0] and \
#                             sparse_attention==nw[1] and \
#                             sparse_mlp==nw[2] and\
#                             nlayers==nw[3]:
                            
#                             exit=True
#                             break
#                     if exit:
#                         print(f'Exiting as the config is in NOT WORKING')
#                         continue


#                     benchmark(dataset='tiny', 
#                               patch_size=patch_size, 
#                               num_layers=nlayers, 
#                               SEED=seed, 
#                               sparse_att=sparse_attention, sparse_mlp=sparse_mlp, 
#                               cuda=cuda_idx
#                              )


In [15]:
### Automate the benchmark
###### for c10 / c100

not_working = [
#     (1, False, False, 4),
#     (1, False, False, 8),
#     (1, False, False, 12),
#     (1, False, True, 4),
#     (1, False, True, 8),
#     (1, False, True, 12),

#     (1, True, False, 12),
#     (1, True, True, 12),
]

cuda_idx = 1
# for dataset in ['cifar10']:
#     for seed in [147]:
#         for nlayers in [4, 8]:
#             for patch_size in [4]:

for dataset, nlayers, patch_size in [('cifar10', 4, 4), ('cifar10', 8, 4), ('cifar100', 4, 4), ('cifar100', 4, 2), ]:
    for _ in [1]:
        for _ in [1]:
            for seed in [147]:
                
#             for patch_size in [8, 4, 2, 1]:
                for sparse_attention in [True]:
                    for sparse_mlp in [False]:
                        for PE in [False]:

                            print(f'''
                                Experimenting on {dataset} Dataset 
                                patch:{patch_size},
                                sparse_att: {sparse_attention},
                                sparse_mlp: {sparse_mlp},
                                num_layers: {nlayers},
                                pos_embed: {PE},
                                seed: {seed}
                            ''')

                        ### check if config is in not_working case
                            exit = False
                            for nw in not_working:
                                if patch_size==nw[0] and \
                                    sparse_attention==nw[1] and \
                                    sparse_mlp==nw[2] and\
                                    nlayers==nw[3]:

                                    exit=True
                                    break
                            if exit:
                                print(f'Exiting as the config is in NOT WORKING')
                                continue


                            benchmark(dataset=dataset, 
                                      patch_size=patch_size, 
                                      num_layers=nlayers, 
                                      SEED=seed, 
                                      sparse_att=sparse_attention, sparse_mlp=sparse_mlp, 
                                      pos_emb=PE,
                                      cuda=cuda_idx
                                     )


                                Experimenting on cifar10 Dataset 
                                patch:4,
                                sparse_att: True,
                                sparse_mlp: False,
                                num_layers: 4,
                                pos_embed: False,
                                seed: 147
                            
Files already downloaded and verified
Files already downloaded and verified
64 128
ViT Mixer : Channels per patch -> Initial:48 Final:128
[2, 4, 8, 16, 32, 64, 128]
Sequence len: 64 ; Block size: 8
Channel dim: 128 num heads: 8
MLP dim: 128 ; Block size: 128
number of params:  618122
Model Name: 01.3_ViT_nPE_cifar10_patch4_l4_sAtt_mlp_s147_rand


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.90it/s]


[Train] 0 Loss: 1.768 | Acc: 36.244 18122/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 91.23it/s]


[Test] 0 Loss: 1.535 | Acc: 45.070 4507/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:12<00:00, 30.12it/s]


[Train] 1 Loss: 1.506 | Acc: 45.474 22737/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.67it/s]


[Test] 1 Loss: 1.372 | Acc: 50.480 5048/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.97it/s]


[Train] 2 Loss: 1.405 | Acc: 49.644 24822/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 81.95it/s]


[Test] 2 Loss: 1.279 | Acc: 54.040 5404/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.43it/s]


[Train] 3 Loss: 1.328 | Acc: 52.204 26102/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.52it/s]


[Test] 3 Loss: 1.203 | Acc: 57.440 5744/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.76it/s]


[Train] 4 Loss: 1.255 | Acc: 55.136 27568/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.48it/s]


[Test] 4 Loss: 1.150 | Acc: 59.210 5921/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.97it/s]


[Train] 5 Loss: 1.201 | Acc: 57.126 28563/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.87it/s]


[Test] 5 Loss: 1.115 | Acc: 60.300 6030/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.88it/s]


[Train] 6 Loss: 1.152 | Acc: 58.680 29340/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 84.85it/s]


[Test] 6 Loss: 1.053 | Acc: 63.010 6301/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.87it/s]


[Train] 7 Loss: 1.114 | Acc: 60.684 30342/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.95it/s]


[Test] 7 Loss: 1.035 | Acc: 63.970 6397/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.87it/s]


[Train] 8 Loss: 1.077 | Acc: 61.664 30832/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.14it/s]


[Test] 8 Loss: 1.001 | Acc: 64.600 6460/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.70it/s]


[Train] 9 Loss: 1.048 | Acc: 62.806 31403/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.33it/s]


[Test] 9 Loss: 0.963 | Acc: 66.070 6607/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.55it/s]


[Train] 10 Loss: 1.026 | Acc: 63.842 31921/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 84.60it/s]


[Test] 10 Loss: 0.965 | Acc: 66.470 6647/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.61it/s]


[Train] 11 Loss: 1.004 | Acc: 64.316 32158/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.01it/s]


[Test] 11 Loss: 0.930 | Acc: 67.660 6766/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.36it/s]


[Train] 12 Loss: 0.986 | Acc: 65.252 32626/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.15it/s]


[Test] 12 Loss: 0.934 | Acc: 67.360 6736/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.48it/s]


[Train] 13 Loss: 0.962 | Acc: 65.868 32934/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.86it/s]


[Test] 13 Loss: 0.926 | Acc: 67.780 6778/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.54it/s]


[Train] 14 Loss: 0.951 | Acc: 66.354 33177/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.80it/s]


[Test] 14 Loss: 0.906 | Acc: 67.920 6792/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.63it/s]


[Train] 15 Loss: 0.930 | Acc: 67.142 33571/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.79it/s]


[Test] 15 Loss: 0.886 | Acc: 68.660 6866/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.65it/s]


[Train] 16 Loss: 0.916 | Acc: 67.612 33806/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 89.60it/s]


[Test] 16 Loss: 0.864 | Acc: 70.200 7020/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.51it/s]


[Train] 17 Loss: 0.906 | Acc: 67.848 33924/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.27it/s]


[Test] 17 Loss: 0.865 | Acc: 70.010 7001/10000


100%|███████████████████████████████████████████████████| 391/391 [00:12<00:00, 30.10it/s]


[Train] 18 Loss: 0.893 | Acc: 68.450 34225/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.52it/s]


[Test] 18 Loss: 0.855 | Acc: 70.320 7032/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.78it/s]


[Train] 19 Loss: 0.879 | Acc: 68.940 34470/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.79it/s]


[Test] 19 Loss: 0.848 | Acc: 70.810 7081/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.29it/s]


[Train] 20 Loss: 0.862 | Acc: 69.516 34758/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.01it/s]


[Test] 20 Loss: 0.818 | Acc: 71.830 7183/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.73it/s]


[Train] 21 Loss: 0.855 | Acc: 69.670 34835/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.08it/s]


[Test] 21 Loss: 0.824 | Acc: 71.160 7116/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.51it/s]


[Train] 22 Loss: 0.837 | Acc: 70.544 35272/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.33it/s]


[Test] 22 Loss: 0.817 | Acc: 72.250 7225/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.44it/s]


[Train] 23 Loss: 0.839 | Acc: 70.262 35131/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.81it/s]


[Test] 23 Loss: 0.805 | Acc: 72.190 7219/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.78it/s]


[Train] 24 Loss: 0.822 | Acc: 70.890 35445/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.13it/s]


[Test] 24 Loss: 0.793 | Acc: 72.960 7296/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.79it/s]


[Train] 25 Loss: 0.816 | Acc: 70.964 35482/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.29it/s]


[Test] 25 Loss: 0.788 | Acc: 73.180 7318/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.57it/s]


[Train] 26 Loss: 0.805 | Acc: 71.490 35745/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.37it/s]


[Test] 26 Loss: 0.773 | Acc: 73.350 7335/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.50it/s]


[Train] 27 Loss: 0.796 | Acc: 71.954 35977/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.92it/s]


[Test] 27 Loss: 0.786 | Acc: 73.110 7311/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.50it/s]


[Train] 28 Loss: 0.788 | Acc: 72.446 36223/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.05it/s]


[Test] 28 Loss: 0.779 | Acc: 73.560 7356/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 30.00it/s]


[Train] 29 Loss: 0.783 | Acc: 72.532 36266/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.58it/s]


[Test] 29 Loss: 0.769 | Acc: 73.440 7344/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.82it/s]


[Train] 30 Loss: 0.773 | Acc: 72.596 36298/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.87it/s]


[Test] 30 Loss: 0.758 | Acc: 73.360 7336/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.45it/s]


[Train] 31 Loss: 0.771 | Acc: 73.016 36508/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.70it/s]


[Test] 31 Loss: 0.753 | Acc: 74.290 7429/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.13it/s]


[Train] 32 Loss: 0.763 | Acc: 73.064 36532/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 84.68it/s]


[Test] 32 Loss: 0.742 | Acc: 74.500 7450/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.69it/s]


[Train] 33 Loss: 0.762 | Acc: 73.214 36607/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.13it/s]


[Test] 33 Loss: 0.740 | Acc: 74.340 7434/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.13it/s]


[Train] 34 Loss: 0.751 | Acc: 73.524 36762/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.09it/s]


[Test] 34 Loss: 0.746 | Acc: 74.160 7416/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.44it/s]


[Train] 35 Loss: 0.747 | Acc: 73.728 36864/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.03it/s]


[Test] 35 Loss: 0.729 | Acc: 74.910 7491/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.63it/s]


[Train] 36 Loss: 0.731 | Acc: 74.094 37047/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.98it/s]


[Test] 36 Loss: 0.729 | Acc: 75.020 7502/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.51it/s]


[Train] 37 Loss: 0.739 | Acc: 73.848 36924/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.20it/s]


[Test] 37 Loss: 0.738 | Acc: 75.120 7512/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.64it/s]


[Train] 38 Loss: 0.727 | Acc: 74.518 37259/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.07it/s]


[Test] 38 Loss: 0.723 | Acc: 75.670 7567/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.67it/s]


[Train] 39 Loss: 0.721 | Acc: 74.812 37406/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.65it/s]


[Test] 39 Loss: 0.719 | Acc: 75.200 7520/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.64it/s]


[Train] 40 Loss: 0.711 | Acc: 74.876 37438/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.06it/s]


[Test] 40 Loss: 0.727 | Acc: 75.530 7553/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.79it/s]


[Train] 41 Loss: 0.706 | Acc: 74.964 37482/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.48it/s]


[Test] 41 Loss: 0.703 | Acc: 75.670 7567/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.91it/s]


[Train] 42 Loss: 0.705 | Acc: 74.992 37496/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.97it/s]


[Test] 42 Loss: 0.706 | Acc: 75.590 7559/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.47it/s]


[Train] 43 Loss: 0.698 | Acc: 75.520 37760/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.82it/s]


[Test] 43 Loss: 0.705 | Acc: 75.610 7561/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.71it/s]


[Train] 44 Loss: 0.699 | Acc: 75.328 37664/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 83.48it/s]


[Test] 44 Loss: 0.703 | Acc: 75.900 7590/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.71it/s]


[Train] 45 Loss: 0.693 | Acc: 75.468 37734/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.95it/s]


[Test] 45 Loss: 0.713 | Acc: 75.330 7533/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.66it/s]


[Train] 46 Loss: 0.689 | Acc: 76.008 38004/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.76it/s]


[Test] 46 Loss: 0.708 | Acc: 75.600 7560/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.23it/s]


[Train] 47 Loss: 0.681 | Acc: 76.112 38056/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.99it/s]


[Test] 47 Loss: 0.706 | Acc: 76.470 7647/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.91it/s]


[Train] 48 Loss: 0.673 | Acc: 76.190 38095/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.23it/s]


[Test] 48 Loss: 0.716 | Acc: 75.750 7575/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.87it/s]


[Train] 49 Loss: 0.679 | Acc: 76.230 38115/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.28it/s]


[Test] 49 Loss: 0.696 | Acc: 76.300 7630/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.57it/s]


[Train] 50 Loss: 0.667 | Acc: 76.440 38220/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.41it/s]


[Test] 50 Loss: 0.687 | Acc: 76.910 7691/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.49it/s]


[Train] 51 Loss: 0.667 | Acc: 76.582 38291/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.57it/s]


[Test] 51 Loss: 0.691 | Acc: 76.710 7671/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.78it/s]


[Train] 52 Loss: 0.662 | Acc: 76.688 38344/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.37it/s]


[Test] 52 Loss: 0.700 | Acc: 76.350 7635/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.33it/s]


[Train] 53 Loss: 0.655 | Acc: 76.918 38459/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.34it/s]


[Test] 53 Loss: 0.683 | Acc: 76.740 7674/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.72it/s]


[Train] 54 Loss: 0.656 | Acc: 76.870 38435/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.50it/s]


[Test] 54 Loss: 0.699 | Acc: 76.780 7678/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.77it/s]


[Train] 55 Loss: 0.650 | Acc: 76.940 38470/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.52it/s]


[Test] 55 Loss: 0.683 | Acc: 77.000 7700/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.21it/s]


[Train] 56 Loss: 0.644 | Acc: 77.204 38602/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.85it/s]


[Test] 56 Loss: 0.675 | Acc: 76.950 7695/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.53it/s]


[Train] 57 Loss: 0.639 | Acc: 77.282 38641/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.68it/s]


[Test] 57 Loss: 0.672 | Acc: 77.310 7731/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.48it/s]


[Train] 58 Loss: 0.644 | Acc: 77.314 38657/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 84.29it/s]


[Test] 58 Loss: 0.675 | Acc: 77.070 7707/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.31it/s]


[Train] 59 Loss: 0.631 | Acc: 77.670 38835/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.75it/s]


[Test] 59 Loss: 0.681 | Acc: 76.800 7680/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.55it/s]


[Train] 60 Loss: 0.627 | Acc: 77.950 38975/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.26it/s]


[Test] 60 Loss: 0.668 | Acc: 77.420 7742/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.56it/s]


[Train] 61 Loss: 0.624 | Acc: 78.150 39075/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.74it/s]


[Test] 61 Loss: 0.676 | Acc: 77.240 7724/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.19it/s]


[Train] 62 Loss: 0.625 | Acc: 77.930 38965/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 89.37it/s]


[Test] 62 Loss: 0.669 | Acc: 77.550 7755/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.74it/s]


[Train] 63 Loss: 0.620 | Acc: 78.050 39025/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.53it/s]


[Test] 63 Loss: 0.673 | Acc: 77.370 7737/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.55it/s]


[Train] 64 Loss: 0.620 | Acc: 77.990 38995/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.32it/s]


[Test] 64 Loss: 0.663 | Acc: 77.390 7739/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.85it/s]


[Train] 65 Loss: 0.612 | Acc: 78.374 39187/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 84.70it/s]


[Test] 65 Loss: 0.660 | Acc: 77.790 7779/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.40it/s]


[Train] 66 Loss: 0.609 | Acc: 78.548 39274/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.18it/s]


[Test] 66 Loss: 0.665 | Acc: 77.550 7755/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.52it/s]


[Train] 67 Loss: 0.604 | Acc: 78.556 39278/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.03it/s]


[Test] 67 Loss: 0.656 | Acc: 77.740 7774/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.83it/s]


[Train] 68 Loss: 0.605 | Acc: 78.752 39376/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 82.77it/s]


[Test] 68 Loss: 0.658 | Acc: 78.040 7804/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.38it/s]


[Train] 69 Loss: 0.595 | Acc: 78.844 39422/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 89.77it/s]


[Test] 69 Loss: 0.656 | Acc: 77.940 7794/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.21it/s]


[Train] 70 Loss: 0.599 | Acc: 78.858 39429/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.08it/s]


[Test] 70 Loss: 0.659 | Acc: 78.030 7803/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.27it/s]


[Train] 71 Loss: 0.592 | Acc: 78.984 39492/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.06it/s]


[Test] 71 Loss: 0.657 | Acc: 77.860 7786/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.63it/s]


[Train] 72 Loss: 0.589 | Acc: 79.134 39567/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 84.61it/s]


[Test] 72 Loss: 0.645 | Acc: 78.330 7833/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.43it/s]


[Train] 73 Loss: 0.583 | Acc: 79.462 39731/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.23it/s]


[Test] 73 Loss: 0.656 | Acc: 78.010 7801/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.58it/s]


[Train] 74 Loss: 0.581 | Acc: 79.312 39656/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.54it/s]


[Test] 74 Loss: 0.655 | Acc: 78.140 7814/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.59it/s]


[Train] 75 Loss: 0.580 | Acc: 79.390 39695/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.58it/s]


[Test] 75 Loss: 0.661 | Acc: 77.790 7779/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.68it/s]


[Train] 76 Loss: 0.574 | Acc: 79.712 39856/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.44it/s]


[Test] 76 Loss: 0.651 | Acc: 78.030 7803/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.69it/s]


[Train] 77 Loss: 0.577 | Acc: 79.624 39812/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.00it/s]


[Test] 77 Loss: 0.649 | Acc: 78.190 7819/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.77it/s]


[Train] 78 Loss: 0.568 | Acc: 80.000 40000/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.75it/s]


[Test] 78 Loss: 0.646 | Acc: 78.270 7827/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.52it/s]


[Train] 79 Loss: 0.566 | Acc: 80.028 40014/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.13it/s]


[Test] 79 Loss: 0.641 | Acc: 78.410 7841/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.57it/s]


[Train] 80 Loss: 0.569 | Acc: 79.712 39856/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.96it/s]


[Test] 80 Loss: 0.649 | Acc: 78.160 7816/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.38it/s]


[Train] 81 Loss: 0.565 | Acc: 80.080 40040/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.85it/s]


[Test] 81 Loss: 0.654 | Acc: 77.960 7796/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.51it/s]


[Train] 82 Loss: 0.561 | Acc: 80.154 40077/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.89it/s]


[Test] 82 Loss: 0.639 | Acc: 78.550 7855/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.68it/s]


[Train] 83 Loss: 0.562 | Acc: 80.084 40042/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.69it/s]


[Test] 83 Loss: 0.632 | Acc: 78.760 7876/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.45it/s]


[Train] 84 Loss: 0.558 | Acc: 80.296 40148/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.50it/s]


[Test] 84 Loss: 0.645 | Acc: 78.120 7812/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.89it/s]


[Train] 85 Loss: 0.549 | Acc: 80.614 40307/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.63it/s]


[Test] 85 Loss: 0.643 | Acc: 78.350 7835/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.45it/s]


[Train] 86 Loss: 0.549 | Acc: 80.486 40243/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.40it/s]


[Test] 86 Loss: 0.654 | Acc: 78.480 7848/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.39it/s]


[Train] 87 Loss: 0.550 | Acc: 80.552 40276/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.74it/s]


[Test] 87 Loss: 0.627 | Acc: 78.850 7885/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.16it/s]


[Train] 88 Loss: 0.548 | Acc: 80.738 40369/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.12it/s]


[Test] 88 Loss: 0.630 | Acc: 79.000 7900/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.49it/s]


[Train] 89 Loss: 0.547 | Acc: 80.550 40275/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.94it/s]


[Test] 89 Loss: 0.634 | Acc: 78.830 7883/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.43it/s]


[Train] 90 Loss: 0.538 | Acc: 80.964 40482/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.65it/s]


[Test] 90 Loss: 0.633 | Acc: 78.900 7890/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.51it/s]


[Train] 91 Loss: 0.542 | Acc: 80.832 40416/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.10it/s]


[Test] 91 Loss: 0.636 | Acc: 78.960 7896/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.55it/s]


[Train] 92 Loss: 0.535 | Acc: 81.090 40545/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.54it/s]


[Test] 92 Loss: 0.627 | Acc: 79.230 7923/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.63it/s]


[Train] 93 Loss: 0.538 | Acc: 80.842 40421/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.96it/s]


[Test] 93 Loss: 0.647 | Acc: 78.490 7849/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.55it/s]


[Train] 94 Loss: 0.530 | Acc: 81.062 40531/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.39it/s]


[Test] 94 Loss: 0.626 | Acc: 79.060 7906/10000


100%|███████████████████████████████████████████████████| 391/391 [00:12<00:00, 30.09it/s]


[Train] 95 Loss: 0.529 | Acc: 81.320 40660/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.27it/s]


[Test] 95 Loss: 0.627 | Acc: 78.980 7898/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.62it/s]


[Train] 96 Loss: 0.523 | Acc: 81.530 40765/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.12it/s]


[Test] 96 Loss: 0.636 | Acc: 78.930 7893/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.67it/s]


[Train] 97 Loss: 0.521 | Acc: 81.424 40712/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.08it/s]


[Test] 97 Loss: 0.625 | Acc: 79.250 7925/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.59it/s]


[Train] 98 Loss: 0.520 | Acc: 81.504 40752/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.31it/s]


[Test] 98 Loss: 0.619 | Acc: 79.460 7946/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.46it/s]


[Train] 99 Loss: 0.521 | Acc: 81.736 40868/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 89.63it/s]


[Test] 99 Loss: 0.626 | Acc: 79.390 7939/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.62it/s]


[Train] 100 Loss: 0.517 | Acc: 81.662 40831/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.60it/s]


[Test] 100 Loss: 0.622 | Acc: 79.100 7910/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.65it/s]


[Train] 101 Loss: 0.514 | Acc: 81.714 40857/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 84.33it/s]


[Test] 101 Loss: 0.624 | Acc: 79.130 7913/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.77it/s]


[Train] 102 Loss: 0.512 | Acc: 81.738 40869/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.52it/s]


[Test] 102 Loss: 0.624 | Acc: 79.450 7945/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.27it/s]


[Train] 103 Loss: 0.511 | Acc: 81.792 40896/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.26it/s]


[Test] 103 Loss: 0.623 | Acc: 79.140 7914/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.62it/s]


[Train] 104 Loss: 0.511 | Acc: 81.872 40936/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.78it/s]


[Test] 104 Loss: 0.632 | Acc: 79.010 7901/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.66it/s]


[Train] 105 Loss: 0.506 | Acc: 82.074 41037/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.51it/s]


[Test] 105 Loss: 0.613 | Acc: 79.290 7929/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.53it/s]


[Train] 106 Loss: 0.502 | Acc: 82.200 41100/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.99it/s]


[Test] 106 Loss: 0.613 | Acc: 79.460 7946/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.48it/s]


[Train] 107 Loss: 0.502 | Acc: 82.220 41110/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.89it/s]


[Test] 107 Loss: 0.618 | Acc: 79.450 7945/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.80it/s]


[Train] 108 Loss: 0.498 | Acc: 82.292 41146/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.72it/s]


[Test] 108 Loss: 0.616 | Acc: 79.680 7968/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.54it/s]


[Train] 109 Loss: 0.498 | Acc: 82.426 41213/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 84.62it/s]


[Test] 109 Loss: 0.615 | Acc: 79.970 7997/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.57it/s]


[Train] 110 Loss: 0.494 | Acc: 82.710 41355/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.12it/s]


[Test] 110 Loss: 0.621 | Acc: 79.680 7968/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.39it/s]


[Train] 111 Loss: 0.493 | Acc: 82.576 41288/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.12it/s]


[Test] 111 Loss: 0.626 | Acc: 79.380 7938/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.46it/s]


[Train] 112 Loss: 0.486 | Acc: 82.614 41307/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.26it/s]


[Test] 112 Loss: 0.614 | Acc: 79.860 7986/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.39it/s]


[Train] 113 Loss: 0.490 | Acc: 82.520 41260/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.99it/s]


[Test] 113 Loss: 0.612 | Acc: 79.930 7993/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.52it/s]


[Train] 114 Loss: 0.491 | Acc: 82.532 41266/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.01it/s]


[Test] 114 Loss: 0.628 | Acc: 79.140 7914/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.60it/s]


[Train] 115 Loss: 0.487 | Acc: 82.774 41387/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.02it/s]


[Test] 115 Loss: 0.621 | Acc: 79.720 7972/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.66it/s]


[Train] 116 Loss: 0.478 | Acc: 83.032 41516/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.18it/s]


[Test] 116 Loss: 0.611 | Acc: 79.710 7971/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.34it/s]


[Train] 117 Loss: 0.484 | Acc: 82.802 41401/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 83.98it/s]


[Test] 117 Loss: 0.606 | Acc: 79.800 7980/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.52it/s]


[Train] 118 Loss: 0.479 | Acc: 82.994 41497/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.40it/s]


[Test] 118 Loss: 0.609 | Acc: 79.900 7990/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.39it/s]


[Train] 119 Loss: 0.479 | Acc: 83.108 41554/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.72it/s]


[Test] 119 Loss: 0.603 | Acc: 80.030 8003/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.61it/s]


[Train] 120 Loss: 0.473 | Acc: 83.074 41537/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.16it/s]


[Test] 120 Loss: 0.612 | Acc: 80.010 8001/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.58it/s]


[Train] 121 Loss: 0.476 | Acc: 83.132 41566/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.75it/s]


[Test] 121 Loss: 0.617 | Acc: 79.620 7962/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.41it/s]


[Train] 122 Loss: 0.471 | Acc: 83.178 41589/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.66it/s]


[Test] 122 Loss: 0.613 | Acc: 79.900 7990/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.42it/s]


[Train] 123 Loss: 0.469 | Acc: 83.206 41603/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 84.93it/s]


[Test] 123 Loss: 0.613 | Acc: 79.840 7984/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.48it/s]


[Train] 124 Loss: 0.468 | Acc: 83.376 41688/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.58it/s]


[Test] 124 Loss: 0.614 | Acc: 79.710 7971/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.52it/s]


[Train] 125 Loss: 0.466 | Acc: 83.354 41677/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.28it/s]


[Test] 125 Loss: 0.622 | Acc: 79.510 7951/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.43it/s]


[Train] 126 Loss: 0.462 | Acc: 83.520 41760/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.28it/s]


[Test] 126 Loss: 0.615 | Acc: 80.110 8011/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.66it/s]


[Train] 127 Loss: 0.463 | Acc: 83.508 41754/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.72it/s]


[Test] 127 Loss: 0.609 | Acc: 80.270 8027/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.42it/s]


[Train] 128 Loss: 0.462 | Acc: 83.592 41796/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.08it/s]


[Test] 128 Loss: 0.606 | Acc: 80.070 8007/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.66it/s]


[Train] 129 Loss: 0.457 | Acc: 83.896 41948/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.44it/s]


[Test] 129 Loss: 0.624 | Acc: 79.730 7973/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.61it/s]


[Train] 130 Loss: 0.456 | Acc: 83.784 41892/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.16it/s]


[Test] 130 Loss: 0.607 | Acc: 80.090 8009/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.50it/s]


[Train] 131 Loss: 0.457 | Acc: 83.770 41885/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.19it/s]


[Test] 131 Loss: 0.604 | Acc: 80.200 8020/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.73it/s]


[Train] 132 Loss: 0.454 | Acc: 83.800 41900/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.68it/s]


[Test] 132 Loss: 0.613 | Acc: 80.350 8035/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.30it/s]


[Train] 133 Loss: 0.454 | Acc: 83.800 41900/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.75it/s]


[Test] 133 Loss: 0.607 | Acc: 80.230 8023/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.97it/s]


[Train] 134 Loss: 0.451 | Acc: 83.886 41943/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.83it/s]


[Test] 134 Loss: 0.611 | Acc: 80.210 8021/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.85it/s]


[Train] 135 Loss: 0.444 | Acc: 84.300 42150/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.60it/s]


[Test] 135 Loss: 0.603 | Acc: 80.280 8028/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.43it/s]


[Train] 136 Loss: 0.451 | Acc: 84.004 42002/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.28it/s]


[Test] 136 Loss: 0.610 | Acc: 80.120 8012/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.46it/s]


[Train] 137 Loss: 0.446 | Acc: 84.244 42122/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.86it/s]


[Test] 137 Loss: 0.616 | Acc: 80.110 8011/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.42it/s]


[Train] 138 Loss: 0.442 | Acc: 84.284 42142/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.92it/s]


[Test] 138 Loss: 0.611 | Acc: 80.190 8019/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.58it/s]


[Train] 139 Loss: 0.438 | Acc: 84.566 42283/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.45it/s]


[Test] 139 Loss: 0.619 | Acc: 79.760 7976/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.12it/s]


[Train] 140 Loss: 0.439 | Acc: 84.408 42204/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 84.97it/s]


[Test] 140 Loss: 0.601 | Acc: 80.340 8034/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.65it/s]


[Train] 141 Loss: 0.440 | Acc: 84.446 42223/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 90.17it/s]


[Test] 141 Loss: 0.607 | Acc: 80.530 8053/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.67it/s]


[Train] 142 Loss: 0.438 | Acc: 84.610 42305/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.02it/s]


[Test] 142 Loss: 0.601 | Acc: 80.860 8086/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.45it/s]


[Train] 143 Loss: 0.437 | Acc: 84.550 42275/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.72it/s]


[Test] 143 Loss: 0.608 | Acc: 80.100 8010/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.96it/s]


[Train] 144 Loss: 0.436 | Acc: 84.590 42295/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.08it/s]


[Test] 144 Loss: 0.606 | Acc: 80.290 8029/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.53it/s]


[Train] 145 Loss: 0.432 | Acc: 84.674 42337/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.53it/s]


[Test] 145 Loss: 0.604 | Acc: 80.640 8064/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.54it/s]


[Train] 146 Loss: 0.435 | Acc: 84.526 42263/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.64it/s]


[Test] 146 Loss: 0.607 | Acc: 80.700 8070/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.68it/s]


[Train] 147 Loss: 0.428 | Acc: 84.746 42373/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.71it/s]


[Test] 147 Loss: 0.608 | Acc: 80.340 8034/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.21it/s]


[Train] 148 Loss: 0.428 | Acc: 84.704 42352/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.66it/s]


[Test] 148 Loss: 0.604 | Acc: 80.440 8044/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.52it/s]


[Train] 149 Loss: 0.423 | Acc: 84.964 42482/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 89.79it/s]


[Test] 149 Loss: 0.609 | Acc: 80.650 8065/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.34it/s]


[Train] 150 Loss: 0.421 | Acc: 84.978 42489/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.62it/s]


[Test] 150 Loss: 0.604 | Acc: 80.640 8064/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.73it/s]


[Train] 151 Loss: 0.425 | Acc: 84.968 42484/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 89.88it/s]


[Test] 151 Loss: 0.603 | Acc: 80.340 8034/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.56it/s]


[Train] 152 Loss: 0.423 | Acc: 84.966 42483/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.21it/s]


[Test] 152 Loss: 0.608 | Acc: 80.240 8024/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.26it/s]


[Train] 153 Loss: 0.425 | Acc: 85.116 42558/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.71it/s]


[Test] 153 Loss: 0.605 | Acc: 80.510 8051/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.47it/s]


[Train] 154 Loss: 0.416 | Acc: 85.276 42638/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.76it/s]


[Test] 154 Loss: 0.604 | Acc: 80.790 8079/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.37it/s]


[Train] 155 Loss: 0.422 | Acc: 85.020 42510/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.02it/s]


[Test] 155 Loss: 0.603 | Acc: 80.620 8062/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.54it/s]


[Train] 156 Loss: 0.417 | Acc: 85.226 42613/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.73it/s]


[Test] 156 Loss: 0.598 | Acc: 80.690 8069/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.52it/s]


[Train] 157 Loss: 0.416 | Acc: 85.190 42595/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.22it/s]


[Test] 157 Loss: 0.604 | Acc: 80.860 8086/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.47it/s]


[Train] 158 Loss: 0.414 | Acc: 85.280 42640/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.10it/s]


[Test] 158 Loss: 0.606 | Acc: 80.500 8050/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.51it/s]


[Train] 159 Loss: 0.412 | Acc: 85.392 42696/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 84.36it/s]


[Test] 159 Loss: 0.607 | Acc: 80.640 8064/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.48it/s]


[Train] 160 Loss: 0.414 | Acc: 85.224 42612/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.15it/s]


[Test] 160 Loss: 0.607 | Acc: 80.480 8048/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.04it/s]


[Train] 161 Loss: 0.404 | Acc: 85.526 42763/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.99it/s]


[Test] 161 Loss: 0.609 | Acc: 80.490 8049/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.14it/s]


[Train] 162 Loss: 0.411 | Acc: 85.404 42702/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.45it/s]


[Test] 162 Loss: 0.615 | Acc: 80.400 8040/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.75it/s]


[Train] 163 Loss: 0.405 | Acc: 85.534 42767/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.41it/s]


[Test] 163 Loss: 0.604 | Acc: 80.720 8072/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.78it/s]


[Train] 164 Loss: 0.404 | Acc: 85.572 42786/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.79it/s]


[Test] 164 Loss: 0.606 | Acc: 81.030 8103/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.10it/s]


[Train] 165 Loss: 0.404 | Acc: 85.568 42784/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.78it/s]


[Test] 165 Loss: 0.612 | Acc: 80.410 8041/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.33it/s]


[Train] 166 Loss: 0.399 | Acc: 85.792 42896/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.62it/s]


[Test] 166 Loss: 0.607 | Acc: 80.660 8066/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.72it/s]


[Train] 167 Loss: 0.401 | Acc: 85.616 42808/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 84.97it/s]


[Test] 167 Loss: 0.601 | Acc: 80.960 8096/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.19it/s]


[Train] 168 Loss: 0.402 | Acc: 85.658 42829/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 84.98it/s]


[Test] 168 Loss: 0.605 | Acc: 80.940 8094/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.64it/s]


[Train] 169 Loss: 0.397 | Acc: 85.738 42869/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.79it/s]


[Test] 169 Loss: 0.612 | Acc: 80.630 8063/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.47it/s]


[Train] 170 Loss: 0.399 | Acc: 85.840 42920/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.52it/s]


[Test] 170 Loss: 0.601 | Acc: 80.830 8083/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.75it/s]


[Train] 171 Loss: 0.397 | Acc: 85.912 42956/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.68it/s]


[Test] 171 Loss: 0.600 | Acc: 80.860 8086/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.41it/s]


[Train] 172 Loss: 0.393 | Acc: 86.022 43011/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.21it/s]


[Test] 172 Loss: 0.606 | Acc: 80.670 8067/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.45it/s]


[Train] 173 Loss: 0.398 | Acc: 85.844 42922/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.44it/s]


[Test] 173 Loss: 0.608 | Acc: 80.990 8099/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.47it/s]


[Train] 174 Loss: 0.392 | Acc: 86.030 43015/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 84.05it/s]


[Test] 174 Loss: 0.607 | Acc: 80.750 8075/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.58it/s]


[Train] 175 Loss: 0.396 | Acc: 85.878 42939/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.74it/s]


[Test] 175 Loss: 0.609 | Acc: 80.620 8062/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.84it/s]


[Train] 176 Loss: 0.393 | Acc: 86.088 43044/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.86it/s]


[Test] 176 Loss: 0.603 | Acc: 80.870 8087/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.60it/s]


[Train] 177 Loss: 0.385 | Acc: 86.260 43130/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 83.80it/s]


[Test] 177 Loss: 0.611 | Acc: 80.710 8071/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.64it/s]


[Train] 178 Loss: 0.391 | Acc: 86.170 43085/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 84.42it/s]


[Test] 178 Loss: 0.604 | Acc: 80.990 8099/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.59it/s]


[Train] 179 Loss: 0.387 | Acc: 86.382 43191/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.88it/s]


[Test] 179 Loss: 0.610 | Acc: 80.790 8079/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.77it/s]


[Train] 180 Loss: 0.387 | Acc: 86.376 43188/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.64it/s]


[Test] 180 Loss: 0.607 | Acc: 81.030 8103/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.47it/s]


[Train] 181 Loss: 0.389 | Acc: 86.232 43116/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.73it/s]


[Test] 181 Loss: 0.603 | Acc: 80.920 8092/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.85it/s]


[Train] 182 Loss: 0.379 | Acc: 86.516 43258/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.96it/s]


[Test] 182 Loss: 0.607 | Acc: 80.830 8083/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.49it/s]


[Train] 183 Loss: 0.386 | Acc: 86.272 43136/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.79it/s]


[Test] 183 Loss: 0.614 | Acc: 80.970 8097/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.47it/s]


[Train] 184 Loss: 0.383 | Acc: 86.390 43195/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.25it/s]


[Test] 184 Loss: 0.601 | Acc: 80.780 8078/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.81it/s]


[Train] 185 Loss: 0.375 | Acc: 86.708 43354/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.64it/s]


[Test] 185 Loss: 0.598 | Acc: 81.070 8107/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.38it/s]


[Train] 186 Loss: 0.384 | Acc: 86.272 43136/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 84.24it/s]


[Test] 186 Loss: 0.600 | Acc: 81.010 8101/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.68it/s]


[Train] 187 Loss: 0.377 | Acc: 86.444 43222/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.34it/s]


[Test] 187 Loss: 0.610 | Acc: 80.780 8078/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.60it/s]


[Train] 188 Loss: 0.377 | Acc: 86.622 43311/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.94it/s]


[Test] 188 Loss: 0.605 | Acc: 81.170 8117/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.94it/s]


[Train] 189 Loss: 0.380 | Acc: 86.498 43249/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.79it/s]


[Test] 189 Loss: 0.601 | Acc: 81.020 8102/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.56it/s]


[Train] 190 Loss: 0.377 | Acc: 86.562 43281/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.30it/s]


[Test] 190 Loss: 0.613 | Acc: 80.820 8082/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.48it/s]


[Train] 191 Loss: 0.376 | Acc: 86.686 43343/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.18it/s]


[Test] 191 Loss: 0.612 | Acc: 80.770 8077/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.58it/s]


[Train] 192 Loss: 0.372 | Acc: 86.864 43432/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.89it/s]


[Test] 192 Loss: 0.607 | Acc: 81.010 8101/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.66it/s]


[Train] 193 Loss: 0.373 | Acc: 86.746 43373/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.71it/s]


[Test] 193 Loss: 0.610 | Acc: 80.820 8082/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.68it/s]


[Train] 194 Loss: 0.371 | Acc: 86.676 43338/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.65it/s]


[Test] 194 Loss: 0.604 | Acc: 80.990 8099/10000


100%|███████████████████████████████████████████████████| 391/391 [00:12<00:00, 30.12it/s]


[Train] 195 Loss: 0.368 | Acc: 86.706 43353/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.60it/s]


[Test] 195 Loss: 0.604 | Acc: 81.110 8111/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.66it/s]


[Train] 196 Loss: 0.370 | Acc: 86.846 43423/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.84it/s]


[Test] 196 Loss: 0.606 | Acc: 80.990 8099/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.89it/s]


[Train] 197 Loss: 0.369 | Acc: 86.832 43416/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.34it/s]


[Test] 197 Loss: 0.611 | Acc: 80.790 8079/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.56it/s]


[Train] 198 Loss: 0.369 | Acc: 86.816 43408/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.00it/s]


[Test] 198 Loss: 0.612 | Acc: 80.960 8096/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.71it/s]


[Train] 199 Loss: 0.365 | Acc: 87.090 43545/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.68it/s]


[Test] 199 Loss: 0.604 | Acc: 81.120 8112/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.57it/s]


[Train] 200 Loss: 0.367 | Acc: 87.014 43507/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.71it/s]


[Test] 200 Loss: 0.609 | Acc: 80.920 8092/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.78it/s]


[Train] 201 Loss: 0.364 | Acc: 87.120 43560/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.69it/s]


[Test] 201 Loss: 0.610 | Acc: 80.960 8096/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.34it/s]


[Train] 202 Loss: 0.370 | Acc: 86.880 43440/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.44it/s]


[Test] 202 Loss: 0.606 | Acc: 81.100 8110/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.93it/s]


[Train] 203 Loss: 0.363 | Acc: 87.236 43618/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.51it/s]


[Test] 203 Loss: 0.607 | Acc: 81.010 8101/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.58it/s]


[Train] 204 Loss: 0.362 | Acc: 87.046 43523/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.51it/s]


[Test] 204 Loss: 0.606 | Acc: 80.860 8086/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.37it/s]


[Train] 205 Loss: 0.361 | Acc: 87.200 43600/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 84.23it/s]


[Test] 205 Loss: 0.605 | Acc: 80.960 8096/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.60it/s]


[Train] 206 Loss: 0.360 | Acc: 87.350 43675/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.46it/s]


[Test] 206 Loss: 0.609 | Acc: 80.980 8098/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.81it/s]


[Train] 207 Loss: 0.361 | Acc: 87.212 43606/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.81it/s]


[Test] 207 Loss: 0.609 | Acc: 80.850 8085/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.63it/s]


[Train] 208 Loss: 0.357 | Acc: 87.306 43653/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.88it/s]


[Test] 208 Loss: 0.610 | Acc: 80.980 8098/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.55it/s]


[Train] 209 Loss: 0.360 | Acc: 87.212 43606/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 82.66it/s]


[Test] 209 Loss: 0.605 | Acc: 81.100 8110/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.58it/s]


[Train] 210 Loss: 0.361 | Acc: 87.214 43607/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.95it/s]


[Test] 210 Loss: 0.609 | Acc: 81.030 8103/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.44it/s]


[Train] 211 Loss: 0.357 | Acc: 87.232 43616/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.09it/s]


[Test] 211 Loss: 0.610 | Acc: 81.010 8101/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.48it/s]


[Train] 212 Loss: 0.357 | Acc: 87.164 43582/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.37it/s]


[Test] 212 Loss: 0.601 | Acc: 81.120 8112/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.33it/s]


[Train] 213 Loss: 0.356 | Acc: 87.242 43621/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.37it/s]


[Test] 213 Loss: 0.607 | Acc: 81.130 8113/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.72it/s]


[Train] 214 Loss: 0.354 | Acc: 87.350 43675/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 84.67it/s]


[Test] 214 Loss: 0.605 | Acc: 81.090 8109/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.42it/s]


[Train] 215 Loss: 0.352 | Acc: 87.526 43763/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.74it/s]


[Test] 215 Loss: 0.606 | Acc: 81.070 8107/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.23it/s]


[Train] 216 Loss: 0.352 | Acc: 87.442 43721/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.87it/s]


[Test] 216 Loss: 0.602 | Acc: 81.200 8120/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.87it/s]


[Train] 217 Loss: 0.349 | Acc: 87.616 43808/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.05it/s]


[Test] 217 Loss: 0.612 | Acc: 80.710 8071/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.58it/s]


[Train] 218 Loss: 0.351 | Acc: 87.482 43741/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.40it/s]


[Test] 218 Loss: 0.608 | Acc: 81.180 8118/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.50it/s]


[Train] 219 Loss: 0.350 | Acc: 87.490 43745/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.35it/s]


[Test] 219 Loss: 0.609 | Acc: 81.140 8114/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.49it/s]


[Train] 220 Loss: 0.354 | Acc: 87.532 43766/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.62it/s]


[Test] 220 Loss: 0.608 | Acc: 80.920 8092/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.70it/s]


[Train] 221 Loss: 0.350 | Acc: 87.656 43828/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 83.41it/s]


[Test] 221 Loss: 0.599 | Acc: 81.320 8132/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.74it/s]


[Train] 222 Loss: 0.350 | Acc: 87.482 43741/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.74it/s]


[Test] 222 Loss: 0.603 | Acc: 81.030 8103/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.43it/s]


[Train] 223 Loss: 0.348 | Acc: 87.644 43822/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.36it/s]


[Test] 223 Loss: 0.604 | Acc: 80.940 8094/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.16it/s]


[Train] 224 Loss: 0.350 | Acc: 87.556 43778/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.64it/s]


[Test] 224 Loss: 0.606 | Acc: 81.150 8115/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.77it/s]


[Train] 225 Loss: 0.349 | Acc: 87.560 43780/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.87it/s]


[Test] 225 Loss: 0.605 | Acc: 81.300 8130/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.47it/s]


[Train] 226 Loss: 0.349 | Acc: 87.388 43694/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.46it/s]


[Test] 226 Loss: 0.604 | Acc: 81.220 8122/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.73it/s]


[Train] 227 Loss: 0.348 | Acc: 87.634 43817/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.72it/s]


[Test] 227 Loss: 0.604 | Acc: 81.100 8110/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.33it/s]


[Train] 228 Loss: 0.345 | Acc: 87.728 43864/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.17it/s]


[Test] 228 Loss: 0.601 | Acc: 81.400 8140/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.61it/s]


[Train] 229 Loss: 0.345 | Acc: 87.666 43833/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.44it/s]


[Test] 229 Loss: 0.605 | Acc: 81.080 8108/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.61it/s]


[Train] 230 Loss: 0.345 | Acc: 87.692 43846/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.65it/s]


[Test] 230 Loss: 0.603 | Acc: 81.170 8117/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.52it/s]


[Train] 231 Loss: 0.343 | Acc: 87.784 43892/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.03it/s]


[Test] 231 Loss: 0.600 | Acc: 81.380 8138/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.51it/s]


[Train] 232 Loss: 0.345 | Acc: 87.718 43859/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.34it/s]


[Test] 232 Loss: 0.610 | Acc: 81.190 8119/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.41it/s]


[Train] 233 Loss: 0.344 | Acc: 87.658 43829/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.13it/s]


[Test] 233 Loss: 0.607 | Acc: 81.180 8118/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.64it/s]


[Train] 234 Loss: 0.341 | Acc: 87.960 43980/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.51it/s]


[Test] 234 Loss: 0.604 | Acc: 81.190 8119/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.44it/s]


[Train] 235 Loss: 0.339 | Acc: 87.942 43971/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.04it/s]


[Test] 235 Loss: 0.606 | Acc: 81.290 8129/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.90it/s]


[Train] 236 Loss: 0.346 | Acc: 87.710 43855/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.96it/s]


[Test] 236 Loss: 0.602 | Acc: 81.140 8114/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.67it/s]


[Train] 237 Loss: 0.342 | Acc: 87.906 43953/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 83.48it/s]


[Test] 237 Loss: 0.603 | Acc: 81.400 8140/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.46it/s]


[Train] 238 Loss: 0.337 | Acc: 88.006 44003/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.74it/s]


[Test] 238 Loss: 0.603 | Acc: 81.300 8130/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.54it/s]


[Train] 239 Loss: 0.342 | Acc: 87.780 43890/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 83.53it/s]


[Test] 239 Loss: 0.604 | Acc: 81.320 8132/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.91it/s]


[Train] 240 Loss: 0.336 | Acc: 87.972 43986/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.91it/s]


[Test] 240 Loss: 0.603 | Acc: 81.130 8113/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.71it/s]


[Train] 241 Loss: 0.337 | Acc: 88.080 44040/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.34it/s]


[Test] 241 Loss: 0.603 | Acc: 81.310 8131/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.77it/s]


[Train] 242 Loss: 0.340 | Acc: 87.938 43969/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.81it/s]


[Test] 242 Loss: 0.605 | Acc: 81.240 8124/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 30.01it/s]


[Train] 243 Loss: 0.339 | Acc: 87.864 43932/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.67it/s]


[Test] 243 Loss: 0.605 | Acc: 81.070 8107/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.39it/s]


[Train] 244 Loss: 0.335 | Acc: 88.160 44080/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.46it/s]


[Test] 244 Loss: 0.605 | Acc: 81.310 8131/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.94it/s]


[Train] 245 Loss: 0.339 | Acc: 87.988 43994/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.23it/s]


[Test] 245 Loss: 0.602 | Acc: 81.380 8138/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.40it/s]


[Train] 246 Loss: 0.335 | Acc: 88.180 44090/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 89.82it/s]


[Test] 246 Loss: 0.605 | Acc: 81.420 8142/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.66it/s]


[Train] 247 Loss: 0.337 | Acc: 87.910 43955/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.24it/s]


[Test] 247 Loss: 0.605 | Acc: 81.390 8139/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.84it/s]


[Train] 256 Loss: 0.332 | Acc: 88.270 44135/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.18it/s]


[Test] 256 Loss: 0.603 | Acc: 81.170 8117/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.59it/s]


[Train] 257 Loss: 0.331 | Acc: 88.268 44134/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.24it/s]


[Test] 257 Loss: 0.604 | Acc: 81.410 8141/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.61it/s]


[Train] 258 Loss: 0.333 | Acc: 88.210 44105/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.85it/s]


[Test] 258 Loss: 0.603 | Acc: 81.370 8137/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.87it/s]


[Train] 259 Loss: 0.331 | Acc: 88.196 44098/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.12it/s]


[Test] 259 Loss: 0.604 | Acc: 81.210 8121/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.53it/s]


[Train] 260 Loss: 0.330 | Acc: 88.382 44191/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.81it/s]


[Test] 260 Loss: 0.605 | Acc: 81.240 8124/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.58it/s]


[Train] 261 Loss: 0.332 | Acc: 88.198 44099/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 84.72it/s]


[Test] 261 Loss: 0.604 | Acc: 81.400 8140/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.86it/s]


[Train] 262 Loss: 0.331 | Acc: 88.216 44108/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.23it/s]


[Test] 262 Loss: 0.604 | Acc: 81.280 8128/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.67it/s]


[Train] 263 Loss: 0.330 | Acc: 88.244 44122/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.90it/s]


[Test] 263 Loss: 0.603 | Acc: 81.300 8130/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.64it/s]


[Train] 264 Loss: 0.332 | Acc: 88.196 44098/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.01it/s]


[Test] 264 Loss: 0.602 | Acc: 81.250 8125/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.90it/s]


[Train] 265 Loss: 0.334 | Acc: 88.166 44083/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 87.73it/s]


[Test] 265 Loss: 0.602 | Acc: 81.270 8127/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.47it/s]


[Train] 266 Loss: 0.329 | Acc: 88.300 44150/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.57it/s]


[Test] 266 Loss: 0.602 | Acc: 81.250 8125/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.41it/s]


[Train] 267 Loss: 0.330 | Acc: 88.210 44105/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 89.05it/s]


[Test] 267 Loss: 0.602 | Acc: 81.390 8139/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.58it/s]


[Train] 268 Loss: 0.329 | Acc: 88.296 44148/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.00it/s]


[Test] 268 Loss: 0.604 | Acc: 81.360 8136/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.79it/s]


[Train] 269 Loss: 0.328 | Acc: 88.302 44151/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 88.38it/s]


[Test] 269 Loss: 0.604 | Acc: 81.280 8128/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.51it/s]


[Train] 270 Loss: 0.329 | Acc: 88.416 44208/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.69it/s]


[Test] 270 Loss: 0.603 | Acc: 81.350 8135/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.74it/s]


[Train] 271 Loss: 0.330 | Acc: 88.230 44115/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.96it/s]


[Test] 271 Loss: 0.603 | Acc: 81.350 8135/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.72it/s]


[Train] 272 Loss: 0.328 | Acc: 88.300 44150/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.35it/s]


[Test] 272 Loss: 0.604 | Acc: 81.360 8136/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.88it/s]


[Train] 273 Loss: 0.334 | Acc: 88.172 44086/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 83.62it/s]


[Test] 273 Loss: 0.604 | Acc: 81.190 8119/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.28it/s]


[Train] 274 Loss: 0.326 | Acc: 88.454 44227/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.25it/s]


[Test] 274 Loss: 0.603 | Acc: 81.210 8121/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.56it/s]


[Train] 275 Loss: 0.328 | Acc: 88.388 44194/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.59it/s]


[Test] 275 Loss: 0.603 | Acc: 81.350 8135/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.54it/s]


[Train] 276 Loss: 0.324 | Acc: 88.586 44293/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 85.22it/s]


[Test] 276 Loss: 0.604 | Acc: 81.300 8130/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.68it/s]


[Train] 277 Loss: 0.325 | Acc: 88.436 44218/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 84.09it/s]


[Test] 277 Loss: 0.603 | Acc: 81.330 8133/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.38it/s]


[Train] 278 Loss: 0.326 | Acc: 88.450 44225/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 86.40it/s]


[Test] 278 Loss: 0.602 | Acc: 81.270 8127/10000


100%|███████████████████████████████████████████████████| 391/391 [00:13<00:00, 29.78it/s]


[Train] 279 Loss: 0.328 | Acc: 88.404 44202/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:00<00:00, 84.92it/s]


[Test] 279 Loss: 0.603 | Acc: 81.300 8130/10000


 46%|███████████████████████▎                           | 179/391 [00:06<00:06, 30.79it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:22<00:00, 17.17it/s]


[Train] 49 Loss: 0.587 | Acc: 79.322 39661/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.93it/s]


[Test] 49 Loss: 0.655 | Acc: 78.320 7832/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:22<00:00, 17.23it/s]


[Train] 50 Loss: 0.577 | Acc: 79.664 39832/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.04it/s]


[Test] 50 Loss: 0.653 | Acc: 78.220 7822/10000


100%|███████████████████████████████████████████████████| 391/391 [00:23<00:00, 16.99it/s]


[Train] 51 Loss: 0.568 | Acc: 79.894 39947/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 55.68it/s]


[Test] 51 Loss: 0.651 | Acc: 78.420 7842/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:23<00:00, 16.97it/s]


[Train] 52 Loss: 0.566 | Acc: 79.946 39973/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.83it/s]


[Test] 52 Loss: 0.650 | Acc: 78.080 7808/10000


100%|███████████████████████████████████████████████████| 391/391 [00:23<00:00, 17.00it/s]


[Train] 53 Loss: 0.565 | Acc: 80.034 40017/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.43it/s]


[Test] 53 Loss: 0.635 | Acc: 78.710 7871/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:23<00:00, 16.93it/s]


[Train] 54 Loss: 0.556 | Acc: 80.320 40160/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.17it/s]


[Test] 54 Loss: 0.639 | Acc: 78.450 7845/10000


100%|███████████████████████████████████████████████████| 391/391 [00:23<00:00, 16.97it/s]


[Train] 55 Loss: 0.557 | Acc: 80.138 40069/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.48it/s]


[Test] 55 Loss: 0.643 | Acc: 78.690 7869/10000


100%|███████████████████████████████████████████████████| 391/391 [00:22<00:00, 17.25it/s]


[Train] 56 Loss: 0.549 | Acc: 80.632 40316/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.42it/s]


[Test] 56 Loss: 0.638 | Acc: 78.720 7872/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:23<00:00, 16.98it/s]


[Train] 57 Loss: 0.541 | Acc: 80.876 40438/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 55.29it/s]


[Test] 57 Loss: 0.652 | Acc: 78.160 7816/10000


100%|███████████████████████████████████████████████████| 391/391 [00:22<00:00, 17.06it/s]


[Train] 58 Loss: 0.545 | Acc: 80.608 40304/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.02it/s]


[Test] 58 Loss: 0.637 | Acc: 78.760 7876/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:22<00:00, 17.06it/s]


[Train] 59 Loss: 0.534 | Acc: 81.118 40559/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.86it/s]


[Test] 59 Loss: 0.630 | Acc: 79.100 7910/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:22<00:00, 17.09it/s]


[Train] 60 Loss: 0.539 | Acc: 80.756 40378/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.87it/s]


[Test] 60 Loss: 0.639 | Acc: 78.700 7870/10000


100%|███████████████████████████████████████████████████| 391/391 [00:23<00:00, 16.94it/s]


[Train] 61 Loss: 0.532 | Acc: 81.136 40568/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.68it/s]


[Test] 61 Loss: 0.648 | Acc: 78.270 7827/10000


100%|███████████████████████████████████████████████████| 391/391 [00:22<00:00, 17.26it/s]


[Train] 62 Loss: 0.528 | Acc: 81.270 40635/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.08it/s]


[Test] 62 Loss: 0.630 | Acc: 78.940 7894/10000


 82%|█████████████████████████████████████████▋         | 320/391 [00:18<00:04, 16.57it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:23<00:00, 16.75it/s]


[Train] 98 Loss: 0.407 | Acc: 85.486 42743/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.26it/s]


[Test] 98 Loss: 0.626 | Acc: 79.930 7993/10000


100%|███████████████████████████████████████████████████| 391/391 [00:22<00:00, 17.24it/s]


[Train] 99 Loss: 0.401 | Acc: 85.744 42872/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.33it/s]


[Test] 99 Loss: 0.631 | Acc: 79.620 7962/10000


100%|███████████████████████████████████████████████████| 391/391 [00:23<00:00, 17.00it/s]


[Train] 100 Loss: 0.398 | Acc: 85.594 42797/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.91it/s]


[Test] 100 Loss: 0.607 | Acc: 80.290 8029/10000


100%|███████████████████████████████████████████████████| 391/391 [00:23<00:00, 16.91it/s]


[Train] 101 Loss: 0.394 | Acc: 86.072 43036/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.68it/s]


[Test] 101 Loss: 0.614 | Acc: 79.940 7994/10000


100%|███████████████████████████████████████████████████| 391/391 [00:22<00:00, 17.26it/s]


[Train] 102 Loss: 0.396 | Acc: 85.708 42854/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.58it/s]


[Test] 102 Loss: 0.610 | Acc: 80.280 8028/10000


100%|███████████████████████████████████████████████████| 391/391 [00:22<00:00, 17.13it/s]


[Train] 103 Loss: 0.390 | Acc: 85.952 42976/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 55.53it/s]


[Test] 103 Loss: 0.616 | Acc: 79.780 7978/10000


100%|███████████████████████████████████████████████████| 391/391 [00:22<00:00, 17.19it/s]


[Train] 104 Loss: 0.392 | Acc: 86.042 43021/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.79it/s]


[Test] 104 Loss: 0.604 | Acc: 80.740 8074/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:22<00:00, 17.01it/s]


[Train] 105 Loss: 0.386 | Acc: 86.206 43103/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 55.96it/s]


[Test] 105 Loss: 0.614 | Acc: 80.400 8040/10000


100%|███████████████████████████████████████████████████| 391/391 [00:23<00:00, 16.98it/s]


[Train] 106 Loss: 0.381 | Acc: 86.348 43174/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.72it/s]


[Test] 106 Loss: 0.605 | Acc: 80.840 8084/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:22<00:00, 17.14it/s]


[Train] 107 Loss: 0.380 | Acc: 86.396 43198/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 55.74it/s]


[Test] 107 Loss: 0.599 | Acc: 80.720 8072/10000


100%|███████████████████████████████████████████████████| 391/391 [00:22<00:00, 17.16it/s]


[Train] 108 Loss: 0.371 | Acc: 86.792 43396/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.25it/s]


[Test] 108 Loss: 0.604 | Acc: 80.740 8074/10000


100%|███████████████████████████████████████████████████| 391/391 [00:22<00:00, 17.20it/s]


[Train] 109 Loss: 0.375 | Acc: 86.638 43319/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 55.98it/s]


[Test] 109 Loss: 0.611 | Acc: 80.440 8044/10000


100%|███████████████████████████████████████████████████| 391/391 [00:23<00:00, 17.00it/s]


[Train] 110 Loss: 0.371 | Acc: 86.638 43319/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 55.26it/s]


[Test] 110 Loss: 0.605 | Acc: 80.740 8074/10000


100%|███████████████████████████████████████████████████| 391/391 [00:22<00:00, 17.13it/s]


[Train] 111 Loss: 0.376 | Acc: 86.554 43277/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 55.92it/s]


[Test] 111 Loss: 0.620 | Acc: 80.130 8013/10000


100%|███████████████████████████████████████████████████| 391/391 [00:22<00:00, 17.15it/s]


[Train] 112 Loss: 0.369 | Acc: 86.624 43312/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.27it/s]


[Test] 112 Loss: 0.614 | Acc: 80.300 8030/10000


100%|███████████████████████████████████████████████████| 391/391 [00:23<00:00, 16.85it/s]


[Train] 113 Loss: 0.362 | Acc: 86.936 43468/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.22it/s]


[Test] 113 Loss: 0.614 | Acc: 80.420 8042/10000


100%|███████████████████████████████████████████████████| 391/391 [00:23<00:00, 16.93it/s]


[Train] 114 Loss: 0.359 | Acc: 87.174 43587/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.77it/s]


[Test] 114 Loss: 0.618 | Acc: 80.340 8034/10000


100%|███████████████████████████████████████████████████| 391/391 [00:22<00:00, 17.09it/s]


[Train] 115 Loss: 0.367 | Acc: 86.752 43376/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.63it/s]


[Test] 115 Loss: 0.613 | Acc: 80.850 8085/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:22<00:00, 17.12it/s]


[Train] 116 Loss: 0.361 | Acc: 87.168 43584/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.39it/s]


[Test] 116 Loss: 0.615 | Acc: 80.150 8015/10000


100%|███████████████████████████████████████████████████| 391/391 [00:22<00:00, 17.22it/s]


[Train] 117 Loss: 0.361 | Acc: 87.020 43510/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 55.92it/s]


[Test] 117 Loss: 0.619 | Acc: 80.290 8029/10000


100%|███████████████████████████████████████████████████| 391/391 [00:23<00:00, 16.97it/s]


[Train] 118 Loss: 0.358 | Acc: 87.106 43553/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.58it/s]


[Test] 118 Loss: 0.608 | Acc: 81.070 8107/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:22<00:00, 17.03it/s]


[Train] 119 Loss: 0.352 | Acc: 87.426 43713/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.88it/s]


[Test] 119 Loss: 0.608 | Acc: 80.790 8079/10000


100%|███████████████████████████████████████████████████| 391/391 [00:36<00:00, 10.79it/s]


[Train] 120 Loss: 0.350 | Acc: 87.422 43711/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.36it/s]


[Test] 120 Loss: 0.611 | Acc: 80.990 8099/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.60it/s]


[Train] 121 Loss: 0.347 | Acc: 87.818 43909/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.92it/s]


[Test] 121 Loss: 0.605 | Acc: 80.650 8065/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.42it/s]


[Train] 122 Loss: 0.346 | Acc: 87.750 43875/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.15it/s]


[Test] 122 Loss: 0.615 | Acc: 80.790 8079/10000


100%|███████████████████████████████████████████████████| 391/391 [00:44<00:00,  8.84it/s]


[Train] 123 Loss: 0.337 | Acc: 87.800 43900/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 35.94it/s]


[Test] 123 Loss: 0.615 | Acc: 80.690 8069/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.38it/s]


[Train] 124 Loss: 0.343 | Acc: 87.834 43917/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.61it/s]


[Test] 124 Loss: 0.615 | Acc: 80.840 8084/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.41it/s]


[Train] 125 Loss: 0.340 | Acc: 88.124 44062/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.37it/s]


[Test] 125 Loss: 0.621 | Acc: 80.990 8099/10000


100%|███████████████████████████████████████████████████| 391/391 [00:43<00:00,  8.98it/s]


[Train] 126 Loss: 0.336 | Acc: 88.058 44029/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.62it/s]


[Test] 126 Loss: 0.615 | Acc: 80.730 8073/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.40it/s]


[Train] 127 Loss: 0.336 | Acc: 87.880 43940/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 37.22it/s]


[Test] 127 Loss: 0.622 | Acc: 80.340 8034/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.36it/s]


[Train] 128 Loss: 0.335 | Acc: 87.912 43956/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.40it/s]


[Test] 128 Loss: 0.616 | Acc: 80.780 8078/10000


100%|███████████████████████████████████████████████████| 391/391 [00:43<00:00,  8.94it/s]


[Train] 129 Loss: 0.327 | Acc: 88.490 44245/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.40it/s]


[Test] 129 Loss: 0.616 | Acc: 81.020 8102/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.47it/s]


[Train] 130 Loss: 0.330 | Acc: 88.246 44123/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.94it/s]


[Test] 130 Loss: 0.617 | Acc: 81.000 8100/10000


 52%|██████████████████████████▎                        | 202/391 [00:21<00:19,  9.67it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.50it/s]


[Train] 172 Loss: 0.250 | Acc: 90.900 45450/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.43it/s]


[Test] 172 Loss: 0.653 | Acc: 81.350 8135/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.42it/s]


[Train] 173 Loss: 0.251 | Acc: 91.080 45540/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.19it/s]


[Test] 173 Loss: 0.659 | Acc: 81.120 8112/10000


100%|███████████████████████████████████████████████████| 391/391 [00:43<00:00,  9.08it/s]


[Train] 174 Loss: 0.251 | Acc: 91.038 45519/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.52it/s]


[Test] 174 Loss: 0.664 | Acc: 80.970 8097/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.39it/s]


[Train] 175 Loss: 0.242 | Acc: 91.292 45646/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.72it/s]


[Test] 175 Loss: 0.660 | Acc: 80.820 8082/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.48it/s]


[Train] 176 Loss: 0.246 | Acc: 91.162 45581/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.76it/s]


[Test] 176 Loss: 0.657 | Acc: 80.870 8087/10000


100%|███████████████████████████████████████████████████| 391/391 [00:43<00:00,  8.97it/s]


[Train] 177 Loss: 0.245 | Acc: 91.310 45655/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.69it/s]


[Test] 177 Loss: 0.664 | Acc: 80.880 8088/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.42it/s]


[Train] 178 Loss: 0.243 | Acc: 91.230 45615/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.49it/s]


[Test] 178 Loss: 0.657 | Acc: 81.130 8113/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.47it/s]


[Train] 179 Loss: 0.242 | Acc: 91.386 45693/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 35.82it/s]


[Test] 179 Loss: 0.665 | Acc: 80.990 8099/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.42it/s]


[Train] 180 Loss: 0.239 | Acc: 91.362 45681/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 33.19it/s]


[Test] 180 Loss: 0.657 | Acc: 80.920 8092/10000


 19%|█████████▋                                          | 73/391 [00:09<00:31, 10.18it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:43<00:00,  8.99it/s]


[Train] 222 Loss: 0.193 | Acc: 93.032 46516/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.29it/s]


[Test] 222 Loss: 0.688 | Acc: 81.140 8114/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.51it/s]


[Train] 223 Loss: 0.196 | Acc: 92.964 46482/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.81it/s]


[Test] 223 Loss: 0.687 | Acc: 80.950 8095/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.34it/s]


[Train] 224 Loss: 0.195 | Acc: 93.068 46534/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.64it/s]


[Test] 224 Loss: 0.687 | Acc: 81.230 8123/10000


100%|███████████████████████████████████████████████████| 391/391 [00:42<00:00,  9.25it/s]


[Train] 225 Loss: 0.190 | Acc: 93.296 46648/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 30.38it/s]


[Test] 225 Loss: 0.691 | Acc: 81.390 8139/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.34it/s]


[Train] 226 Loss: 0.192 | Acc: 93.076 46538/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.08it/s]


[Test] 226 Loss: 0.694 | Acc: 81.050 8105/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.47it/s]


[Train] 227 Loss: 0.191 | Acc: 93.204 46602/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.22it/s]


[Test] 227 Loss: 0.694 | Acc: 81.140 8114/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.51it/s]


[Train] 228 Loss: 0.190 | Acc: 93.270 46635/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.80it/s]


[Test] 228 Loss: 0.693 | Acc: 81.040 8104/10000


100%|███████████████████████████████████████████████████| 391/391 [00:43<00:00,  8.94it/s]


[Train] 229 Loss: 0.192 | Acc: 93.234 46617/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.64it/s]


[Test] 229 Loss: 0.684 | Acc: 81.390 8139/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.35it/s]


[Train] 230 Loss: 0.190 | Acc: 93.150 46575/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.42it/s]


[Test] 230 Loss: 0.685 | Acc: 81.420 8142/10000


 29%|██████████████▋                                    | 113/391 [00:12<00:30,  9.23it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.42it/s]


[Train] 272 Loss: 0.168 | Acc: 94.034 47017/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.09it/s]


[Test] 272 Loss: 0.696 | Acc: 81.370 8137/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.45it/s]


[Train] 273 Loss: 0.169 | Acc: 93.926 46963/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 37.08it/s]


[Test] 273 Loss: 0.695 | Acc: 81.260 8126/10000


100%|███████████████████████████████████████████████████| 391/391 [00:43<00:00,  9.02it/s]


[Train] 274 Loss: 0.170 | Acc: 93.980 46990/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 37.10it/s]


[Test] 274 Loss: 0.696 | Acc: 81.360 8136/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.44it/s]


[Train] 275 Loss: 0.171 | Acc: 93.814 46907/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.57it/s]


[Test] 275 Loss: 0.697 | Acc: 81.430 8143/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.50it/s]


[Train] 276 Loss: 0.167 | Acc: 94.226 47113/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 35.95it/s]


[Test] 276 Loss: 0.696 | Acc: 81.380 8138/10000


100%|███████████████████████████████████████████████████| 391/391 [00:43<00:00,  8.93it/s]


[Train] 277 Loss: 0.171 | Acc: 93.882 46941/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.12it/s]


[Test] 277 Loss: 0.697 | Acc: 81.430 8143/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.54it/s]


[Train] 278 Loss: 0.168 | Acc: 94.056 47028/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.85it/s]


[Test] 278 Loss: 0.697 | Acc: 81.340 8134/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.50it/s]


[Train] 279 Loss: 0.169 | Acc: 94.062 47031/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 35.58it/s]


[Test] 279 Loss: 0.696 | Acc: 81.390 8139/10000


100%|███████████████████████████████████████████████████| 391/391 [00:43<00:00,  9.05it/s]


[Train] 280 Loss: 0.169 | Acc: 94.026 47013/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 36.00it/s]


[Test] 280 Loss: 0.697 | Acc: 81.300 8130/10000


 25%|█████████████                                       | 98/391 [00:10<00:32,  9.12it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.36it/s]


[Train] 32 Loss: 1.737 | Acc: 53.056 26528/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.42it/s]


[Test] 32 Loss: 1.976 | Acc: 49.410 4941/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:27<00:00, 14.42it/s]


[Train] 33 Loss: 1.719 | Acc: 53.586 26793/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.93it/s]


[Test] 33 Loss: 1.974 | Acc: 49.380 4938/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.40it/s]


[Train] 34 Loss: 1.708 | Acc: 53.660 26830/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.33it/s]


[Test] 34 Loss: 1.963 | Acc: 49.390 4939/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.16it/s]


[Train] 35 Loss: 1.682 | Acc: 54.194 27097/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 58.22it/s]


[Test] 35 Loss: 1.957 | Acc: 49.590 4959/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:26<00:00, 15.03it/s]


[Train] 36 Loss: 1.674 | Acc: 54.404 27202/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.40it/s]


[Test] 36 Loss: 1.953 | Acc: 49.530 4953/10000


100%|███████████████████████████████████████████████████| 391/391 [00:26<00:00, 15.01it/s]


[Train] 37 Loss: 1.655 | Acc: 54.860 27430/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.49it/s]


[Test] 37 Loss: 1.948 | Acc: 50.070 5007/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:27<00:00, 14.41it/s]


[Train] 38 Loss: 1.642 | Acc: 55.338 27669/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 58.55it/s]


[Test] 38 Loss: 1.956 | Acc: 49.760 4976/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.38it/s]


[Train] 39 Loss: 1.628 | Acc: 55.648 27824/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.16it/s]


[Test] 39 Loss: 1.928 | Acc: 50.450 5045/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.26it/s]


[Train] 40 Loss: 1.607 | Acc: 56.292 28146/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.75it/s]


[Test] 40 Loss: 1.947 | Acc: 50.070 5007/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.13it/s]


[Train] 41 Loss: 1.595 | Acc: 56.226 28113/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.54it/s]


[Test] 41 Loss: 1.938 | Acc: 50.620 5062/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.26it/s]


[Train] 42 Loss: 1.584 | Acc: 56.762 28381/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 58.14it/s]


[Test] 42 Loss: 1.954 | Acc: 49.500 4950/10000


100%|███████████████████████████████████████████████████| 391/391 [00:26<00:00, 14.48it/s]


[Train] 43 Loss: 1.570 | Acc: 57.034 28517/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.12it/s]


[Test] 43 Loss: 1.931 | Acc: 50.820 5082/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.18it/s]


[Train] 44 Loss: 1.562 | Acc: 57.216 28608/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.11it/s]


[Test] 44 Loss: 1.938 | Acc: 50.440 5044/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.32it/s]


[Train] 45 Loss: 1.546 | Acc: 57.576 28788/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.74it/s]


[Test] 45 Loss: 1.930 | Acc: 50.780 5078/10000


 77%|███████████████████████████████████████▎           | 301/391 [00:19<00:05, 16.15it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.26it/s]


[Train] 100 Loss: 1.057 | Acc: 69.332 34666/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.64it/s]


[Test] 100 Loss: 1.970 | Acc: 52.960 5296/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.42it/s]


[Train] 101 Loss: 1.063 | Acc: 69.246 34623/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 58.07it/s]


[Test] 101 Loss: 1.966 | Acc: 52.880 5288/10000


100%|███████████████████████████████████████████████████| 391/391 [00:26<00:00, 14.63it/s]


[Train] 102 Loss: 1.043 | Acc: 69.582 34791/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 58.02it/s]


[Test] 102 Loss: 1.969 | Acc: 52.770 5277/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.46it/s]


[Train] 103 Loss: 1.044 | Acc: 69.942 34971/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.25it/s]


[Test] 103 Loss: 1.986 | Acc: 52.790 5279/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.32it/s]


[Train] 104 Loss: 1.036 | Acc: 69.860 34930/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.25it/s]


[Test] 104 Loss: 1.996 | Acc: 52.520 5252/10000


100%|███████████████████████████████████████████████████| 391/391 [00:26<00:00, 14.95it/s]


[Train] 105 Loss: 1.032 | Acc: 70.104 35052/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.85it/s]


[Test] 105 Loss: 1.987 | Acc: 52.510 5251/10000


 42%|█████████████████████▌                             | 165/391 [00:11<00:15, 14.89it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:27<00:00, 14.27it/s]


[Train] 112 Loss: 0.989 | Acc: 71.072 35536/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.14it/s]


[Test] 112 Loss: 2.010 | Acc: 52.740 5274/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.33it/s]


[Train] 113 Loss: 0.989 | Acc: 71.012 35506/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.60it/s]


[Test] 113 Loss: 1.999 | Acc: 52.590 5259/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.24it/s]


[Train] 114 Loss: 0.977 | Acc: 71.578 35789/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.43it/s]


[Test] 114 Loss: 1.993 | Acc: 52.700 5270/10000


100%|███████████████████████████████████████████████████| 391/391 [00:26<00:00, 14.99it/s]


[Train] 115 Loss: 0.975 | Acc: 71.364 35682/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.96it/s]


[Test] 115 Loss: 2.007 | Acc: 52.780 5278/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.10it/s]


[Train] 116 Loss: 0.972 | Acc: 71.614 35807/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.97it/s]


[Test] 116 Loss: 2.015 | Acc: 52.880 5288/10000


100%|███████████████████████████████████████████████████| 391/391 [00:26<00:00, 14.60it/s]


[Train] 117 Loss: 0.972 | Acc: 71.680 35840/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.75it/s]


[Test] 117 Loss: 2.027 | Acc: 52.040 5204/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.17it/s]


[Train] 118 Loss: 0.962 | Acc: 71.764 35882/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 58.18it/s]


[Test] 118 Loss: 2.018 | Acc: 52.690 5269/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.36it/s]


[Train] 119 Loss: 0.958 | Acc: 72.008 36004/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.93it/s]


[Test] 119 Loss: 2.022 | Acc: 52.800 5280/10000


 90%|██████████████████████████████████████████████     | 353/391 [00:23<00:02, 15.02it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.19it/s]


[Train] 173 Loss: 0.740 | Acc: 77.940 38970/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.06it/s]


[Test] 173 Loss: 2.120 | Acc: 53.530 5353/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.24it/s]


[Train] 174 Loss: 0.740 | Acc: 77.902 38951/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.78it/s]


[Test] 174 Loss: 2.126 | Acc: 53.470 5347/10000


100%|███████████████████████████████████████████████████| 391/391 [00:26<00:00, 14.75it/s]


[Train] 175 Loss: 0.742 | Acc: 77.708 38854/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 46.73it/s]


[Test] 175 Loss: 2.128 | Acc: 53.340 5334/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.04it/s]


[Train] 176 Loss: 0.730 | Acc: 78.280 39140/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 58.67it/s]


[Test] 176 Loss: 2.130 | Acc: 53.060 5306/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.13it/s]


[Train] 177 Loss: 0.732 | Acc: 78.242 39121/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.73it/s]


[Test] 177 Loss: 2.137 | Acc: 53.180 5318/10000


 54%|███████████████████████████▍                       | 210/391 [00:13<00:12, 14.70it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.25it/s]


[Train] 184 Loss: 0.718 | Acc: 78.468 39234/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.86it/s]


[Test] 184 Loss: 2.147 | Acc: 53.100 5310/10000


100%|███████████████████████████████████████████████████| 391/391 [00:27<00:00, 14.39it/s]


[Train] 185 Loss: 0.721 | Acc: 78.428 39214/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.84it/s]


[Test] 185 Loss: 2.144 | Acc: 53.280 5328/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.23it/s]


[Train] 186 Loss: 0.710 | Acc: 78.710 39355/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.26it/s]


[Test] 186 Loss: 2.142 | Acc: 53.300 5330/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.26it/s]


[Train] 187 Loss: 0.709 | Acc: 78.690 39345/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.09it/s]


[Test] 187 Loss: 2.151 | Acc: 53.120 5312/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.37it/s]


[Train] 188 Loss: 0.712 | Acc: 78.768 39384/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.70it/s]


[Test] 188 Loss: 2.156 | Acc: 53.090 5309/10000


100%|███████████████████████████████████████████████████| 391/391 [00:26<00:00, 14.99it/s]


[Train] 189 Loss: 0.698 | Acc: 78.978 39489/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.81it/s]


[Test] 189 Loss: 2.162 | Acc: 53.020 5302/10000


100%|███████████████████████████████████████████████████| 391/391 [00:27<00:00, 14.40it/s]


[Train] 190 Loss: 0.702 | Acc: 79.080 39540/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 58.08it/s]


[Test] 190 Loss: 2.153 | Acc: 52.930 5293/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.04it/s]


[Train] 191 Loss: 0.702 | Acc: 79.116 39558/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.07it/s]


[Test] 191 Loss: 2.149 | Acc: 53.190 5319/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.00it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.12it/s]


[Train] 245 Loss: 0.609 | Acc: 81.928 40964/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.88it/s]


[Test] 245 Loss: 2.191 | Acc: 53.300 5330/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.06it/s]


[Train] 246 Loss: 0.607 | Acc: 81.924 40962/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.17it/s]


[Test] 246 Loss: 2.197 | Acc: 53.360 5336/10000


100%|███████████████████████████████████████████████████| 391/391 [00:26<00:00, 14.87it/s]


[Train] 247 Loss: 0.612 | Acc: 81.632 40816/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.50it/s]


[Test] 247 Loss: 2.196 | Acc: 53.440 5344/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.29it/s]


[Train] 248 Loss: 0.610 | Acc: 81.792 40896/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.68it/s]


[Test] 248 Loss: 2.194 | Acc: 53.190 5319/10000


100%|███████████████████████████████████████████████████| 391/391 [00:27<00:00, 14.26it/s]


[Train] 249 Loss: 0.604 | Acc: 81.818 40909/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.21it/s]


[Test] 249 Loss: 2.197 | Acc: 53.400 5340/10000


 83%|██████████████████████████████████████████▍        | 325/391 [00:21<00:04, 14.67it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.10it/s]


[Train] 256 Loss: 0.600 | Acc: 81.886 40943/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.55it/s]


[Test] 256 Loss: 2.199 | Acc: 53.320 5332/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.06it/s]


[Train] 257 Loss: 0.602 | Acc: 82.122 41061/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.56it/s]


[Test] 257 Loss: 2.200 | Acc: 53.440 5344/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.13it/s]


[Train] 258 Loss: 0.600 | Acc: 81.908 40954/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.61it/s]


[Test] 258 Loss: 2.200 | Acc: 53.190 5319/10000


100%|███████████████████████████████████████████████████| 391/391 [00:27<00:00, 14.41it/s]


[Train] 259 Loss: 0.601 | Acc: 81.990 40995/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 58.37it/s]


[Test] 259 Loss: 2.198 | Acc: 53.330 5333/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.14it/s]


[Train] 260 Loss: 0.605 | Acc: 81.808 40904/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.11it/s]


[Test] 260 Loss: 2.198 | Acc: 53.280 5328/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.30it/s]


[Train] 261 Loss: 0.590 | Acc: 82.394 41197/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.05it/s]


[Test] 261 Loss: 2.196 | Acc: 53.490 5349/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.12it/s]


[Train] 262 Loss: 0.597 | Acc: 81.958 40979/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.84it/s]


[Test] 262 Loss: 2.202 | Acc: 53.170 5317/10000


100%|███████████████████████████████████████████████████| 391/391 [00:25<00:00, 15.18it/s]


[Train] 263 Loss: 0.598 | Acc: 82.092 41046/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 56.80it/s]


[Test] 263 Loss: 2.199 | Acc: 53.370 5337/10000


100%|███████████████████████████████████████████████████| 391/391 [00:27<00:00, 14.31it/s]


[Train] 264 Loss: 0.595 | Acc: 82.252 41126/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:01<00:00, 57.54it/s]


[Test] 264 Loss: 2.201 | Acc: 53.400 5340/10000


 20%|██████████▌                                         | 79/391 [00:05<00:21, 14.71it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:42<00:00,  9.24it/s]


[Train] 10 Loss: 2.577 | Acc: 35.432 17716/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.05it/s]


[Test] 10 Loss: 2.532 | Acc: 37.080 3708/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.50it/s]


[Train] 11 Loss: 2.524 | Acc: 36.232 18116/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.00it/s]


[Test] 11 Loss: 2.508 | Acc: 37.700 3770/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.62it/s]


[Train] 12 Loss: 2.474 | Acc: 37.330 18665/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.08it/s]


[Test] 12 Loss: 2.475 | Acc: 38.100 3810/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.62it/s]


[Train] 13 Loss: 2.440 | Acc: 38.182 19091/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.01it/s]


[Test] 13 Loss: 2.460 | Acc: 38.800 3880/10000
Saving..


 29%|██████████████▊                                    | 114/391 [00:12<00:31,  8.80it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:42<00:00,  9.16it/s]


[Train] 18 Loss: 2.252 | Acc: 41.846 20923/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.01it/s]


[Test] 18 Loss: 2.323 | Acc: 41.140 4114/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.58it/s]


[Train] 19 Loss: 2.220 | Acc: 42.788 21394/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.83it/s]


[Test] 19 Loss: 2.325 | Acc: 41.430 4143/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.54it/s]


[Train] 20 Loss: 2.192 | Acc: 43.500 21750/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.86it/s]


[Test] 20 Loss: 2.307 | Acc: 41.750 4175/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.59it/s]


[Train] 21 Loss: 2.162 | Acc: 43.962 21981/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.87it/s]


[Test] 21 Loss: 2.281 | Acc: 42.710 4271/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.32it/s]


[Train] 22 Loss: 2.139 | Acc: 44.402 22201/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.97it/s]


[Test] 22 Loss: 2.284 | Acc: 42.260 4226/10000


 12%|██████▍                                             | 48/391 [00:05<00:34,  9.99it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.54it/s]


[Train] 50 Loss: 1.721 | Acc: 53.752 26876/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.80it/s]


[Test] 50 Loss: 2.210 | Acc: 44.990 4499/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.54it/s]


[Train] 51 Loss: 1.710 | Acc: 53.994 26997/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.95it/s]


[Test] 51 Loss: 2.185 | Acc: 45.670 4567/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.50it/s]


[Train] 52 Loss: 1.707 | Acc: 54.042 27021/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.78it/s]


[Test] 52 Loss: 2.206 | Acc: 45.760 4576/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:42<00:00,  9.22it/s]


[Train] 53 Loss: 1.692 | Acc: 54.562 27281/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.18it/s]


[Test] 53 Loss: 2.203 | Acc: 45.640 4564/10000


 21%|██████████▉                                         | 82/391 [00:08<00:30, 10.07it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:42<00:00,  9.22it/s]


[Train] 61 Loss: 1.623 | Acc: 56.146 28073/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.91it/s]


[Test] 61 Loss: 2.180 | Acc: 46.790 4679/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.58it/s]


[Train] 62 Loss: 1.613 | Acc: 56.318 28159/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.06it/s]


[Test] 62 Loss: 2.178 | Acc: 46.710 4671/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.57it/s]


[Train] 63 Loss: 1.596 | Acc: 56.418 28209/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.80it/s]


[Test] 63 Loss: 2.193 | Acc: 46.620 4662/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.57it/s]


[Train] 64 Loss: 1.592 | Acc: 56.726 28363/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.95it/s]


[Test] 64 Loss: 2.188 | Acc: 47.040 4704/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:42<00:00,  9.24it/s]


[Train] 65 Loss: 1.588 | Acc: 56.464 28232/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.41it/s]


[Test] 65 Loss: 2.176 | Acc: 46.960 4696/10000


 98%|██████████████████████████████████████████████████▏| 385/391 [00:40<00:00,  9.34it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.55it/s]


[Train] 95 Loss: 1.394 | Acc: 61.382 30691/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.84it/s]


[Test] 95 Loss: 2.238 | Acc: 47.230 4723/10000


100%|███████████████████████████████████████████████████| 391/391 [00:42<00:00,  9.29it/s]


[Train] 96 Loss: 1.379 | Acc: 62.078 31039/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.79it/s]


[Test] 96 Loss: 2.230 | Acc: 47.410 4741/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.51it/s]


[Train] 97 Loss: 1.385 | Acc: 61.764 30882/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.94it/s]


[Test] 97 Loss: 2.243 | Acc: 47.330 4733/10000


 90%|█████████████████████████████████████████████▋     | 350/391 [00:36<00:04,  9.23it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.57it/s]


[Train] 106 Loss: 1.332 | Acc: 62.978 31489/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.13it/s]


[Test] 106 Loss: 2.269 | Acc: 47.080 4708/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.52it/s]


[Train] 107 Loss: 1.333 | Acc: 63.214 31607/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.71it/s]


[Test] 107 Loss: 2.266 | Acc: 47.200 4720/10000


100%|███████████████████████████████████████████████████| 391/391 [00:42<00:00,  9.25it/s]


[Train] 108 Loss: 1.323 | Acc: 63.368 31684/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.07it/s]


[Test] 108 Loss: 2.250 | Acc: 47.510 4751/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.61it/s]


[Train] 109 Loss: 1.329 | Acc: 62.900 31450/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.40it/s]


[Test] 109 Loss: 2.269 | Acc: 47.570 4757/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.58it/s]


[Train] 110 Loss: 1.323 | Acc: 63.400 31700/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.17it/s]


[Test] 110 Loss: 2.252 | Acc: 47.640 4764/10000


 77%|███████████████████████████████████████▍           | 302/391 [00:31<00:09,  9.35it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.35it/s]


[Train] 139 Loss: 1.203 | Acc: 66.354 33177/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:03<00:00, 23.95it/s]


[Test] 139 Loss: 2.332 | Acc: 47.230 4723/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.51it/s]


[Train] 140 Loss: 1.200 | Acc: 66.330 33165/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.10it/s]


[Test] 140 Loss: 2.324 | Acc: 47.310 4731/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.59it/s]


[Train] 141 Loss: 1.189 | Acc: 66.534 33267/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.04it/s]


[Test] 141 Loss: 2.329 | Acc: 47.400 4740/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.58it/s]


[Train] 142 Loss: 1.202 | Acc: 66.380 33190/50000


IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.32it/s]


[Train] 151 Loss: 1.159 | Acc: 67.424 33712/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.12it/s]


[Test] 151 Loss: 2.348 | Acc: 47.410 4741/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.56it/s]


[Train] 152 Loss: 1.157 | Acc: 67.038 33519/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.16it/s]


[Test] 152 Loss: 2.337 | Acc: 47.290 4729/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.54it/s]


[Train] 153 Loss: 1.153 | Acc: 67.398 33699/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.91it/s]


[Test] 153 Loss: 2.345 | Acc: 47.410 4741/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.58it/s]


[Train] 154 Loss: 1.164 | Acc: 67.310 33655/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.47it/s]


[Test] 154 Loss: 2.346 | Acc: 47.450 4745/10000


100%|███████████████████████████████████████████████████| 391/391 [00:42<00:00,  9.27it/s]


[Train] 155 Loss: 1.158 | Acc: 67.416 33708/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.42it/s]


[Test] 155 Loss: 2.339 | Acc: 47.350 4735/10000


 47%|███████████████████████▊                           | 183/391 [00:19<00:21,  9.72it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.57it/s]


[Train] 184 Loss: 1.083 | Acc: 69.318 34659/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.80it/s]


[Test] 184 Loss: 2.386 | Acc: 47.850 4785/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.58it/s]


[Train] 185 Loss: 1.080 | Acc: 69.238 34619/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.46it/s]


[Test] 185 Loss: 2.378 | Acc: 47.840 4784/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.60it/s]


[Train] 186 Loss: 1.070 | Acc: 69.686 34843/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:03<00:00, 23.93it/s]


[Test] 186 Loss: 2.386 | Acc: 47.670 4767/10000


 96%|████████████████████████████████████████████████▊  | 374/391 [00:39<00:01,  9.16it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.66it/s]


[Train] 195 Loss: 1.046 | Acc: 70.210 35105/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.85it/s]


[Test] 195 Loss: 2.403 | Acc: 47.670 4767/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.60it/s]


[Train] 196 Loss: 1.058 | Acc: 69.684 34842/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.19it/s]


[Test] 196 Loss: 2.405 | Acc: 47.640 4764/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.63it/s]


[Train] 197 Loss: 1.050 | Acc: 70.296 35148/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.81it/s]


[Test] 197 Loss: 2.399 | Acc: 47.790 4779/10000


100%|███████████████████████████████████████████████████| 391/391 [00:42<00:00,  9.21it/s]


[Train] 198 Loss: 1.046 | Acc: 70.324 35162/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.59it/s]


[Test] 198 Loss: 2.410 | Acc: 47.760 4776/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.49it/s]


[Train] 199 Loss: 1.050 | Acc: 70.166 35083/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.22it/s]


[Test] 199 Loss: 2.403 | Acc: 47.520 4752/10000


 80%|████████████████████████████████████████▉          | 314/391 [00:32<00:08,  9.26it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.54it/s]


[Train] 208 Loss: 1.035 | Acc: 70.658 35329/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.77it/s]


[Test] 208 Loss: 2.414 | Acc: 47.770 4777/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.57it/s]


[Train] 209 Loss: 1.034 | Acc: 70.552 35276/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.04it/s]


[Test] 209 Loss: 2.410 | Acc: 47.570 4757/10000


100%|███████████████████████████████████████████████████| 391/391 [00:42<00:00,  9.26it/s]


[Train] 210 Loss: 1.027 | Acc: 70.666 35333/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.15it/s]


[Test] 210 Loss: 2.409 | Acc: 47.620 4762/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.68it/s]


[Train] 211 Loss: 1.022 | Acc: 70.926 35463/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.37it/s]


[Test] 211 Loss: 2.423 | Acc: 47.810 4781/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.50it/s]


[Train] 212 Loss: 1.026 | Acc: 70.706 35353/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.85it/s]


[Test] 212 Loss: 2.413 | Acc: 47.810 4781/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.52it/s]


[Train] 213 Loss: 1.030 | Acc: 70.710 35355/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.27it/s]


[Test] 213 Loss: 2.419 | Acc: 47.520 4752/10000


100%|███████████████████████████████████████████████████| 391/391 [00:42<00:00,  9.23it/s]


[Train] 214 Loss: 1.025 | Acc: 70.812 35406/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.21it/s]


[Test] 214 Loss: 2.413 | Acc: 47.450 4745/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.51it/s]


[Train] 215 Loss: 1.018 | Acc: 71.042 35521/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.07it/s]


[Test] 215 Loss: 2.419 | Acc: 47.620 4762/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.57it/s]


[Train] 216 Loss: 1.021 | Acc: 70.902 35451/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.91it/s]


[Test] 216 Loss: 2.422 | Acc: 47.710 4771/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.60it/s]


[Train] 217 Loss: 1.022 | Acc: 70.900 35450/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.04it/s]


[Test] 217 Loss: 2.425 | Acc: 47.610 4761/10000


  7%|███▊                                                | 29/391 [00:03<00:37,  9.76it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.88it/s]


[Test] 254 Loss: 2.437 | Acc: 47.750 4775/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.50it/s]


[Train] 255 Loss: 0.978 | Acc: 72.138 36069/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.08it/s]


[Test] 255 Loss: 2.439 | Acc: 47.890 4789/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.58it/s]


[Train] 256 Loss: 0.979 | Acc: 71.908 35954/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 27.89it/s]


[Test] 256 Loss: 2.437 | Acc: 47.690 4769/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.32it/s]


[Train] 257 Loss: 0.975 | Acc: 72.146 36073/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.16it/s]


[Test] 257 Loss: 2.438 | Acc: 47.840 4784/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.54it/s]


[Train] 258 Loss: 0.975 | Acc: 72.224 36112/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.06it/s]


[Test] 258 Loss: 2.440 | Acc: 47.970 4797/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.58it/s]


[Train] 259 Loss: 0.966 | Acc: 72.462 36231/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.42it/s]


[Test] 259 Loss: 2.440 | Acc: 47.820 4782/10000


100%|███████████████████████████████████████████████████| 391/391 [00:40<00:00,  9.63it/s]


[Train] 260 Loss: 0.976 | Acc: 72.162 36081/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.56it/s]


[Test] 260 Loss: 2.439 | Acc: 47.830 4783/10000


100%|███████████████████████████████████████████████████| 391/391 [00:42<00:00,  9.24it/s]


[Train] 261 Loss: 0.971 | Acc: 72.430 36215/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.39it/s]


[Test] 261 Loss: 2.441 | Acc: 47.760 4776/10000


100%|███████████████████████████████████████████████████| 391/391 [00:41<00:00,  9.51it/s]


[Train] 262 Loss: 0.969 | Acc: 72.200 36100/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 28.13it/s]


[Test] 262 Loss: 2.438 | Acc: 47.770 4777/10000


 55%|████████████████████████████▎                      | 217/391 [00:22<00:18,  9.58it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



In [16]:
asdasdasd

NameError: name 'asdasdasd' is not defined

In [None]:
## Use mixing 

In [None]:
### TODO: Experiments
'''
1. Sparse Attention
2. Sparse MLP
3. Sparse Att + MLP

Datasets:
A. Cifar-10/100 -> 4x4 vs 2x2 vs 1x1 patch
B. Tiny-Imagenet -> 16x16 vs 4x4 vs 2x2 patch
'''

In [None]:
'''
## Cifar 10/100

vit_mixer = Mixer_ViT_Classifier((3, 32, 32), patch_size=[8, 8], hidden_channel=256, num_blocks=6, num_classes=200, block_seq_size=4, block_mlp_size=16)

vit_mixer = Mixer_ViT_Classifier((3, 32, 32), patch_size=[4, 4], hidden_channel=128, num_blocks=3, num_classes=10, block_seq_size=8, block_mlp_size=128)

vit_mixer = Mixer_ViT_Classifier((3, 32, 32), patch_size=[2, 2], hidden_channel=64, num_blocks=3, num_classes=10, block_seq_size=16, block_mlp_size=8)

vit_mixer = Mixer_ViT_Classifier((3, 32, 32), patch_size=[1, 1], hidden_channel=64, num_blocks=3, num_classes=10, block_seq_size=32, block_mlp_size=8)

'''

In [None]:
'''
vit_mixer = Mixer_ViT_Classifier((3, 64, 64), patch_size=[4, 4], hidden_channel=128, num_blocks=9, num_classes=200, block_seq_size=16, block_mlp_size=16)
Sequence len: 256 ; Block size: 16
Channel dim: 128 num heads: 8
MLP dim: 128 ; Block size: 16


vit_mixer = Mixer_ViT_Classifier((3, 64, 64), patch_size=[8, 8], hidden_channel=256, num_blocks=9, num_classes=200, block_seq_size=8, block_mlp_size=16)
Sequence len: 64 ; Block size: 16
Channel dim: 256 num heads: 16
MLP dim: 256 ; Block size: 16

vit_mixer = Mixer_ViT_Classifier((3, 64, 64), patch_size=[16, 16], hidden_channel=1024, num_blocks=9, num_classes=200, block_seq_size=4, block_mlp_size=32)
Sequence len: 16 ; Block size: 4
Channel dim: 1024 num heads: 32
MLP dim: 1024 ; Block size: 32
'''

### Automate the model creation

In [None]:
img = 64
patch_size = [16, 8, 4, 2, 1]
expansion = [1024, 256, 128, 64, 64]

for i in range(len(patch_size)):
    ps, exp = patch_size[i], expansion[i]
    print(i, ps, exp)
    seq_len = (img//ps)**2
    print('seq:', seq_len)
    
    fact_seq = int(2**np.ceil(np.log2(np.sqrt(seq_len))))
    print(f'fact_seq: {fact_seq}')
    
    
    fact_mlp = int(2**np.ceil(np.log2(np.sqrt(exp))))
    print(f'fact_mlp: {fact_mlp}')