In [1]:
import numpy as np
import copy
import matplotlib
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D

In [2]:
import torch
import torch.nn as nn

from torchvision import datasets, transforms as T
from torch.utils import data

In [3]:
from tqdm import tqdm
import os, time, sys

In [4]:
import resnet_mixer

In [5]:
cifar_train = T.Compose([
    T.RandomCrop(size=32, padding=4),
    T.RandomHorizontalFlip(),
    T.ToTensor(),
    T.Normalize(
        mean=[0.4914, 0.4822, 0.4465], # mean=[0.5071, 0.4865, 0.4409] for cifar100
        std=[0.2023, 0.1994, 0.2010], # std=[0.2009, 0.1984, 0.2023] for cifar100
    ),
])

cifar_test = T.Compose([
    T.ToTensor(),
    T.Normalize(
        mean=[0.4914, 0.4822, 0.4465], # mean=[0.5071, 0.4865, 0.4409] for cifar100
        std=[0.2023, 0.1994, 0.2010], # std=[0.2009, 0.1984, 0.2023] for cifar100
    ),
])

train_dataset = datasets.CIFAR10(root="../../../../../_Datasets/cifar10/", train=True, download=True, transform=cifar_train)
test_dataset = datasets.CIFAR10(root="../../../../../_Datasets/cifar10/", train=False, download=True, transform=cifar_test)

Files already downloaded and verified
Files already downloaded and verified


In [6]:
# train_dataset.data = train_dataset.data.view(-1, 28*28)
# test_dataset.data = test_dataset.data.view(-1, 28*28)

In [7]:
batch_size = 128
train_loader = data.DataLoader(dataset=train_dataset, num_workers=4, batch_size=batch_size, shuffle=True)
test_loader = data.DataLoader(dataset=test_dataset, num_workers=4, batch_size=batch_size, shuffle=False)

In [8]:
device = torch.device("cuda:1")

In [9]:
criterion = nn.CrossEntropyLoss()

In [10]:
for xx, yy in train_loader:
    xx, yy = xx.to(device), yy.to(device)
    print(xx.shape, yy.shape)
    break

torch.Size([128, 3, 32, 32]) torch.Size([128])


## Group-Butterfly for CNN

In [11]:
# model = resnet_mixer.cifar_resnet20(mixer=True).to(device)

In [12]:
## Following is copied from 
### https://github.com/kuangliu/pytorch-cifar/blob/master/main.py

# Training
def train(epoch, model, optimizer):
    model.train()
    train_loss = 0
    correct = 0
    total = 0
    for batch_idx, (inputs, targets) in enumerate(tqdm(train_loader)):
        inputs, targets = inputs.to(device), targets.to(device)
        optimizer.zero_grad()
        outputs = model(inputs)
        loss = criterion(outputs, targets)
        loss.backward()
        optimizer.step()

        train_loss += loss.item()
        _, predicted = outputs.max(1)
        total += targets.size(0)
        correct += predicted.eq(targets).sum().item()
    print(f"[Train] {epoch} Loss: {train_loss/(batch_idx+1):.3f} | Acc: {100.*correct/total:.3f} {correct}/{total}")
    return

In [13]:
best_acc = -1
def test(epoch, model, model_name):
    global best_acc
    model.eval()
    test_loss = 0
    correct = 0
    total = 0
    with torch.no_grad():
        for batch_idx, (inputs, targets) in enumerate(tqdm(test_loader)):
            inputs, targets = inputs.to(device), targets.to(device)
            outputs = model(inputs)
            loss = criterion(outputs, targets)

            test_loss += loss.item()
            _, predicted = outputs.max(1)
            total += targets.size(0)
            correct += predicted.eq(targets).sum().item()
            
    print(f"[Test] {epoch} Loss: {test_loss/(batch_idx+1):.3f} | Acc: {100.*correct/total:.3f} {correct}/{total}")
    
    # Save checkpoint.
    acc = 100.*correct/total
    if acc > best_acc:
        print('Saving..')
        state = {
            'model': model.state_dict(),
            'acc': acc,
            'epoch': epoch,
        }
        if not os.path.isdir('models'):
            os.mkdir('models')
        torch.save(state, f'./models/{model_name}.pth')
        best_acc = acc

In [14]:
EPOCHS = 200

In [15]:
acc_dict = {}
#     net = torch.compile(net)
#     net = torch.compile(net, mode="reduce-overhead")
#     net = torch.compile(net, mode="max-autotune")

### e0 default cifar_resnet20 with 4,8,8 groups per block
# model_name = f"00.0_c10_butterfly_e0"
# net = resnet_mixer.cifar_resnet20(num_classes=10, mixer=True).to(device)

### e0 32, 64, 128 cifar_resnet20 with 8,8,16 groups per block
model_name = f"00.0_c10_butterfly_e1"
net = resnet_mixer.cifar_resnet20(num_classes=10, mixer=True, planes=32, G=[8, 8, 16]).to(device)

criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(net.parameters(), lr=0.1,
                      momentum=0.9, weight_decay=5e-4)
scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=EPOCHS)
best_acc = -1

for epoch in range(EPOCHS):
    train(epoch, net, optimizer)
    test(epoch, net, model_name)
    scheduler.step()
# acc_dict[key] = float(best_acc)

100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.17it/s]


[Train] 0 Loss: 1.578 | Acc: 41.658 20829/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.30it/s]


[Test] 0 Loss: 1.244 | Acc: 53.650 5365/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.26it/s]


[Train] 1 Loss: 1.080 | Acc: 61.166 30583/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.45it/s]


[Test] 1 Loss: 1.148 | Acc: 60.620 6062/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.25it/s]


[Train] 2 Loss: 0.887 | Acc: 68.822 34411/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.29it/s]


[Test] 2 Loss: 1.223 | Acc: 60.370 6037/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 3 Loss: 0.766 | Acc: 73.204 36602/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.23it/s]


[Test] 3 Loss: 0.953 | Acc: 68.100 6810/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 4 Loss: 0.699 | Acc: 75.818 37909/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.18it/s]


[Test] 4 Loss: 1.482 | Acc: 58.080 5808/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 5 Loss: 0.666 | Acc: 76.914 38457/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.36it/s]


[Test] 5 Loss: 1.022 | Acc: 66.420 6642/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 6 Loss: 0.645 | Acc: 77.828 38914/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.25it/s]


[Test] 6 Loss: 0.932 | Acc: 69.910 6991/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 7 Loss: 0.630 | Acc: 78.292 39146/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.22it/s]


[Test] 7 Loss: 1.047 | Acc: 65.260 6526/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 8 Loss: 0.609 | Acc: 78.968 39484/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.13it/s]


[Test] 8 Loss: 0.893 | Acc: 70.250 7025/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 9 Loss: 0.595 | Acc: 79.504 39752/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.60it/s]


[Test] 9 Loss: 0.919 | Acc: 70.440 7044/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 10 Loss: 0.592 | Acc: 79.568 39784/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.12it/s]


[Test] 10 Loss: 1.088 | Acc: 64.760 6476/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 11 Loss: 0.575 | Acc: 80.164 40082/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.64it/s]


[Test] 11 Loss: 0.645 | Acc: 77.930 7793/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 12 Loss: 0.567 | Acc: 80.410 40205/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.40it/s]


[Test] 12 Loss: 1.056 | Acc: 66.890 6689/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 13 Loss: 0.558 | Acc: 80.794 40397/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.27it/s]


[Test] 13 Loss: 0.706 | Acc: 76.470 7647/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 14 Loss: 0.550 | Acc: 81.108 40554/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.28it/s]


[Test] 14 Loss: 0.733 | Acc: 75.860 7586/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 15 Loss: 0.546 | Acc: 81.176 40588/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.33it/s]


[Test] 15 Loss: 0.813 | Acc: 74.090 7409/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 16 Loss: 0.543 | Acc: 81.384 40692/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.44it/s]


[Test] 16 Loss: 0.848 | Acc: 73.140 7314/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 17 Loss: 0.541 | Acc: 81.300 40650/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.38it/s]


[Test] 17 Loss: 0.666 | Acc: 77.870 7787/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 18 Loss: 0.531 | Acc: 81.702 40851/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.44it/s]


[Test] 18 Loss: 0.886 | Acc: 71.840 7184/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 19 Loss: 0.528 | Acc: 81.702 40851/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.06it/s]


[Test] 19 Loss: 1.034 | Acc: 66.160 6616/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 20 Loss: 0.526 | Acc: 81.744 40872/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.10it/s]


[Test] 20 Loss: 0.818 | Acc: 72.930 7293/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 21 Loss: 0.523 | Acc: 81.922 40961/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.17it/s]


[Test] 21 Loss: 0.898 | Acc: 71.470 7147/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 22 Loss: 0.516 | Acc: 82.226 41113/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.36it/s]


[Test] 22 Loss: 0.929 | Acc: 71.570 7157/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 23 Loss: 0.521 | Acc: 81.800 40900/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.57it/s]


[Test] 23 Loss: 0.634 | Acc: 79.120 7912/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 24 Loss: 0.506 | Acc: 82.626 41313/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.32it/s]


[Test] 24 Loss: 0.740 | Acc: 75.080 7508/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 25 Loss: 0.513 | Acc: 82.374 41187/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.23it/s]


[Test] 25 Loss: 0.683 | Acc: 76.810 7681/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 26 Loss: 0.511 | Acc: 82.248 41124/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.43it/s]


[Test] 26 Loss: 0.685 | Acc: 76.570 7657/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 27 Loss: 0.506 | Acc: 82.710 41355/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.57it/s]


[Test] 27 Loss: 0.899 | Acc: 70.770 7077/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 28 Loss: 0.500 | Acc: 82.824 41412/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.15it/s]


[Test] 28 Loss: 0.872 | Acc: 73.920 7392/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 29 Loss: 0.497 | Acc: 82.874 41437/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.38it/s]


[Test] 29 Loss: 0.643 | Acc: 78.920 7892/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 30 Loss: 0.494 | Acc: 82.836 41418/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.19it/s]


[Test] 30 Loss: 0.560 | Acc: 80.870 8087/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 31 Loss: 0.491 | Acc: 83.116 41558/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.38it/s]


[Test] 31 Loss: 0.644 | Acc: 79.200 7920/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 32 Loss: 0.492 | Acc: 82.984 41492/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.23it/s]


[Test] 32 Loss: 0.714 | Acc: 76.050 7605/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 33 Loss: 0.490 | Acc: 83.026 41513/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.58it/s]


[Test] 33 Loss: 0.713 | Acc: 76.230 7623/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 34 Loss: 0.486 | Acc: 83.260 41630/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 33.99it/s]


[Test] 34 Loss: 1.048 | Acc: 71.060 7106/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 35 Loss: 0.487 | Acc: 83.210 41605/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.30it/s]


[Test] 35 Loss: 0.890 | Acc: 73.710 7371/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 36 Loss: 0.484 | Acc: 83.368 41684/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.09it/s]


[Test] 36 Loss: 0.606 | Acc: 78.910 7891/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 37 Loss: 0.484 | Acc: 83.258 41629/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.30it/s]


[Test] 37 Loss: 0.913 | Acc: 71.750 7175/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 38 Loss: 0.481 | Acc: 83.372 41686/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.12it/s]


[Test] 38 Loss: 0.616 | Acc: 79.760 7976/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 39 Loss: 0.475 | Acc: 83.668 41834/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.18it/s]


[Test] 39 Loss: 0.722 | Acc: 75.810 7581/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 40 Loss: 0.480 | Acc: 83.536 41768/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.15it/s]


[Test] 40 Loss: 0.600 | Acc: 79.960 7996/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 41 Loss: 0.470 | Acc: 83.660 41830/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.44it/s]


[Test] 41 Loss: 0.710 | Acc: 76.920 7692/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 42 Loss: 0.471 | Acc: 83.674 41837/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.13it/s]


[Test] 42 Loss: 0.793 | Acc: 74.030 7403/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 43 Loss: 0.464 | Acc: 84.048 42024/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.34it/s]


[Test] 43 Loss: 0.822 | Acc: 73.030 7303/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 44 Loss: 0.466 | Acc: 83.842 41921/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.23it/s]


[Test] 44 Loss: 0.687 | Acc: 76.730 7673/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 45 Loss: 0.466 | Acc: 83.984 41992/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.37it/s]


[Test] 45 Loss: 0.622 | Acc: 79.570 7957/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 46 Loss: 0.465 | Acc: 84.250 42125/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.11it/s]


[Test] 46 Loss: 0.696 | Acc: 77.870 7787/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 47 Loss: 0.461 | Acc: 84.226 42113/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.36it/s]


[Test] 47 Loss: 0.656 | Acc: 77.440 7744/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 48 Loss: 0.458 | Acc: 84.180 42090/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.33it/s]


[Test] 48 Loss: 0.649 | Acc: 78.400 7840/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 49 Loss: 0.460 | Acc: 84.134 42067/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.31it/s]


[Test] 49 Loss: 0.581 | Acc: 80.340 8034/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 50 Loss: 0.455 | Acc: 84.288 42144/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.13it/s]


[Test] 50 Loss: 0.647 | Acc: 78.810 7881/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 51 Loss: 0.453 | Acc: 84.420 42210/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.40it/s]


[Test] 51 Loss: 0.536 | Acc: 81.260 8126/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 52 Loss: 0.454 | Acc: 84.706 42353/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.42it/s]


[Test] 52 Loss: 0.922 | Acc: 71.120 7112/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 53 Loss: 0.450 | Acc: 84.602 42301/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.29it/s]


[Test] 53 Loss: 0.746 | Acc: 75.350 7535/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 54 Loss: 0.449 | Acc: 84.494 42247/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.43it/s]


[Test] 54 Loss: 0.637 | Acc: 77.690 7769/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 55 Loss: 0.444 | Acc: 84.794 42397/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.20it/s]


[Test] 55 Loss: 0.585 | Acc: 80.120 8012/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 56 Loss: 0.446 | Acc: 84.706 42353/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.12it/s]


[Test] 56 Loss: 0.564 | Acc: 80.870 8087/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 57 Loss: 0.440 | Acc: 84.756 42378/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.31it/s]


[Test] 57 Loss: 0.597 | Acc: 79.880 7988/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 58 Loss: 0.444 | Acc: 84.740 42370/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.00it/s]


[Test] 58 Loss: 0.730 | Acc: 77.750 7775/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 59 Loss: 0.439 | Acc: 84.798 42399/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.11it/s]


[Test] 59 Loss: 1.024 | Acc: 70.300 7030/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 60 Loss: 0.438 | Acc: 84.872 42436/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.40it/s]


[Test] 60 Loss: 0.554 | Acc: 81.600 8160/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 61 Loss: 0.438 | Acc: 84.990 42495/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.28it/s]


[Test] 61 Loss: 0.535 | Acc: 81.760 8176/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 62 Loss: 0.433 | Acc: 85.244 42622/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.62it/s]


[Test] 62 Loss: 0.652 | Acc: 78.500 7850/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 63 Loss: 0.430 | Acc: 85.128 42564/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.08it/s]


[Test] 63 Loss: 0.761 | Acc: 74.810 7481/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 64 Loss: 0.429 | Acc: 85.160 42580/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.17it/s]


[Test] 64 Loss: 0.582 | Acc: 80.630 8063/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 65 Loss: 0.424 | Acc: 85.478 42739/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.40it/s]


[Test] 65 Loss: 0.597 | Acc: 79.540 7954/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 66 Loss: 0.428 | Acc: 85.220 42610/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.40it/s]


[Test] 66 Loss: 0.540 | Acc: 81.990 8199/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 67 Loss: 0.426 | Acc: 85.206 42603/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.16it/s]


[Test] 67 Loss: 0.583 | Acc: 79.900 7990/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 68 Loss: 0.421 | Acc: 85.472 42736/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.04it/s]


[Test] 68 Loss: 0.701 | Acc: 78.370 7837/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 69 Loss: 0.425 | Acc: 85.224 42612/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.34it/s]


[Test] 69 Loss: 0.707 | Acc: 78.400 7840/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 70 Loss: 0.418 | Acc: 85.646 42823/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 33.98it/s]


[Test] 70 Loss: 0.509 | Acc: 82.890 8289/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 71 Loss: 0.418 | Acc: 85.566 42783/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.22it/s]


[Test] 71 Loss: 0.785 | Acc: 75.200 7520/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 72 Loss: 0.417 | Acc: 85.872 42936/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.15it/s]


[Test] 72 Loss: 0.628 | Acc: 79.720 7972/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 73 Loss: 0.415 | Acc: 85.778 42889/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.16it/s]


[Test] 73 Loss: 0.744 | Acc: 76.390 7639/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 74 Loss: 0.413 | Acc: 85.918 42959/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.15it/s]


[Test] 74 Loss: 0.577 | Acc: 80.010 8001/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 75 Loss: 0.406 | Acc: 85.942 42971/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.34it/s]


[Test] 75 Loss: 0.846 | Acc: 72.270 7227/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 76 Loss: 0.405 | Acc: 85.942 42971/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.19it/s]


[Test] 76 Loss: 0.574 | Acc: 80.290 8029/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 77 Loss: 0.410 | Acc: 85.896 42948/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.60it/s]


[Test] 77 Loss: 0.508 | Acc: 82.220 8222/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 78 Loss: 0.404 | Acc: 86.006 43003/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.19it/s]


[Test] 78 Loss: 0.677 | Acc: 78.760 7876/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 79 Loss: 0.403 | Acc: 86.142 43071/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.39it/s]


[Test] 79 Loss: 0.527 | Acc: 82.230 8223/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 80 Loss: 0.399 | Acc: 86.106 43053/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.44it/s]


[Test] 80 Loss: 0.650 | Acc: 79.660 7966/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 81 Loss: 0.400 | Acc: 86.254 43127/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 33.97it/s]


[Test] 81 Loss: 0.691 | Acc: 78.730 7873/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 82 Loss: 0.397 | Acc: 86.276 43138/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.16it/s]


[Test] 82 Loss: 0.567 | Acc: 81.740 8174/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 83 Loss: 0.398 | Acc: 86.346 43173/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.14it/s]


[Test] 83 Loss: 0.496 | Acc: 83.000 8300/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 84 Loss: 0.389 | Acc: 86.776 43388/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.20it/s]


[Test] 84 Loss: 0.532 | Acc: 82.260 8226/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 85 Loss: 0.390 | Acc: 86.504 43252/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.42it/s]


[Test] 85 Loss: 0.522 | Acc: 82.220 8222/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 86 Loss: 0.386 | Acc: 86.650 43325/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.17it/s]


[Test] 86 Loss: 0.564 | Acc: 81.290 8129/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 87 Loss: 0.383 | Acc: 86.800 43400/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.17it/s]


[Test] 87 Loss: 0.582 | Acc: 80.740 8074/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 88 Loss: 0.385 | Acc: 86.740 43370/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.29it/s]


[Test] 88 Loss: 0.558 | Acc: 81.450 8145/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 89 Loss: 0.379 | Acc: 86.908 43454/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.37it/s]


[Test] 89 Loss: 0.591 | Acc: 80.140 8014/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 90 Loss: 0.383 | Acc: 86.786 43393/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.13it/s]


[Test] 90 Loss: 0.503 | Acc: 83.420 8342/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 91 Loss: 0.379 | Acc: 86.862 43431/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.19it/s]


[Test] 91 Loss: 0.446 | Acc: 85.180 8518/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 92 Loss: 0.371 | Acc: 87.206 43603/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.55it/s]


[Test] 92 Loss: 0.444 | Acc: 84.830 8483/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 93 Loss: 0.369 | Acc: 87.300 43650/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.42it/s]


[Test] 93 Loss: 0.472 | Acc: 84.490 8449/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 94 Loss: 0.370 | Acc: 87.174 43587/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.20it/s]


[Test] 94 Loss: 0.709 | Acc: 77.580 7758/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 95 Loss: 0.367 | Acc: 87.338 43669/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.23it/s]


[Test] 95 Loss: 0.465 | Acc: 84.410 8441/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 96 Loss: 0.370 | Acc: 87.304 43652/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.23it/s]


[Test] 96 Loss: 0.535 | Acc: 82.570 8257/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 97 Loss: 0.361 | Acc: 87.626 43813/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.18it/s]


[Test] 97 Loss: 0.439 | Acc: 85.110 8511/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 98 Loss: 0.361 | Acc: 87.432 43716/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.29it/s]


[Test] 98 Loss: 0.556 | Acc: 81.630 8163/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 99 Loss: 0.358 | Acc: 87.606 43803/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.25it/s]


[Test] 99 Loss: 0.494 | Acc: 83.510 8351/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 100 Loss: 0.357 | Acc: 87.662 43831/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.00it/s]


[Test] 100 Loss: 0.561 | Acc: 82.440 8244/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 101 Loss: 0.353 | Acc: 88.048 44024/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.34it/s]


[Test] 101 Loss: 0.488 | Acc: 83.730 8373/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 102 Loss: 0.348 | Acc: 88.014 44007/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.23it/s]


[Test] 102 Loss: 0.463 | Acc: 84.470 8447/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 103 Loss: 0.351 | Acc: 87.930 43965/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.16it/s]


[Test] 103 Loss: 0.440 | Acc: 85.330 8533/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 104 Loss: 0.349 | Acc: 87.992 43996/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.10it/s]


[Test] 104 Loss: 0.412 | Acc: 85.970 8597/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 105 Loss: 0.343 | Acc: 88.256 44128/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.34it/s]


[Test] 105 Loss: 0.470 | Acc: 84.030 8403/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 106 Loss: 0.344 | Acc: 88.170 44085/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.35it/s]


[Test] 106 Loss: 0.405 | Acc: 86.120 8612/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 107 Loss: 0.344 | Acc: 88.056 44028/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.31it/s]


[Test] 107 Loss: 0.513 | Acc: 83.160 8316/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 108 Loss: 0.338 | Acc: 88.390 44195/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.05it/s]


[Test] 108 Loss: 0.595 | Acc: 80.460 8046/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 109 Loss: 0.332 | Acc: 88.590 44295/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.19it/s]


[Test] 109 Loss: 0.489 | Acc: 83.960 8396/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 110 Loss: 0.331 | Acc: 88.472 44236/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.00it/s]


[Test] 110 Loss: 0.650 | Acc: 79.520 7952/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 111 Loss: 0.329 | Acc: 88.600 44300/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.09it/s]


[Test] 111 Loss: 0.506 | Acc: 83.510 8351/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 112 Loss: 0.327 | Acc: 88.776 44388/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.08it/s]


[Test] 112 Loss: 0.561 | Acc: 81.860 8186/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 113 Loss: 0.322 | Acc: 88.888 44444/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.26it/s]


[Test] 113 Loss: 0.458 | Acc: 85.340 8534/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 114 Loss: 0.318 | Acc: 89.120 44560/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.46it/s]


[Test] 114 Loss: 0.637 | Acc: 79.890 7989/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 115 Loss: 0.320 | Acc: 88.740 44370/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.07it/s]


[Test] 115 Loss: 0.427 | Acc: 85.410 8541/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 116 Loss: 0.320 | Acc: 88.978 44489/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.05it/s]


[Test] 116 Loss: 0.594 | Acc: 80.540 8054/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 117 Loss: 0.313 | Acc: 89.254 44627/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.22it/s]


[Test] 117 Loss: 0.554 | Acc: 82.320 8232/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 118 Loss: 0.309 | Acc: 89.316 44658/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.33it/s]


[Test] 118 Loss: 0.434 | Acc: 85.490 8549/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 119 Loss: 0.303 | Acc: 89.546 44773/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.23it/s]


[Test] 119 Loss: 0.436 | Acc: 85.300 8530/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 120 Loss: 0.304 | Acc: 89.404 44702/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.25it/s]


[Test] 120 Loss: 0.477 | Acc: 84.250 8425/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 121 Loss: 0.303 | Acc: 89.592 44796/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.05it/s]


[Test] 121 Loss: 0.467 | Acc: 84.780 8478/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 122 Loss: 0.301 | Acc: 89.654 44827/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.00it/s]


[Test] 122 Loss: 0.402 | Acc: 86.760 8676/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 123 Loss: 0.297 | Acc: 89.672 44836/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.33it/s]


[Test] 123 Loss: 0.445 | Acc: 85.050 8505/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 124 Loss: 0.291 | Acc: 89.940 44970/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.54it/s]


[Test] 124 Loss: 0.457 | Acc: 84.420 8442/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 125 Loss: 0.292 | Acc: 89.954 44977/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.03it/s]


[Test] 125 Loss: 0.462 | Acc: 84.800 8480/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 126 Loss: 0.287 | Acc: 90.146 45073/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 33.97it/s]


[Test] 126 Loss: 0.402 | Acc: 86.490 8649/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 127 Loss: 0.281 | Acc: 90.396 45198/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.26it/s]


[Test] 127 Loss: 0.396 | Acc: 86.450 8645/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 128 Loss: 0.280 | Acc: 90.390 45195/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.31it/s]


[Test] 128 Loss: 0.395 | Acc: 86.700 8670/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 129 Loss: 0.286 | Acc: 90.166 45083/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.23it/s]


[Test] 129 Loss: 0.406 | Acc: 87.310 8731/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 130 Loss: 0.275 | Acc: 90.520 45260/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.32it/s]


[Test] 130 Loss: 0.423 | Acc: 86.090 8609/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 131 Loss: 0.275 | Acc: 90.590 45295/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.34it/s]


[Test] 131 Loss: 0.404 | Acc: 86.680 8668/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 132 Loss: 0.275 | Acc: 90.458 45229/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.02it/s]


[Test] 132 Loss: 0.419 | Acc: 85.900 8590/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 133 Loss: 0.267 | Acc: 90.678 45339/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.19it/s]


[Test] 133 Loss: 0.431 | Acc: 85.840 8584/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 134 Loss: 0.263 | Acc: 90.924 45462/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.21it/s]


[Test] 134 Loss: 0.452 | Acc: 85.150 8515/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 135 Loss: 0.260 | Acc: 91.068 45534/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.14it/s]


[Test] 135 Loss: 0.392 | Acc: 86.430 8643/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 136 Loss: 0.257 | Acc: 91.138 45569/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.25it/s]


[Test] 136 Loss: 0.410 | Acc: 86.280 8628/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 137 Loss: 0.256 | Acc: 91.190 45595/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.15it/s]


[Test] 137 Loss: 0.692 | Acc: 79.120 7912/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 138 Loss: 0.259 | Acc: 91.132 45566/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.56it/s]


[Test] 138 Loss: 0.383 | Acc: 87.080 8708/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 139 Loss: 0.248 | Acc: 91.356 45678/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.22it/s]


[Test] 139 Loss: 0.419 | Acc: 86.640 8664/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 140 Loss: 0.250 | Acc: 91.276 45638/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.09it/s]


[Test] 140 Loss: 0.408 | Acc: 86.480 8648/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 141 Loss: 0.243 | Acc: 91.638 45819/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.26it/s]


[Test] 141 Loss: 0.366 | Acc: 87.940 8794/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 142 Loss: 0.235 | Acc: 91.844 45922/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.18it/s]


[Test] 142 Loss: 0.349 | Acc: 88.290 8829/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 143 Loss: 0.235 | Acc: 91.914 45957/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.49it/s]


[Test] 143 Loss: 0.408 | Acc: 86.580 8658/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 144 Loss: 0.231 | Acc: 92.046 46023/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.28it/s]


[Test] 144 Loss: 0.347 | Acc: 88.510 8851/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 145 Loss: 0.232 | Acc: 92.040 46020/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.29it/s]


[Test] 145 Loss: 0.372 | Acc: 87.820 8782/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 146 Loss: 0.224 | Acc: 92.164 46082/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.04it/s]


[Test] 146 Loss: 0.341 | Acc: 88.130 8813/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 147 Loss: 0.222 | Acc: 92.290 46145/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.40it/s]


[Test] 147 Loss: 0.370 | Acc: 87.580 8758/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 148 Loss: 0.220 | Acc: 92.320 46160/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.17it/s]


[Test] 148 Loss: 0.368 | Acc: 87.780 8778/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 149 Loss: 0.215 | Acc: 92.578 46289/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.43it/s]


[Test] 149 Loss: 0.409 | Acc: 87.170 8717/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 150 Loss: 0.212 | Acc: 92.686 46343/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.18it/s]


[Test] 150 Loss: 0.358 | Acc: 88.000 8800/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 151 Loss: 0.204 | Acc: 92.968 46484/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.42it/s]


[Test] 151 Loss: 0.333 | Acc: 89.260 8926/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 152 Loss: 0.205 | Acc: 92.988 46494/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.32it/s]


[Test] 152 Loss: 0.342 | Acc: 88.590 8859/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 153 Loss: 0.203 | Acc: 92.938 46469/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.23it/s]


[Test] 153 Loss: 0.369 | Acc: 87.870 8787/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 154 Loss: 0.193 | Acc: 93.300 46650/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.32it/s]


[Test] 154 Loss: 0.346 | Acc: 89.060 8906/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 155 Loss: 0.186 | Acc: 93.576 46788/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.39it/s]


[Test] 155 Loss: 0.305 | Acc: 89.660 8966/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 156 Loss: 0.184 | Acc: 93.746 46873/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.18it/s]


[Test] 156 Loss: 0.413 | Acc: 86.360 8636/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 157 Loss: 0.183 | Acc: 93.714 46857/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.37it/s]


[Test] 157 Loss: 0.346 | Acc: 88.860 8886/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 158 Loss: 0.179 | Acc: 93.872 46936/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.21it/s]


[Test] 158 Loss: 0.369 | Acc: 88.500 8850/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 159 Loss: 0.174 | Acc: 94.000 47000/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.05it/s]


[Test] 159 Loss: 0.321 | Acc: 89.840 8984/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 160 Loss: 0.172 | Acc: 94.008 47004/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.36it/s]


[Test] 160 Loss: 0.360 | Acc: 88.540 8854/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 161 Loss: 0.168 | Acc: 94.184 47092/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.14it/s]


[Test] 161 Loss: 0.325 | Acc: 89.300 8930/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 162 Loss: 0.164 | Acc: 94.346 47173/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.26it/s]


[Test] 162 Loss: 0.340 | Acc: 89.030 8903/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 163 Loss: 0.157 | Acc: 94.570 47285/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.49it/s]


[Test] 163 Loss: 0.311 | Acc: 90.110 9011/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 164 Loss: 0.157 | Acc: 94.660 47330/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.13it/s]


[Test] 164 Loss: 0.305 | Acc: 89.880 8988/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 165 Loss: 0.152 | Acc: 94.810 47405/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.26it/s]


[Test] 165 Loss: 0.316 | Acc: 90.120 9012/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 166 Loss: 0.143 | Acc: 95.144 47572/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.32it/s]


[Test] 166 Loss: 0.334 | Acc: 89.230 8923/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 167 Loss: 0.140 | Acc: 95.152 47576/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.16it/s]


[Test] 167 Loss: 0.320 | Acc: 89.740 8974/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 168 Loss: 0.139 | Acc: 95.256 47628/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.44it/s]


[Test] 168 Loss: 0.291 | Acc: 90.620 9062/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 169 Loss: 0.129 | Acc: 95.602 47801/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.60it/s]


[Test] 169 Loss: 0.291 | Acc: 90.650 9065/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 170 Loss: 0.130 | Acc: 95.614 47807/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.16it/s]


[Test] 170 Loss: 0.296 | Acc: 90.410 9041/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 171 Loss: 0.123 | Acc: 95.916 47958/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.47it/s]


[Test] 171 Loss: 0.293 | Acc: 90.460 9046/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 172 Loss: 0.120 | Acc: 96.026 48013/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.17it/s]


[Test] 172 Loss: 0.295 | Acc: 90.640 9064/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 173 Loss: 0.117 | Acc: 96.054 48027/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 33.93it/s]


[Test] 173 Loss: 0.284 | Acc: 90.810 9081/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 174 Loss: 0.113 | Acc: 96.222 48111/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.16it/s]


[Test] 174 Loss: 0.290 | Acc: 90.770 9077/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 175 Loss: 0.107 | Acc: 96.478 48239/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.19it/s]


[Test] 175 Loss: 0.293 | Acc: 90.780 9078/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 176 Loss: 0.106 | Acc: 96.494 48247/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.07it/s]


[Test] 176 Loss: 0.283 | Acc: 91.120 9112/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 177 Loss: 0.097 | Acc: 96.864 48432/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.03it/s]


[Test] 177 Loss: 0.291 | Acc: 90.730 9073/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 178 Loss: 0.097 | Acc: 96.876 48438/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.05it/s]


[Test] 178 Loss: 0.291 | Acc: 91.000 9100/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 179 Loss: 0.092 | Acc: 97.042 48521/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.36it/s]


[Test] 179 Loss: 0.287 | Acc: 90.740 9074/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 180 Loss: 0.089 | Acc: 97.168 48584/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.09it/s]


[Test] 180 Loss: 0.285 | Acc: 91.270 9127/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 181 Loss: 0.088 | Acc: 97.190 48595/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.28it/s]


[Test] 181 Loss: 0.286 | Acc: 91.440 9144/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 182 Loss: 0.083 | Acc: 97.484 48742/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.12it/s]


[Test] 182 Loss: 0.283 | Acc: 91.380 9138/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 183 Loss: 0.080 | Acc: 97.484 48742/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.32it/s]


[Test] 183 Loss: 0.285 | Acc: 91.490 9149/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 184 Loss: 0.079 | Acc: 97.538 48769/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.33it/s]


[Test] 184 Loss: 0.277 | Acc: 91.500 9150/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 185 Loss: 0.076 | Acc: 97.602 48801/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.11it/s]


[Test] 185 Loss: 0.283 | Acc: 91.580 9158/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 186 Loss: 0.074 | Acc: 97.706 48853/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.31it/s]


[Test] 186 Loss: 0.284 | Acc: 91.390 9139/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 187 Loss: 0.073 | Acc: 97.730 48865/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.40it/s]


[Test] 187 Loss: 0.277 | Acc: 91.480 9148/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.22it/s]


[Train] 188 Loss: 0.069 | Acc: 98.002 49001/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.15it/s]


[Test] 188 Loss: 0.281 | Acc: 91.540 9154/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 189 Loss: 0.069 | Acc: 97.946 48973/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.26it/s]


[Test] 189 Loss: 0.279 | Acc: 91.560 9156/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 190 Loss: 0.068 | Acc: 98.012 49006/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.33it/s]


[Test] 190 Loss: 0.278 | Acc: 91.410 9141/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 191 Loss: 0.067 | Acc: 98.014 49007/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.32it/s]


[Test] 191 Loss: 0.274 | Acc: 91.550 9155/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 192 Loss: 0.067 | Acc: 97.940 48970/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 33.96it/s]


[Test] 192 Loss: 0.277 | Acc: 91.640 9164/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 193 Loss: 0.063 | Acc: 98.232 49116/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.64it/s]


[Test] 193 Loss: 0.275 | Acc: 91.620 9162/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 194 Loss: 0.064 | Acc: 98.190 49095/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.28it/s]


[Test] 194 Loss: 0.273 | Acc: 91.630 9163/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 195 Loss: 0.063 | Acc: 98.162 49081/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.38it/s]


[Test] 195 Loss: 0.276 | Acc: 91.560 9156/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 196 Loss: 0.063 | Acc: 98.214 49107/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.34it/s]


[Test] 196 Loss: 0.275 | Acc: 91.580 9158/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.24it/s]


[Train] 197 Loss: 0.062 | Acc: 98.252 49126/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.28it/s]


[Test] 197 Loss: 0.274 | Acc: 91.680 9168/10000
Saving..


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 198 Loss: 0.062 | Acc: 98.268 49134/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.18it/s]


[Test] 198 Loss: 0.277 | Acc: 91.490 9149/10000


100%|███████████████████████████████████████████████████| 391/391 [00:38<00:00, 10.23it/s]


[Train] 199 Loss: 0.062 | Acc: 98.278 49139/50000


100%|█████████████████████████████████████████████████████| 79/79 [00:02<00:00, 34.41it/s]

[Test] 199 Loss: 0.278 | Acc: 91.560 9156/10000





In [16]:
# !mkdir models

In [19]:
best_acc

91.68

In [18]:
asdasd

NameError: name 'asdasd' is not defined

In [20]:
'''
{'stereographic': 90.51}
{'linear': 92.77}
{'butterfly': 88.61}
{'butterfly-in32': 91.68}
'''

"\n{'stereographic': 90.51}\n{'linear': 92.77}\n{'butterfly': 88.61}\n{'butterfly-in32': 91.68}\n"

In [15]:
sum([p.numel() for p in resnet_mixer.cifar_resnet20(mixer=True).parameters()])

43802

In [16]:
sum([p.numel() for p in resnet_mixer.cifar_resnet20(mixer=False).parameters()])

130346

In [17]:
43802/130346

0.33604406732849496

In [18]:
sum([p.numel() for p in resnet_mixer.cifar_resnet20(mixer=True, planes=32, G=[8, 8, 16]).parameters()])

129578

## Computing the MACs

In [19]:
from ptflops import get_model_complexity_info

for i in range(3):
    if i==0:
        ## hard core ignore
        model = resnet_mixer.cifar_resnet20(mixer=False)
    elif i == 1:
        ### FOR ORIGINAL MIXER V1
        model = resnet_mixer.cifar_resnet20(mixer=True)
    elif i == 2:
        model = resnet_mixer.cifar_resnet20(mixer=True, planes=32, G=[8, 8, 16])

    macs, params = get_model_complexity_info(model, (3, 32, 32), as_strings=True,
                                   print_per_layer_stat=False, verbose=False)

    print("MODEL INDEX: ", i)
    print('{:<30}  {:<8}'.format('Computational complexity: ', macs))
    print('{:<30}  {:<8}'.format('Number of parameters: ', params))
    print('')

MODEL INDEX:  0
Computational complexity:       20.95 MMac
Number of parameters:           130.35 k

MODEL INDEX:  1
Computational complexity:       8.97 MMac
Number of parameters:           43.8 k  

MODEL INDEX:  2
Computational complexity:       25.24 MMac
Number of parameters:           129.58 k

