In [1]:
import sys
sys.path.append("../../")

import torch
import torchvision
import torch.nn as nn
import torch.nn.functional as F
from torchvision import transforms
from torch.utils.data import DataLoader
from torch.hub import load_state_dict_from_url

from tqdm import tqdm
from sklearn.metrics import accuracy_score
import numpy as np
import yaml

from trailmet.algorithms.distill.attention_transfer import AttentionTransfer
from trailmet.datasets.classification import DatasetFactory

# Dataset

In [2]:
device = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')

In [3]:
transform_train = transforms.Compose(
                [
                    transforms.ToTensor(),
                    transforms.Pad(4, padding_mode='reflect'),
                    transforms.RandomHorizontalFlip(p=0.5),
                    transforms.RandomCrop(32),
                    transforms.Normalize((0.4914, 0.4822, 0.4465), (0.247, 0.243, 0.261))
                ]
            )

transform_test = transforms.Compose(
                [
                    transforms.ToTensor(),
                    transforms.Normalize((0.4914, 0.4822, 0.4465), (0.247, 0.243, 0.261))
                ]
            )

transforms1 = {
    'train': transform_train, 
    'val': transform_test, 
    'test': transform_test}

target_transforms = {
    'train': None, 
    'val': None, 
    'test': None}

In [4]:
cifar_dataset = DatasetFactory.create_dataset(name = 'CIFAR10', 
                                        root = "./data",
                                        split_types = ['train', 'val', 'test'],
                                        val_fraction = 0.1,
                                        transform = transforms1,
                                        target_transform = target_transforms,
                                        random_seed=42
                                        )

Files already downloaded and verified
Files already downloaded and verified
Files already downloaded and verified


In [5]:
train_loader = torch.utils.data.DataLoader(
        cifar_dataset['train_dataset'], batch_size=128, 
        sampler=cifar_dataset['train_sampler'],
        num_workers=2
    )

val_loader = torch.utils.data.DataLoader(
        cifar_dataset['val_dataset'], batch_size=128, 
        sampler=cifar_dataset['val_sampler'],
        num_workers=2
    )

test_loader = torch.utils.data.DataLoader(
        cifar_dataset['test_dataset'], batch_size=128, 
        sampler=cifar_dataset['test_sampler'],
        num_workers=2
    )

In [6]:
dataloaders = {'train':train_loader, 'val':val_loader, 'test':test_loader}

# Model

In [7]:
class BasicBlock(nn.Module):
    def __init__(self, in_planes, out_planes, stride, dropRate=0.0):
        super(BasicBlock, self).__init__()
        self.bn1 = nn.BatchNorm2d(in_planes)
        self.relu1 = nn.ReLU(inplace=True)
        self.conv1 = nn.Conv2d(in_planes, out_planes, kernel_size=3, stride=stride,
                               padding=1, bias=False)
        self.bn2 = nn.BatchNorm2d(out_planes)
        self.relu2 = nn.ReLU(inplace=True)
        self.conv2 = nn.Conv2d(out_planes, out_planes, kernel_size=3, stride=1,
                               padding=1, bias=False)
        self.droprate = dropRate
        self.equalInOut = (in_planes == out_planes)
        self.convShortcut = (not self.equalInOut) and nn.Conv2d(in_planes, out_planes, kernel_size=1, stride=stride,
                               padding=0, bias=False) or None
    def forward(self, x):
        if not self.equalInOut:
            x = self.relu1(self.bn1(x))
        else:
            out = self.relu1(self.bn1(x))
        out = self.relu2(self.bn2(self.conv1(out if self.equalInOut else x)))
        if self.droprate > 0:
            out = F.dropout(out, p=self.droprate, training=self.training)
        out = self.conv2(out)
        return torch.add(x if self.equalInOut else self.convShortcut(x), out)

class NetworkBlock(nn.Module):
    def __init__(self, nb_layers, in_planes, out_planes, block, stride, dropRate=0.0):
        super(NetworkBlock, self).__init__()
        self.layer = self._make_layer(block, in_planes, out_planes, nb_layers, stride, dropRate)
    def _make_layer(self, block, in_planes, out_planes, nb_layers, stride, dropRate):
        layers = []
        for i in range(int(nb_layers)):
            layers.append(block(i == 0 and in_planes or out_planes, out_planes, i == 0 and stride or 1, dropRate))
        return nn.Sequential(*layers)
    def forward(self, x):
        return self.layer(x)

class WideResNet(nn.Module):
    def __init__(self, depth, num_classes, widen_factor=1, dropRate=0.0):
        super(WideResNet, self).__init__()
        nChannels = [16, 16*widen_factor, 32*widen_factor, 64*widen_factor]
        assert((depth - 4) % 6 == 0)
        n = (depth - 4) / 6
        block = BasicBlock
        # 1st conv before any network block
        self.conv1 = nn.Conv2d(3, nChannels[0], kernel_size=3, stride=1,
                               padding=1, bias=False)
        # 1st block
        self.block1 = NetworkBlock(n, nChannels[0], nChannels[1], block, 1, dropRate)
        # 2nd block
        self.block2 = NetworkBlock(n, nChannels[1], nChannels[2], block, 2, dropRate)
        # 3rd block
        self.block3 = NetworkBlock(n, nChannels[2], nChannels[3], block, 2, dropRate)
        # global average pooling and classifier
        self.bn1 = nn.BatchNorm2d(nChannels[3])
        self.relu = nn.ReLU(inplace=True)
        self.fc = nn.Linear(nChannels[3], num_classes)
        self.nChannels = nChannels[3]

        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu')
            elif isinstance(m, nn.BatchNorm2d):
                m.weight.data.fill_(1)
                m.bias.data.zero_()
            elif isinstance(m, nn.Linear):
                m.bias.data.zero_()
    def forward(self, x):
        out = self.conv1(x)
        out1 = self.block1(out)
        out2 = self.block2(out1)
        out3 = self.block3(out2)
        out = self.relu(self.bn1(out3))
        out = F.avg_pool2d(out, 8)
        out = out.view(-1, self.nChannels)

        return self.fc(out)


def make_wideresnet(depth, widen_factor, num_classes, dropRate=0.0):
    """Creates and returns the requested model

    Parameters
    ----------
    depth : int
    widen_factor : int
    num_classes : int
    dropRate : float, optional

    Returns
    -------
    WideResNet model

    """
    model = WideResNet(depth, num_classes, widen_factor, dropRate)
    return model

In [8]:
teacher_model = make_wideresnet(16, 2, 10)
student_model = make_wideresnet(16, 1, 10)

teacher_model.to(device)
student_model.to(device)

WideResNet(
  (conv1): Conv2d(3, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
  (block1): NetworkBlock(
    (layer): Sequential(
      (0): BasicBlock(
        (bn1): BatchNorm2d(16, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (relu1): ReLU(inplace=True)
        (conv1): Conv2d(16, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
        (bn2): BatchNorm2d(16, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (relu2): ReLU(inplace=True)
        (conv2): Conv2d(16, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
      (1): BasicBlock(
        (bn1): BatchNorm2d(16, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (relu1): ReLU(inplace=True)
        (conv1): Conv2d(16, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
        (bn2): BatchNorm2d(16, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (relu2): ReLU(

In [9]:
pretrained_weights = "https://drive.google.com/uc?export=download&id=1RWcxOuAJ5qe2ExpB2JgNSBX9cZxsl9YN"
weights = load_state_dict_from_url(pretrained_weights)

In [10]:
teacher_model.load_state_dict(weights)

<All keys matched successfully>

In [11]:
with open("./wrn16x2-wrn16x1.yaml", 'r') as stream:
    data_loaded = yaml.safe_load(stream)
data_loaded

{'DISTILL_ARGS': {'BETA': 1000,
  'EPOCHS': 200,
  'LR': 0.1,
  'WEIGHT_DECAY': 0.0005,
  'TEACHER_LAYER_NAMES': ['block1', 'block2', 'block3'],
  'STUDENT_LAYER_NAMES': ['block1', 'block2', 'block3'],
  'VERBOSE': True},
 'log_dir': 'at_wrn16x1'}

In [12]:
distillation_box = AttentionTransfer(teacher_model, student_model, dataloaders, **data_loaded)

In [13]:
distillation_box.compress_model()

=====TRAINING STUDENT NETWORK=====
Epoch: 1


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.04it/s, loss=3.18]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.16it/s, acc=0.552, loss=2.89]


**Saving checkpoint**
Epoch: 2


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.99it/s, loss=2.28]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 45.77it/s, acc=0.664, loss=2.43]


**Saving checkpoint**
Epoch: 3


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.33it/s, loss=1.98]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.23it/s, acc=0.721, loss=2.11]


**Saving checkpoint**
Epoch: 4


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.34it/s, loss=1.83]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 35.28it/s, acc=0.789, loss=1.87]


**Saving checkpoint**
Epoch: 5


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:13<00:00, 25.19it/s, loss=1.73]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.42it/s, acc=0.767, loss=1.86]


Epoch: 6


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.25it/s, loss=1.65]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.47it/s, acc=0.793, loss=1.79]


**Saving checkpoint**
Epoch: 7


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.75it/s, loss=1.59]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.01it/s, acc=0.788, loss=1.79]


Epoch: 8


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.95it/s, loss=1.55]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.24it/s, acc=0.766, loss=1.88]


Epoch: 9


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.14it/s, loss=1.51]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.31it/s, acc=0.801, loss=1.77]


**Saving checkpoint**
Epoch: 10


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.56it/s, loss=1.49]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 45.57it/s, acc=0.808, loss=1.67]


**Saving checkpoint**
Epoch: 11


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.98it/s, loss=1.46]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.49it/s, acc=0.842, loss=1.6]


**Saving checkpoint**
Epoch: 12


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.37it/s, loss=1.44]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.73it/s, acc=0.789, loss=1.72]


Epoch: 13


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.45it/s, loss=1.43]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 47.08it/s, acc=0.829, loss=1.56]


Epoch: 14


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.74it/s, loss=1.42]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.75it/s, acc=0.787, loss=1.77]


Epoch: 15


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 25.11it/s, loss=1.4]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 46.53it/s, acc=0.823, loss=1.61]


Epoch: 16


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:13<00:00, 25.71it/s, loss=1.39]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 47.62it/s, acc=0.775, loss=1.76]


Epoch: 17


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.50it/s, loss=1.38]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.53it/s, acc=0.795, loss=1.74]


Epoch: 18


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.51it/s, loss=1.37]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.28it/s, acc=0.822, loss=1.63]


Epoch: 19


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.62it/s, loss=1.35]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.23it/s, acc=0.835, loss=1.54]


Epoch: 20


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.77it/s, loss=1.35]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.07it/s, acc=0.819, loss=1.61]


Epoch: 21


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.46it/s, loss=1.34]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.33it/s, acc=0.842, loss=1.54]


**Saving checkpoint**
Epoch: 22


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.94it/s, loss=1.34]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.62it/s, acc=0.833, loss=1.52]


Epoch: 23


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.47it/s, loss=1.33]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 45.03it/s, acc=0.813, loss=1.56]


Epoch: 24


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.86it/s, loss=1.32]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 47.38it/s, acc=0.794, loss=1.67]


Epoch: 25


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.64it/s, loss=1.32]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 46.70it/s, acc=0.762, loss=1.9]


Epoch: 26


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.94it/s, loss=1.32]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.57it/s, acc=0.836, loss=1.51]


Epoch: 27


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.42it/s, loss=1.31]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.77it/s, acc=0.836, loss=1.52]


Epoch: 28


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.91it/s, loss=1.3]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 44.43it/s, acc=0.766, loss=1.8]


Epoch: 29


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:13<00:00, 25.19it/s, loss=1.3]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.20it/s, acc=0.794, loss=1.71]


Epoch: 30


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.83it/s, loss=1.3]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 44.46it/s, acc=0.807, loss=1.62]


Epoch: 31


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.32it/s, loss=1.29]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.66it/s, acc=0.844, loss=1.5]


**Saving checkpoint**
Epoch: 32


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.17it/s, loss=1.3]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 44.61it/s, acc=0.774, loss=1.77]


Epoch: 33


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.20it/s, loss=1.29]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.49it/s, acc=0.833, loss=1.53]


Epoch: 34


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.46it/s, loss=1.28]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.14it/s, acc=0.781, loss=1.73]


Epoch: 35


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 25.11it/s, loss=1.28]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.13it/s, acc=0.835, loss=1.57]


Epoch: 36


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.24it/s, loss=1.28]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.79it/s, acc=0.796, loss=1.71]


Epoch: 37


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.84it/s, loss=1.28]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 46.02it/s, acc=0.81, loss=1.64]


Epoch: 38


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.22it/s, loss=1.27]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.61it/s, acc=0.824, loss=1.59]


Epoch: 39


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.96it/s, loss=1.27]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 44.94it/s, acc=0.807, loss=1.69]


Epoch: 40


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 25.02it/s, loss=1.27]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.60it/s, acc=0.845, loss=1.47]


**Saving checkpoint**
Epoch: 41


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.30it/s, loss=1.27]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.63it/s, acc=0.752, loss=1.98]


Epoch: 42


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.76it/s, loss=1.26]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.90it/s, acc=0.801, loss=1.62]


Epoch: 43


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:13<00:00, 25.47it/s, loss=1.26]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 44.37it/s, acc=0.816, loss=1.57]


Epoch: 44


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 23.41it/s, loss=1.25]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.04it/s, acc=0.833, loss=1.48]


Epoch: 45


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.61it/s, loss=1.26]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.54it/s, acc=0.852, loss=1.45]


**Saving checkpoint**
Epoch: 46


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.34it/s, loss=1.25]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.79it/s, acc=0.821, loss=1.53]


Epoch: 47


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.17it/s, loss=1.26]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 45.79it/s, acc=0.832, loss=1.5]


Epoch: 48


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.43it/s, loss=1.25]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.14it/s, acc=0.729, loss=1.93]


Epoch: 49


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 23.23it/s, loss=1.25]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.88it/s, acc=0.804, loss=1.64]


Epoch: 50


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:13<00:00, 25.98it/s, loss=1.25]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.26it/s, acc=0.815, loss=1.65]


Epoch: 51


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.21it/s, loss=1.25]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.99it/s, acc=0.833, loss=1.5]


Epoch: 52


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.24it/s, loss=1.24]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.03it/s, acc=0.807, loss=1.6]


Epoch: 53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.64it/s, loss=1.24]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.57it/s, acc=0.784, loss=1.7]


Epoch: 54


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.66it/s, loss=1.23]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.40it/s, acc=0.814, loss=1.62]


Epoch: 55


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.93it/s, loss=1.24]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.62it/s, acc=0.792, loss=1.66]


Epoch: 56


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.54it/s, loss=1.23]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.11it/s, acc=0.765, loss=1.78]


Epoch: 57


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.87it/s, loss=1.23]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.05it/s, acc=0.804, loss=1.67]


Epoch: 58


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 25.04it/s, loss=1.24]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.44it/s, acc=0.801, loss=1.64]


Epoch: 59


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.99it/s, loss=1.23]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.67it/s, acc=0.834, loss=1.55]


Epoch: 60


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.32it/s, loss=1.23]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.67it/s, acc=0.834, loss=1.49]


Epoch: 61


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.89it/s, loss=1]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.77it/s, acc=0.907, loss=1.07]


**Saving checkpoint**
Epoch: 62


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.75it/s, loss=0.946]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.20it/s, acc=0.894, loss=1.11]


Epoch: 63


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.72it/s, loss=0.931]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.06it/s, acc=0.897, loss=1.1]


Epoch: 64


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.34it/s, loss=0.919]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.89it/s, acc=0.903, loss=1.09]


Epoch: 65


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.49it/s, loss=0.913]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.15it/s, acc=0.909, loss=1.06]


**Saving checkpoint**
Epoch: 66


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.25it/s, loss=0.912]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.68it/s, acc=0.9, loss=1.06]


Epoch: 67


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.24it/s, loss=0.91]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.43it/s, acc=0.899, loss=1.11]


Epoch: 68


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.70it/s, loss=0.909]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 40.63it/s, acc=0.898, loss=1.1]


Epoch: 69


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.21it/s, loss=0.909]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 44.25it/s, acc=0.878, loss=1.17]


Epoch: 70


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.47it/s, loss=0.91]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.34it/s, acc=0.901, loss=1.11]


Epoch: 71


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.58it/s, loss=0.917]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.68it/s, acc=0.902, loss=1.1]


Epoch: 72


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.41it/s, loss=0.915]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.34it/s, acc=0.892, loss=1.13]


Epoch: 73


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.87it/s, loss=0.918]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.62it/s, acc=0.901, loss=1.12]


Epoch: 74


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:13<00:00, 25.18it/s, loss=0.917]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.48it/s, acc=0.893, loss=1.13]


Epoch: 75


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.05it/s, loss=0.923]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.38it/s, acc=0.9, loss=1.1]


Epoch: 76


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.93it/s, loss=0.927]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 45.55it/s, acc=0.887, loss=1.17]


Epoch: 77


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 25.01it/s, loss=0.923]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.66it/s, acc=0.881, loss=1.17]


Epoch: 78


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.49it/s, loss=0.92]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.42it/s, acc=0.899, loss=1.11]


Epoch: 79


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.23it/s, loss=0.926]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.78it/s, acc=0.893, loss=1.14]


Epoch: 80


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.39it/s, loss=0.931]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 46.03it/s, acc=0.888, loss=1.17]


Epoch: 81


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.81it/s, loss=0.923]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 46.61it/s, acc=0.891, loss=1.15]


Epoch: 82


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:13<00:00, 25.65it/s, loss=0.93]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.53it/s, acc=0.902, loss=1.09]


Epoch: 83


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.06it/s, loss=0.924]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.77it/s, acc=0.852, loss=1.33]


Epoch: 84


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.64it/s, loss=0.926]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.42it/s, acc=0.905, loss=1.11]


Epoch: 85


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.76it/s, loss=0.93]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 44.81it/s, acc=0.884, loss=1.22]


Epoch: 86


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 25.07it/s, loss=0.93]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.87it/s, acc=0.886, loss=1.16]


Epoch: 87


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.67it/s, loss=0.924]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.30it/s, acc=0.885, loss=1.18]


Epoch: 88


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.64it/s, loss=0.926]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.45it/s, acc=0.881, loss=1.21]


Epoch: 89


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.60it/s, loss=0.931]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.53it/s, acc=0.901, loss=1.13]


Epoch: 90


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.98it/s, loss=0.93]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.51it/s, acc=0.88, loss=1.2]


Epoch: 91


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.25it/s, loss=0.927]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.22it/s, acc=0.891, loss=1.15]


Epoch: 92


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.85it/s, loss=0.927]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 40.52it/s, acc=0.877, loss=1.19]


Epoch: 93


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.72it/s, loss=0.929]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.11it/s, acc=0.9, loss=1.08]


Epoch: 94


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.96it/s, loss=0.926]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 47.34it/s, acc=0.891, loss=1.15]


Epoch: 95


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.76it/s, loss=0.926]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.78it/s, acc=0.875, loss=1.23]


Epoch: 96


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.27it/s, loss=0.928]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 44.16it/s, acc=0.898, loss=1.11]


Epoch: 97


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.75it/s, loss=0.924]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 46.45it/s, acc=0.894, loss=1.17]


Epoch: 98


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.75it/s, loss=0.927]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.70it/s, acc=0.894, loss=1.13]


Epoch: 99


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.34it/s, loss=0.923]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.22it/s, acc=0.886, loss=1.17]


Epoch: 100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.94it/s, loss=0.925]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 47.39it/s, acc=0.89, loss=1.18]


Epoch: 101


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.32it/s, loss=0.92]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.28it/s, acc=0.901, loss=1.12]


Epoch: 102


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:13<00:00, 25.91it/s, loss=0.918]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.36it/s, acc=0.855, loss=1.32]


Epoch: 103


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.06it/s, loss=0.928]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.83it/s, acc=0.898, loss=1.12]


Epoch: 104


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 25.09it/s, loss=0.919]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.96it/s, acc=0.892, loss=1.15]


Epoch: 105


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.36it/s, loss=0.929]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.23it/s, acc=0.878, loss=1.22]


Epoch: 106


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.24it/s, loss=0.917]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.15it/s, acc=0.887, loss=1.17]


Epoch: 107


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.65it/s, loss=0.92]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.05it/s, acc=0.883, loss=1.19]


Epoch: 108


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.78it/s, loss=0.922]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.87it/s, acc=0.897, loss=1.12]


Epoch: 109


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.63it/s, loss=0.918]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.78it/s, acc=0.867, loss=1.26]


Epoch: 110


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.91it/s, loss=0.922]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.34it/s, acc=0.88, loss=1.2]


Epoch: 111


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.41it/s, loss=0.918]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 40.86it/s, acc=0.88, loss=1.2]


Epoch: 112


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.06it/s, loss=0.915]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 40.38it/s, acc=0.894, loss=1.15]


Epoch: 113


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.49it/s, loss=0.919]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.58it/s, acc=0.894, loss=1.16]


Epoch: 114


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.03it/s, loss=0.916]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.83it/s, acc=0.887, loss=1.16]


Epoch: 115


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.26it/s, loss=0.919]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.47it/s, acc=0.898, loss=1.09]


Epoch: 116


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 25.03it/s, loss=0.922]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.64it/s, acc=0.861, loss=1.37]


Epoch: 117


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:13<00:00, 25.36it/s, loss=0.915]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.52it/s, acc=0.902, loss=1.11]


Epoch: 118


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.62it/s, loss=0.912]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.13it/s, acc=0.881, loss=1.19]


Epoch: 119


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.28it/s, loss=0.919]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 40.66it/s, acc=0.896, loss=1.13]


Epoch: 120


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.67it/s, loss=0.916]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 46.24it/s, acc=0.899, loss=1.13]


Epoch: 121


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.60it/s, loss=0.8]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.58it/s, acc=0.924, loss=0.971]


**Saving checkpoint**
Epoch: 122


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:13<00:00, 25.79it/s, loss=0.77]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 44.22it/s, acc=0.922, loss=0.943]


Epoch: 123


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.84it/s, loss=0.758]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.34it/s, acc=0.922, loss=0.93]


Epoch: 124


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.62it/s, loss=0.752]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.30it/s, acc=0.919, loss=0.951]


Epoch: 125


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.58it/s, loss=0.747]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.44it/s, acc=0.921, loss=0.945]


Epoch: 126


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.36it/s, loss=0.742]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.27it/s, acc=0.92, loss=0.934]


Epoch: 127


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.48it/s, loss=0.741]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 47.30it/s, acc=0.919, loss=0.936]


Epoch: 128


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.52it/s, loss=0.737]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.63it/s, acc=0.922, loss=0.933]


Epoch: 129


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.37it/s, loss=0.732]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.96it/s, acc=0.924, loss=0.931]


**Saving checkpoint**
Epoch: 130


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 22.93it/s, loss=0.734]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.03it/s, acc=0.923, loss=0.943]


Epoch: 131


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.95it/s, loss=0.739]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.32it/s, acc=0.924, loss=0.932]


Epoch: 132


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.60it/s, loss=0.729]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 40.26it/s, acc=0.921, loss=0.931]


Epoch: 133


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.41it/s, loss=0.728]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.44it/s, acc=0.924, loss=0.929]


Epoch: 134


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:13<00:00, 25.49it/s, loss=0.729]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 45.70it/s, acc=0.921, loss=0.942]


Epoch: 135


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.28it/s, loss=0.728]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.68it/s, acc=0.921, loss=0.951]


Epoch: 136


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.67it/s, loss=0.725]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.55it/s, acc=0.923, loss=0.95]


Epoch: 137


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.45it/s, loss=0.728]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.61it/s, acc=0.922, loss=0.941]


Epoch: 138


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.59it/s, loss=0.726]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 44.12it/s, acc=0.922, loss=0.947]


Epoch: 139


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.79it/s, loss=0.729]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.39it/s, acc=0.924, loss=0.937]


Epoch: 140


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.50it/s, loss=0.726]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.27it/s, acc=0.918, loss=0.976]


Epoch: 141


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.25it/s, loss=0.729]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.90it/s, acc=0.918, loss=0.976]


Epoch: 142


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 22.85it/s, loss=0.726]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 40.95it/s, acc=0.923, loss=0.939]


Epoch: 143


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.72it/s, loss=0.726]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.41it/s, acc=0.919, loss=0.953]


Epoch: 144


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.47it/s, loss=0.726]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.49it/s, acc=0.924, loss=0.986]


Epoch: 145


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:13<00:00, 26.28it/s, loss=0.722]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 45.16it/s, acc=0.921, loss=0.951]


Epoch: 146


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.17it/s, loss=0.727]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 46.71it/s, acc=0.921, loss=0.947]


Epoch: 147


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.97it/s, loss=0.724]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.87it/s, acc=0.923, loss=0.95]


Epoch: 148


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.59it/s, loss=0.723]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.05it/s, acc=0.923, loss=0.976]


Epoch: 149


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.87it/s, loss=0.72]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.71it/s, acc=0.921, loss=0.956]


Epoch: 150


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.70it/s, loss=0.719]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 40.73it/s, acc=0.921, loss=0.96]


Epoch: 151


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.68it/s, loss=0.722]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 46.38it/s, acc=0.921, loss=0.965]


Epoch: 152


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.87it/s, loss=0.727]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.10it/s, acc=0.919, loss=0.976]


Epoch: 153


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.60it/s, loss=0.728]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.14it/s, acc=0.918, loss=0.964]


Epoch: 154


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.11it/s, loss=0.728]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 44.16it/s, acc=0.915, loss=0.992]


Epoch: 155


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.95it/s, loss=0.725]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.50it/s, acc=0.92, loss=0.98]


Epoch: 156


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.35it/s, loss=0.725]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.75it/s, acc=0.923, loss=0.941]


Epoch: 157


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 25.05it/s, loss=0.727]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.46it/s, acc=0.923, loss=0.948]


Epoch: 158


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.39it/s, loss=0.722]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.40it/s, acc=0.915, loss=0.963]


Epoch: 159


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 23.34it/s, loss=0.723]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.54it/s, acc=0.915, loss=0.994]


Epoch: 160


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.69it/s, loss=0.724]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.97it/s, acc=0.92, loss=0.97]


Epoch: 161


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.55it/s, loss=0.685]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.89it/s, acc=0.928, loss=0.903]


**Saving checkpoint**
Epoch: 162


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 25.04it/s, loss=0.678]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 47.06it/s, acc=0.928, loss=0.932]


**Saving checkpoint**
Epoch: 163


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 25.08it/s, loss=0.677]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.54it/s, acc=0.925, loss=0.905]


Epoch: 164


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.68it/s, loss=0.671]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 45.76it/s, acc=0.928, loss=0.908]


**Saving checkpoint**
Epoch: 165


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.85it/s, loss=0.675]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.66it/s, acc=0.926, loss=0.903]


Epoch: 166


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.26it/s, loss=0.673]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.59it/s, acc=0.927, loss=0.897]


Epoch: 167


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.34it/s, loss=0.669]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 45.65it/s, acc=0.927, loss=0.909]


Epoch: 168


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.14it/s, loss=0.669]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 45.65it/s, acc=0.923, loss=0.9]


Epoch: 169


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.13it/s, loss=0.67]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 40.62it/s, acc=0.926, loss=0.902]


Epoch: 170


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.70it/s, loss=0.669]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.30it/s, acc=0.927, loss=0.911]


Epoch: 171


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.69it/s, loss=0.666]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.87it/s, acc=0.926, loss=0.908]


Epoch: 172


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:13<00:00, 25.27it/s, loss=0.666]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.53it/s, acc=0.929, loss=0.91]


**Saving checkpoint**
Epoch: 173


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.51it/s, loss=0.664]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.95it/s, acc=0.927, loss=0.901]


Epoch: 174


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.69it/s, loss=0.666]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 47.27it/s, acc=0.927, loss=0.893]


Epoch: 175


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.70it/s, loss=0.667]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 45.59it/s, acc=0.928, loss=0.89]


Epoch: 176


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.29it/s, loss=0.663]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.74it/s, acc=0.927, loss=0.905]


Epoch: 177


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.94it/s, loss=0.664]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.02it/s, acc=0.929, loss=0.9]


Epoch: 178


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.81it/s, loss=0.662]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.29it/s, acc=0.928, loss=0.896]


Epoch: 179


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.11it/s, loss=0.665]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 46.97it/s, acc=0.927, loss=0.906]


Epoch: 180


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.84it/s, loss=0.663]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.30it/s, acc=0.928, loss=0.898]


Epoch: 181


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:13<00:00, 25.23it/s, loss=0.664]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.69it/s, acc=0.927, loss=0.909]


Epoch: 182


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.81it/s, loss=0.663]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.02it/s, acc=0.93, loss=0.91]


**Saving checkpoint**
Epoch: 183


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.51it/s, loss=0.663]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.18it/s, acc=0.928, loss=0.907]


Epoch: 184


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.54it/s, loss=0.664]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.15it/s, acc=0.925, loss=0.894]


Epoch: 185


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.10it/s, loss=0.66]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 40.81it/s, acc=0.926, loss=0.899]


Epoch: 186


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.89it/s, loss=0.664]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.68it/s, acc=0.926, loss=0.895]


Epoch: 187


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.86it/s, loss=0.661]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.95it/s, acc=0.926, loss=0.894]


Epoch: 188


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.94it/s, loss=0.661]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 43.98it/s, acc=0.926, loss=0.903]


Epoch: 189


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.10it/s, loss=0.66]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 40.78it/s, acc=0.927, loss=0.923]


Epoch: 190


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.74it/s, loss=0.66]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 47.46it/s, acc=0.926, loss=0.913]


Epoch: 191


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.75it/s, loss=0.66]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.06it/s, acc=0.927, loss=0.908]


Epoch: 192


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:13<00:00, 26.00it/s, loss=0.658]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 45.15it/s, acc=0.927, loss=0.904]


Epoch: 193


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.74it/s, loss=0.66]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.19it/s, acc=0.929, loss=0.909]


Epoch: 194


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.54it/s, loss=0.659]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.77it/s, acc=0.927, loss=0.897]


Epoch: 195


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.85it/s, loss=0.66]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.71it/s, acc=0.926, loss=0.896]


Epoch: 196


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.66it/s, loss=0.66]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 44.54it/s, acc=0.929, loss=0.907]


Epoch: 197


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 23.67it/s, loss=0.658]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 45.66it/s, acc=0.927, loss=0.891]


Epoch: 198


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 24.11it/s, loss=0.66]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.40it/s, acc=0.927, loss=0.905]


Epoch: 199


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:13<00:00, 25.23it/s, loss=0.659]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.81it/s, acc=0.928, loss=0.897]


Epoch: 200


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:14<00:00, 25.10it/s, loss=0.659]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.00it/s, acc=0.93, loss=0.899]


In [14]:
torch.save(student_model.state_dict(), './checkpoints/at_wrn16x1_last.pt')

In [22]:
student_model.load_state_dict(torch.load('./checkpoints/at_wrn16x1.pth')['state_dict'])

<All keys matched successfully>

In [23]:
preds = []
valid_labels = []
student_model.eval()
# Run the best model on test set
for step, (images, labels) in tqdm(enumerate(test_loader), total = len(test_loader)):

    images = images.to(device, dtype=torch.float)
    labels = labels.to(device)
    batch_size = labels.size(0)

    with torch.no_grad():
        y_preds = student_model(images)
        
    preds.append(y_preds.softmax(1).to('cpu').numpy())
    valid_labels.append(labels.to('cpu').numpy())

predictions = np.concatenate(preds)
valid_labels = np.concatenate(valid_labels)

# Get the score
score = accuracy_score(valid_labels, predictions.argmax(1))

100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 62.02it/s]


In [24]:
score

0.9202