In [39]:
from trailmet.algorithms.distill.attention_transfer import AttentionTransfer
import torch
import torchvision
import torch.nn as nn
from torchvision import transforms
from torch.utils.data import DataLoader

from tqdm import tqdm
from sklearn.metrics import accuracy_score
import numpy as np

# Dataset

In [40]:
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

In [41]:
transform_train = transforms.Compose(
                [
                    transforms.ToTensor(),
                    transforms.Pad(4, padding_mode='reflect'),
                    transforms.RandomHorizontalFlip(p=0.5),
                    transforms.RandomCrop(32),
                    transforms.Normalize((0.4914, 0.4822, 0.4465), (0.247, 0.243, 0.261))
                ]
            )

transform_test = transforms.Compose(
                [
                    transforms.ToTensor(),
                    transforms.Normalize((0.4914, 0.4822, 0.4465), (0.247, 0.243, 0.261))
                ]
            )

transforms1 = {
    'train': transform_train, 
    'val': transform_test, 
    'test': transform_test}

target_transforms = {
    'train': None, 
    'val': None, 
    'test': None}

In [42]:
from trailmet.datasets.classification import DatasetFactory

cifar_dataset = DatasetFactory.create_dataset(name = 'CIFAR10', 
                                        root = "./data",
                                        split_types = ['train', 'val', 'test'],
                                        val_fraction = 0.1,
                                        transform = transforms1,
                                        target_transform = target_transforms,
                                        random_seed=42
                                        )

Files already downloaded and verified
Files already downloaded and verified
Files already downloaded and verified


In [43]:
train_loader = torch.utils.data.DataLoader(
        cifar_dataset['train_dataset'], batch_size=128, 
        sampler=cifar_dataset['train_sampler'],
        num_workers=2
    )

val_loader = torch.utils.data.DataLoader(
        cifar_dataset['val_dataset'], batch_size=128, 
        sampler=cifar_dataset['val_sampler'],
        num_workers=2
    )

test_loader = torch.utils.data.DataLoader(
        cifar_dataset['test_dataset'], batch_size=128, 
        sampler=cifar_dataset['test_sampler'],
        num_workers=2
    )

In [44]:
dataloaders = {'train':train_loader, 'val':val_loader, 'test':test_loader}

# Model

In [45]:
import torch
import torch.nn as nn
import torch.nn.functional as F

class BasicBlock(nn.Module):
    def __init__(self, in_planes, out_planes, stride, dropRate=0.0):
        super(BasicBlock, self).__init__()
        self.bn1 = nn.BatchNorm2d(in_planes)
        self.relu1 = nn.ReLU(inplace=True)
        self.conv1 = nn.Conv2d(in_planes, out_planes, kernel_size=3, stride=stride,
                               padding=1, bias=False)
        self.bn2 = nn.BatchNorm2d(out_planes)
        self.relu2 = nn.ReLU(inplace=True)
        self.conv2 = nn.Conv2d(out_planes, out_planes, kernel_size=3, stride=1,
                               padding=1, bias=False)
        self.droprate = dropRate
        self.equalInOut = (in_planes == out_planes)
        self.convShortcut = (not self.equalInOut) and nn.Conv2d(in_planes, out_planes, kernel_size=1, stride=stride,
                               padding=0, bias=False) or None
    def forward(self, x):
        if not self.equalInOut:
            x = self.relu1(self.bn1(x))
        else:
            out = self.relu1(self.bn1(x))
        out = self.relu2(self.bn2(self.conv1(out if self.equalInOut else x)))
        if self.droprate > 0:
            out = F.dropout(out, p=self.droprate, training=self.training)
        out = self.conv2(out)
        return torch.add(x if self.equalInOut else self.convShortcut(x), out)

class NetworkBlock(nn.Module):
    def __init__(self, nb_layers, in_planes, out_planes, block, stride, dropRate=0.0):
        super(NetworkBlock, self).__init__()
        self.layer = self._make_layer(block, in_planes, out_planes, nb_layers, stride, dropRate)
    def _make_layer(self, block, in_planes, out_planes, nb_layers, stride, dropRate):
        layers = []
        for i in range(int(nb_layers)):
            layers.append(block(i == 0 and in_planes or out_planes, out_planes, i == 0 and stride or 1, dropRate))
        return nn.Sequential(*layers)
    def forward(self, x):
        return self.layer(x)

class WideResNet(nn.Module):
    def __init__(self, depth, num_classes, widen_factor=1, dropRate=0.0):
        super(WideResNet, self).__init__()
        nChannels = [16, 16*widen_factor, 32*widen_factor, 64*widen_factor]
        assert((depth - 4) % 6 == 0)
        n = (depth - 4) / 6
        block = BasicBlock
        # 1st conv before any network block
        self.conv1 = nn.Conv2d(3, nChannels[0], kernel_size=3, stride=1,
                               padding=1, bias=False)
        # 1st block
        self.block1 = NetworkBlock(n, nChannels[0], nChannels[1], block, 1, dropRate)
        # 2nd block
        self.block2 = NetworkBlock(n, nChannels[1], nChannels[2], block, 2, dropRate)
        # 3rd block
        self.block3 = NetworkBlock(n, nChannels[2], nChannels[3], block, 2, dropRate)
        # global average pooling and classifier
        self.bn1 = nn.BatchNorm2d(nChannels[3])
        self.relu = nn.ReLU(inplace=True)
        self.fc = nn.Linear(nChannels[3], num_classes)
        self.nChannels = nChannels[3]

        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu')
            elif isinstance(m, nn.BatchNorm2d):
                m.weight.data.fill_(1)
                m.bias.data.zero_()
            elif isinstance(m, nn.Linear):
                m.bias.data.zero_()
    def forward(self, x):
        out = self.conv1(x)
        out1 = self.block1(out)
        out2 = self.block2(out1)
        out3 = self.block3(out2)
        out = self.relu(self.bn1(out3))
        out = F.avg_pool2d(out, 8)
        out = out.view(-1, self.nChannels)

        return self.fc(out)


def make_wideresnet(depth, widen_factor, num_classes, dropRate=0.0):
    """Creates and returns the requested model

    Parameters
    ----------
    depth : int
    widen_factor : int
    num_classes : int
    dropRate : float, optional

    Returns
    -------
    WideResNet model

    """
    model = WideResNet(depth, num_classes, widen_factor, dropRate)
    return model

In [46]:
teacher_model = make_wideresnet(16, 2, 10)
student_model = make_wideresnet(16, 1, 10)

teacher_model.to(device)
student_model.to(device)

WideResNet(
  (conv1): Conv2d(3, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
  (block1): NetworkBlock(
    (layer): Sequential(
      (0): BasicBlock(
        (bn1): BatchNorm2d(16, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (relu1): ReLU(inplace=True)
        (conv1): Conv2d(16, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
        (bn2): BatchNorm2d(16, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (relu2): ReLU(inplace=True)
        (conv2): Conv2d(16, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      )
      (1): BasicBlock(
        (bn1): BatchNorm2d(16, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (relu1): ReLU(inplace=True)
        (conv1): Conv2d(16, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
        (bn2): BatchNorm2d(16, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (relu2): ReLU(

In [47]:
teacher_model.load_state_dict(torch.load('./wrn-16-2-(94.02).pt'))

<All keys matched successfully>

In [48]:
kwargs = {
    'DISTILL_ARGS' : {
        'BETA':1000,
        'EPOCHS':200,
        'LR':0.1,
        'WEIGHT_DECAY':0.0005,
        'TEACHER_LAYER_NAMES':['block1', 'block2', 'block3'],
        'STUDENT_LAYER_NAMES':['block1', 'block2', 'block3'],
    },
    'DEVICE' : device,
    'log_dir' : 'at_wrn16x1'
}

In [49]:
box = AttentionTransfer(teacher_model, student_model, dataloaders, **kwargs)

In [50]:
box.compress_model()

=====TRAINING STUDENT NETWORK=====
Epoch: 1


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.63it/s, loss=3.33]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.25it/s, acc=0.589, loss=2.73]


**Saving checkpoint**
Epoch: 2


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.91it/s, loss=2.41]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.35it/s, acc=0.706, loss=2.36]


**Saving checkpoint**
Epoch: 3


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.27it/s, loss=2.09]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.33it/s, acc=0.687, loss=2.32]


Epoch: 4


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.13it/s, loss=1.91]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 34.79it/s, acc=0.773, loss=1.97]


**Saving checkpoint**
Epoch: 5


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.83it/s, loss=1.79]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 36.17it/s, acc=0.677, loss=2.29]


Epoch: 6


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.53it/s, loss=1.7]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.75it/s, acc=0.803, loss=1.78]


**Saving checkpoint**
Epoch: 7


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 22.15it/s, loss=1.64]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 32.78it/s, acc=0.766, loss=1.87]


Epoch: 8


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.45it/s, loss=1.58]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.46it/s, acc=0.801, loss=1.77]


Epoch: 9


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.70it/s, loss=1.55]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 40.87it/s, acc=0.767, loss=1.89]


Epoch: 10


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.59it/s, loss=1.51]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.03it/s, acc=0.767, loss=1.86]


Epoch: 11


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.55it/s, loss=1.49]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.80it/s, acc=0.788, loss=1.86]


Epoch: 12


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.52it/s, loss=1.46]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 35.86it/s, acc=0.777, loss=1.8]


Epoch: 13


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.55it/s, loss=1.45]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.40it/s, acc=0.772, loss=1.83]


Epoch: 14


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.94it/s, loss=1.43]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.46it/s, acc=0.75, loss=1.92]


Epoch: 15


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.49it/s, loss=1.42]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.60it/s, acc=0.817, loss=1.65]


**Saving checkpoint**
Epoch: 16


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.58it/s, loss=1.39]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.88it/s, acc=0.719, loss=2]


Epoch: 17


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.80it/s, loss=1.39]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.97it/s, acc=0.809, loss=1.64]


Epoch: 18


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.76it/s, loss=1.38]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.02it/s, acc=0.75, loss=1.86]


Epoch: 19


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.02it/s, loss=1.37]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.15it/s, acc=0.831, loss=1.58]


**Saving checkpoint**
Epoch: 20


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.81it/s, loss=1.37]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.44it/s, acc=0.826, loss=1.67]


Epoch: 21


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.38it/s, loss=1.36]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.77it/s, acc=0.791, loss=1.74]


Epoch: 22


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.22it/s, loss=1.34]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.73it/s, acc=0.822, loss=1.56]


Epoch: 23


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.67it/s, loss=1.34]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.54it/s, acc=0.805, loss=1.7]


Epoch: 24


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.51it/s, loss=1.34]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.69it/s, acc=0.791, loss=1.7]


Epoch: 25


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.36it/s, loss=1.33]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.41it/s, acc=0.832, loss=1.55]


**Saving checkpoint**
Epoch: 26


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.19it/s, loss=1.32]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.73it/s, acc=0.813, loss=1.6]


Epoch: 27


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.23it/s, loss=1.32]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.95it/s, acc=0.778, loss=1.77]


Epoch: 28


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.33it/s, loss=1.32]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.15it/s, acc=0.826, loss=1.52]


Epoch: 29


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.78it/s, loss=1.31]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.87it/s, acc=0.828, loss=1.53]


Epoch: 30


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.46it/s, loss=1.3]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.14it/s, acc=0.821, loss=1.6]


Epoch: 31


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.64it/s, loss=1.3]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 36.85it/s, acc=0.829, loss=1.61]


Epoch: 32


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.69it/s, loss=1.3]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 42.01it/s, acc=0.83, loss=1.58]


Epoch: 33


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.30it/s, loss=1.3]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.42it/s, acc=0.849, loss=1.49]


**Saving checkpoint**
Epoch: 34


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.32it/s, loss=1.29]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.73it/s, acc=0.819, loss=1.61]


Epoch: 35


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 22.00it/s, loss=1.29]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 34.25it/s, acc=0.796, loss=1.7]


Epoch: 36


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.35it/s, loss=1.29]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.83it/s, acc=0.806, loss=1.7]


Epoch: 37


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.55it/s, loss=1.28]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.16it/s, acc=0.79, loss=1.66]


Epoch: 38


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.39it/s, loss=1.28]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.21it/s, acc=0.781, loss=1.75]


Epoch: 39


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.04it/s, loss=1.28]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.01it/s, acc=0.819, loss=1.6]


Epoch: 40


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.80it/s, loss=1.28]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.08it/s, acc=0.836, loss=1.52]


Epoch: 41


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.36it/s, loss=1.28]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 35.90it/s, acc=0.824, loss=1.57]


Epoch: 42


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.54it/s, loss=1.28]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 36.65it/s, acc=0.766, loss=1.92]


Epoch: 43


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.15it/s, loss=1.27]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.75it/s, acc=0.821, loss=1.52]


Epoch: 44


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.28it/s, loss=1.26]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 36.75it/s, acc=0.852, loss=1.42]


**Saving checkpoint**
Epoch: 45


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.18it/s, loss=1.27]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.96it/s, acc=0.785, loss=1.8]


Epoch: 46


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:13<00:00, 26.13it/s, loss=1.27]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 36.72it/s, acc=0.846, loss=1.51]


Epoch: 47


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 22.09it/s, loss=1.26]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.31it/s, acc=0.831, loss=1.54]


Epoch: 48


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.82it/s, loss=1.27]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 36.76it/s, acc=0.822, loss=1.57]


Epoch: 49


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.67it/s, loss=1.26]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 36.34it/s, acc=0.867, loss=1.4]


**Saving checkpoint**
Epoch: 50


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.74it/s, loss=1.26]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 33.97it/s, acc=0.822, loss=1.57]


Epoch: 51


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.79it/s, loss=1.26]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.06it/s, acc=0.802, loss=1.73]


Epoch: 52


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.52it/s, loss=1.26]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.33it/s, acc=0.833, loss=1.58]


Epoch: 53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.47it/s, loss=1.25]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.19it/s, acc=0.842, loss=1.49]


Epoch: 54


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.04it/s, loss=1.24]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.32it/s, acc=0.849, loss=1.43]


Epoch: 55


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.74it/s, loss=1.25]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.18it/s, acc=0.825, loss=1.55]


Epoch: 56


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.42it/s, loss=1.26]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.90it/s, acc=0.838, loss=1.53]


Epoch: 57


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.92it/s, loss=1.25]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.28it/s, acc=0.814, loss=1.63]


Epoch: 58


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.44it/s, loss=1.25]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.86it/s, acc=0.808, loss=1.62]


Epoch: 59


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.30it/s, loss=1.25]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.18it/s, acc=0.824, loss=1.59]


Epoch: 60


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.62it/s, loss=1.25]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.77it/s, acc=0.816, loss=1.59]


Epoch: 61


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.00it/s, loss=1.02]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.72it/s, acc=0.891, loss=1.12]


**Saving checkpoint**
Epoch: 62


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.95it/s, loss=0.96]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.49it/s, acc=0.904, loss=1.08]


**Saving checkpoint**
Epoch: 63


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.52it/s, loss=0.944]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 36.44it/s, acc=0.907, loss=1.06]


**Saving checkpoint**
Epoch: 64


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.44it/s, loss=0.934]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.37it/s, acc=0.907, loss=1.04]


Epoch: 65


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 22.08it/s, loss=0.928]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.67it/s, acc=0.901, loss=1.08]


Epoch: 66


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.66it/s, loss=0.929]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 35.53it/s, acc=0.905, loss=1.08]


Epoch: 67


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.66it/s, loss=0.924]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.87it/s, acc=0.9, loss=1.08]


Epoch: 68


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 22.00it/s, loss=0.924]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.92it/s, acc=0.902, loss=1.09]


Epoch: 69


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.40it/s, loss=0.923]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 36.28it/s, acc=0.909, loss=1.07]


**Saving checkpoint**
Epoch: 70


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.50it/s, loss=0.923]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 36.53it/s, acc=0.892, loss=1.15]


Epoch: 71


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.12it/s, loss=0.927]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.51it/s, acc=0.897, loss=1.1]


Epoch: 72


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.53it/s, loss=0.932]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 36.05it/s, acc=0.88, loss=1.24]


Epoch: 73


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.57it/s, loss=0.93]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.99it/s, acc=0.888, loss=1.16]


Epoch: 74


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.25it/s, loss=0.934]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.32it/s, acc=0.894, loss=1.12]


Epoch: 75


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.52it/s, loss=0.934]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.22it/s, acc=0.889, loss=1.18]


Epoch: 76


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.66it/s, loss=0.933]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 40.12it/s, acc=0.879, loss=1.18]


Epoch: 77


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.30it/s, loss=0.937]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.32it/s, acc=0.894, loss=1.16]


Epoch: 78


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.74it/s, loss=0.934]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 35.78it/s, acc=0.875, loss=1.23]


Epoch: 79


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.81it/s, loss=0.94]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 40.27it/s, acc=0.898, loss=1.14]


Epoch: 80


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.43it/s, loss=0.943]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 40.48it/s, acc=0.896, loss=1.13]


Epoch: 81


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.97it/s, loss=0.937]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 40.56it/s, acc=0.898, loss=1.13]


Epoch: 82


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.87it/s, loss=0.937]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 40.01it/s, acc=0.887, loss=1.16]


Epoch: 83


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.84it/s, loss=0.934]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 36.05it/s, acc=0.887, loss=1.17]


Epoch: 84


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 22.04it/s, loss=0.936]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.30it/s, acc=0.893, loss=1.14]


Epoch: 85


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.30it/s, loss=0.936]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.00it/s, acc=0.895, loss=1.14]


Epoch: 86


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.93it/s, loss=0.942]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.37it/s, acc=0.888, loss=1.2]


Epoch: 87


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.69it/s, loss=0.94]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 36.05it/s, acc=0.891, loss=1.17]


Epoch: 88


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 22.55it/s, loss=0.94]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.38it/s, acc=0.886, loss=1.19]


Epoch: 89


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 20.95it/s, loss=0.941]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.85it/s, acc=0.894, loss=1.17]


Epoch: 90


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.28it/s, loss=0.942]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.92it/s, acc=0.884, loss=1.17]


Epoch: 91


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 22.01it/s, loss=0.943]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.49it/s, acc=0.873, loss=1.27]


Epoch: 92


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.53it/s, loss=0.939]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.37it/s, acc=0.868, loss=1.25]


Epoch: 93


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.57it/s, loss=0.939]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.95it/s, acc=0.872, loss=1.23]


Epoch: 94


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.65it/s, loss=0.937]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.18it/s, acc=0.894, loss=1.14]


Epoch: 95


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.54it/s, loss=0.944]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.92it/s, acc=0.9, loss=1.1]


Epoch: 96


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.77it/s, loss=0.942]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.89it/s, acc=0.9, loss=1.12]


Epoch: 97


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.30it/s, loss=0.94]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.16it/s, acc=0.896, loss=1.11]


Epoch: 98


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.45it/s, loss=0.933]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.97it/s, acc=0.886, loss=1.16]


Epoch: 99


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 20.88it/s, loss=0.941]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.11it/s, acc=0.885, loss=1.18]


Epoch: 100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.55it/s, loss=0.937]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.71it/s, acc=0.89, loss=1.14]


Epoch: 101


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.22it/s, loss=0.936]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.27it/s, acc=0.897, loss=1.14]


Epoch: 102


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.45it/s, loss=0.933]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.06it/s, acc=0.88, loss=1.24]


Epoch: 103


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.41it/s, loss=0.934]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.24it/s, acc=0.893, loss=1.16]


Epoch: 104


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.44it/s, loss=0.933]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 33.55it/s, acc=0.885, loss=1.2]


Epoch: 105


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.09it/s, loss=0.931]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 40.16it/s, acc=0.897, loss=1.15]


Epoch: 106


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 22.09it/s, loss=0.936]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 36.64it/s, acc=0.899, loss=1.12]


Epoch: 107


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.73it/s, loss=0.932]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.90it/s, acc=0.903, loss=1.1]


Epoch: 108


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.87it/s, loss=0.934]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 34.77it/s, acc=0.887, loss=1.18]


Epoch: 109


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.81it/s, loss=0.932]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.17it/s, acc=0.891, loss=1.17]


Epoch: 110


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.22it/s, loss=0.924]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.17it/s, acc=0.891, loss=1.16]


Epoch: 111


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.66it/s, loss=0.933]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.10it/s, acc=0.882, loss=1.19]


Epoch: 112


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.36it/s, loss=0.927]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 36.73it/s, acc=0.892, loss=1.13]


Epoch: 113


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.86it/s, loss=0.932]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.76it/s, acc=0.889, loss=1.21]


Epoch: 114


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 20.92it/s, loss=0.932]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.46it/s, acc=0.888, loss=1.16]


Epoch: 115


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.95it/s, loss=0.934]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 40.05it/s, acc=0.873, loss=1.24]


Epoch: 116


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.68it/s, loss=0.928]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.08it/s, acc=0.902, loss=1.09]


Epoch: 117


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.15it/s, loss=0.926]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.94it/s, acc=0.877, loss=1.21]


Epoch: 118


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.09it/s, loss=0.931]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 35.06it/s, acc=0.894, loss=1.16]


Epoch: 119


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.80it/s, loss=0.932]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.63it/s, acc=0.902, loss=1.12]


Epoch: 120


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.30it/s, loss=0.919]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.00it/s, acc=0.898, loss=1.14]


Epoch: 121


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.96it/s, loss=0.807]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 36.99it/s, acc=0.921, loss=0.949]


**Saving checkpoint**
Epoch: 122


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.09it/s, loss=0.778]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.54it/s, acc=0.915, loss=0.962]


Epoch: 123


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.15it/s, loss=0.767]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.78it/s, acc=0.921, loss=0.939]


**Saving checkpoint**
Epoch: 124


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.77it/s, loss=0.76]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.66it/s, acc=0.921, loss=0.93]


Epoch: 125


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.77it/s, loss=0.757]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 36.63it/s, acc=0.92, loss=0.951]


Epoch: 126


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.96it/s, loss=0.753]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.19it/s, acc=0.917, loss=0.934]


Epoch: 127


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.49it/s, loss=0.751]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.07it/s, acc=0.924, loss=0.934]


**Saving checkpoint**
Epoch: 128


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 22.09it/s, loss=0.75]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.46it/s, acc=0.916, loss=0.947]


Epoch: 129


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.93it/s, loss=0.745]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.26it/s, acc=0.922, loss=0.952]


Epoch: 130


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.61it/s, loss=0.745]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.65it/s, acc=0.916, loss=0.954]


Epoch: 131


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.31it/s, loss=0.745]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.92it/s, acc=0.917, loss=0.938]


Epoch: 132


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.80it/s, loss=0.745]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.11it/s, acc=0.92, loss=0.936]


Epoch: 133


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.74it/s, loss=0.741]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.06it/s, acc=0.919, loss=0.948]


Epoch: 134


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.81it/s, loss=0.743]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.24it/s, acc=0.92, loss=0.934]


Epoch: 135


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.56it/s, loss=0.74]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.45it/s, acc=0.915, loss=0.967]


Epoch: 136


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.32it/s, loss=0.737]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.11it/s, acc=0.921, loss=0.96]


Epoch: 137


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.68it/s, loss=0.739]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 35.15it/s, acc=0.921, loss=0.944]


Epoch: 138


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.38it/s, loss=0.739]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.01it/s, acc=0.917, loss=0.973]


Epoch: 139


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.46it/s, loss=0.736]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.36it/s, acc=0.921, loss=0.943]


Epoch: 140


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.84it/s, loss=0.739]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.90it/s, acc=0.917, loss=0.968]


Epoch: 141


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.54it/s, loss=0.741]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 34.91it/s, acc=0.918, loss=0.953]


Epoch: 142


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.48it/s, loss=0.737]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.90it/s, acc=0.918, loss=0.94]


Epoch: 143


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.14it/s, loss=0.732]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 35.42it/s, acc=0.92, loss=0.955]


Epoch: 144


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.68it/s, loss=0.739]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.12it/s, acc=0.916, loss=0.966]


Epoch: 145


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.87it/s, loss=0.738]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.39it/s, acc=0.919, loss=0.95]


Epoch: 146


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.61it/s, loss=0.736]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.59it/s, acc=0.917, loss=0.965]


Epoch: 147


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.87it/s, loss=0.737]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.26it/s, acc=0.92, loss=0.941]


Epoch: 148


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 20.84it/s, loss=0.736]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.00it/s, acc=0.919, loss=0.948]


Epoch: 149


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.66it/s, loss=0.735]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 33.85it/s, acc=0.918, loss=0.949]


Epoch: 150


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.72it/s, loss=0.739]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.26it/s, acc=0.92, loss=0.943]


Epoch: 151


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.44it/s, loss=0.733]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.04it/s, acc=0.911, loss=0.991]


Epoch: 152


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.50it/s, loss=0.732]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 36.45it/s, acc=0.914, loss=0.986]


Epoch: 153


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.52it/s, loss=0.74]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.14it/s, acc=0.912, loss=0.973]


Epoch: 154


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.38it/s, loss=0.735]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.30it/s, acc=0.917, loss=0.963]


Epoch: 155


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.28it/s, loss=0.735]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.83it/s, acc=0.92, loss=0.968]


Epoch: 156


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.44it/s, loss=0.74]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.58it/s, acc=0.92, loss=0.939]


Epoch: 157


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.50it/s, loss=0.738]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.94it/s, acc=0.914, loss=0.969]


Epoch: 158


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.71it/s, loss=0.737]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.87it/s, acc=0.914, loss=0.954]


Epoch: 159


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.82it/s, loss=0.735]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.29it/s, acc=0.918, loss=0.944]


Epoch: 160


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.42it/s, loss=0.738]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.94it/s, acc=0.922, loss=0.959]


Epoch: 161


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.51it/s, loss=0.698]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.71it/s, acc=0.923, loss=0.914]


Epoch: 162


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.98it/s, loss=0.687]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 36.47it/s, acc=0.927, loss=0.908]


**Saving checkpoint**
Epoch: 163


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 20.84it/s, loss=0.685]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 34.61it/s, acc=0.926, loss=0.932]


Epoch: 164


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.29it/s, loss=0.682]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 32.54it/s, acc=0.926, loss=0.904]


Epoch: 165


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.51it/s, loss=0.681]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.71it/s, acc=0.926, loss=0.901]


Epoch: 166


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.02it/s, loss=0.679]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.65it/s, acc=0.927, loss=0.897]


Epoch: 167


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.81it/s, loss=0.68]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.48it/s, acc=0.925, loss=0.93]


Epoch: 168


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.57it/s, loss=0.681]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.05it/s, acc=0.925, loss=0.913]


Epoch: 169


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 22.05it/s, loss=0.68]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.69it/s, acc=0.926, loss=0.904]


Epoch: 170


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.47it/s, loss=0.677]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.51it/s, acc=0.926, loss=0.903]


Epoch: 171


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.62it/s, loss=0.675]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.98it/s, acc=0.923, loss=0.903]


Epoch: 172


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.60it/s, loss=0.675]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.69it/s, acc=0.925, loss=0.911]


Epoch: 173


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 22.51it/s, loss=0.676]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.07it/s, acc=0.925, loss=0.909]


Epoch: 174


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.63it/s, loss=0.679]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.15it/s, acc=0.925, loss=0.901]


Epoch: 175


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.34it/s, loss=0.677]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.79it/s, acc=0.926, loss=0.895]


Epoch: 176


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.73it/s, loss=0.675]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 35.10it/s, acc=0.926, loss=0.908]


Epoch: 177


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.52it/s, loss=0.675]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 33.53it/s, acc=0.924, loss=0.906]


Epoch: 178


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.30it/s, loss=0.675]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 35.27it/s, acc=0.925, loss=0.903]


Epoch: 179


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.86it/s, loss=0.676]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.46it/s, acc=0.925, loss=0.911]


Epoch: 180


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.30it/s, loss=0.674]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.20it/s, acc=0.924, loss=0.906]


Epoch: 181


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 22.33it/s, loss=0.673]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.25it/s, acc=0.924, loss=0.904]


Epoch: 182


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.71it/s, loss=0.675]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:00<00:00, 41.18it/s, acc=0.923, loss=0.92]


Epoch: 183


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.70it/s, loss=0.67]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 34.23it/s, acc=0.925, loss=0.921]


Epoch: 184


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.49it/s, loss=0.674]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.85it/s, acc=0.925, loss=0.918]


Epoch: 185


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.70it/s, loss=0.673]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.14it/s, acc=0.925, loss=0.916]


Epoch: 186


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.37it/s, loss=0.67]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 36.66it/s, acc=0.923, loss=0.917]


Epoch: 187


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.43it/s, loss=0.673]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.79it/s, acc=0.923, loss=0.906]


Epoch: 188


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.68it/s, loss=0.672]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 35.37it/s, acc=0.926, loss=0.904]


Epoch: 189


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 22.15it/s, loss=0.672]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 36.07it/s, acc=0.926, loss=0.911]


Epoch: 190


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.88it/s, loss=0.668]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.66it/s, acc=0.925, loss=0.905]


Epoch: 191


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.27it/s, loss=0.668]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.66it/s, acc=0.925, loss=0.911]


Epoch: 192


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.83it/s, loss=0.669]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 35.93it/s, acc=0.925, loss=0.916]


Epoch: 193


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.87it/s, loss=0.67]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.17it/s, acc=0.925, loss=0.901]


Epoch: 194


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.36it/s, loss=0.671]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.23it/s, acc=0.921, loss=0.914]


Epoch: 195


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.50it/s, loss=0.67]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.71it/s, acc=0.926, loss=0.9]


Epoch: 196


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.29it/s, loss=0.672]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.89it/s, acc=0.925, loss=0.92]


Epoch: 197


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.77it/s, loss=0.67]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.12it/s, acc=0.927, loss=0.912]


Epoch: 198


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.50it/s, loss=0.671]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 39.56it/s, acc=0.924, loss=0.909]


Epoch: 199


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 22.16it/s, loss=0.669]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 37.72it/s, acc=0.924, loss=0.908]


Epoch: 200


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.77it/s, loss=0.669]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 38.24it/s, acc=0.925, loss=0.904]


In [48]:
student_model.load_state_dict(torch.load('./checkpoints/at_wrn16x1.pth')['state_dict'])

<All keys matched successfully>

In [51]:
preds = []
valid_labels = []
student_model.eval()
# Run the best model on test set
for step, (images, labels) in tqdm(enumerate(test_loader), total = len(test_loader)):

    images = images.to(device, dtype=torch.float)
    labels = labels.to(device)
    batch_size = labels.size(0)

    with torch.no_grad():
        y_preds = student_model(images)
        
    preds.append(y_preds.softmax(1).to('cpu').numpy())
    valid_labels.append(labels.to('cpu').numpy())

predictions = np.concatenate(preds)
valid_labels = np.concatenate(valid_labels)

# Get the score
score = accuracy_score(valid_labels, predictions.argmax(1))

100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 52.71it/s]


In [52]:
score

0.9207