In [1]:
from trailmet.algorithms.distill.factor_transfer import FactorTransfer, Paraphraser
import torch
import torchvision
import torch.nn as nn
from torchvision import transforms
from torch.utils.data import Dataset, DataLoader

from tqdm import tqdm
from sklearn.metrics import accuracy_score
import numpy as np

# Dataset

In [2]:
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

In [3]:
transform_train = transforms.Compose(
                [
                    transforms.ToTensor(),
                    transforms.Pad(4, padding_mode='reflect'),
                    transforms.RandomHorizontalFlip(p=0.5),
                    transforms.RandomCrop(32),
                    transforms.Normalize((0.4914, 0.4822, 0.4465), (0.247, 0.243, 0.261))
                ]
            )

transform_train_paraphraser = transforms.Compose(
                [
                    transforms.ToTensor(),
                    transforms.RandomCrop(32, padding=4),
                    transforms.RandomHorizontalFlip(),
                    transforms.Normalize((0.4914, 0.4822, 0.4465), (0.247, 0.243, 0.261))
                ]
            )

transform_test = transforms.Compose(
                [
                    transforms.ToTensor(),
                    transforms.Normalize((0.4914, 0.4822, 0.4465), (0.247, 0.243, 0.261))
                ]
            )

transforms1 = {
    'train': transform_train, 
    'val': transform_test, 
    'test': transform_test}

target_transforms = {
    'train': None, 
    'val': None, 
    'test': None}

In [4]:
from trailmet.datasets.classification import DatasetFactory

cifar_dataset = DatasetFactory.create_dataset(name = 'CIFAR10', 
                                        root = "./data",
                                        split_types = ['train', 'val', 'test'],
                                        val_fraction = 0.1,
                                        transform = transforms1,
                                        target_transform = target_transforms,
                                        random_seed=27
                                        )

Files already downloaded and verified
Files already downloaded and verified
Files already downloaded and verified


In [5]:
train_loader = torch.utils.data.DataLoader(
        cifar_dataset['train_dataset'], batch_size=128, 
        sampler=cifar_dataset['train_sampler'],
        num_workers=2
    )

val_loader = torch.utils.data.DataLoader(
        cifar_dataset['val_dataset'], batch_size=128, 
        sampler=cifar_dataset['val_sampler'],
        num_workers=2
    )

test_loader = torch.utils.data.DataLoader(
        cifar_dataset['test_dataset'], batch_size=128, 
        sampler=cifar_dataset['test_sampler'],
        num_workers=2
    )

In [6]:
dataloaders = {'train':train_loader, 'val':val_loader, 'test':test_loader}

In [7]:
transforms1 = {
    'train': transform_train_paraphraser, 
    'val': transform_test, 
    'test': transform_test}

In [8]:
cifar_dataset = DatasetFactory.create_dataset(name = 'CIFAR10', 
                                        root = "./data",
                                        split_types = ['train', 'val'],
                                        val_fraction = 0.1,
                                        transform = transforms1,
                                        target_transform = target_transforms,
                                        random_seed=27
                                        )

Files already downloaded and verified
Files already downloaded and verified


In [9]:
train_loader = torch.utils.data.DataLoader(
        cifar_dataset['train_dataset'], batch_size=128, 
        sampler=cifar_dataset['train_sampler'],
        num_workers=2
    )

val_loader = torch.utils.data.DataLoader(
        cifar_dataset['val_dataset'], batch_size=128, 
        sampler=cifar_dataset['val_sampler'],
        num_workers=2
    )

In [10]:
#dataloaders['paraphraser'] = {'train':train_loader, 'val':val_loader}

# Model

In [7]:
import torch
import torch.nn as nn
import torch.nn.functional as F

from torch.autograd import Variable

class BasicBlock(nn.Module):
    expansion = 1

    def __init__(self, in_planes, planes, stride=1):
        super(BasicBlock, self).__init__()
        self.conv1 = nn.Conv2d(in_planes, planes, kernel_size=3, stride=stride, padding=1, bias=False)
        self.bn1 = nn.BatchNorm2d(planes)
        self.conv2 = nn.Conv2d(planes, planes, kernel_size=3, stride=1, padding=1, bias=False)
        self.bn2 = nn.BatchNorm2d(planes)

        self.shortcut = nn.Sequential()
        if stride != 1 or in_planes != self.expansion*planes:
            self.shortcut = nn.Sequential(
                nn.Conv2d(in_planes, self.expansion*planes, kernel_size=1, stride=stride, bias=False),
                nn.BatchNorm2d(self.expansion*planes)
            )

    def forward(self, x):
        out = F.relu(self.bn1(self.conv1(x)))
        out = self.bn2(self.conv2(out))
        out += self.shortcut(x)
        out = F.relu(out)
        return out

class Bottleneck(nn.Module):
    expansion = 4

    def __init__(self, in_planes, planes, stride=1):
        super(Bottleneck, self).__init__()



        self.conv1 = nn.Conv2d(in_planes, planes, kernel_size=1, bias=False)
        self.bn1 = nn.BatchNorm2d(planes)
        self.conv2 = nn.Conv2d(planes, planes, kernel_size=3, stride=stride, padding=1, bias=False)
        self.bn2 = nn.BatchNorm2d(planes)
        self.conv3 = nn.Conv2d(planes, self.expansion*planes, kernel_size=1, bias=False)
        self.bn3 = nn.BatchNorm2d(self.expansion*planes)

        self.shortcut = nn.Sequential()
        if stride != 1 or in_planes != self.expansion*planes:
            self.shortcut = nn.Sequential(
                nn.Conv2d(in_planes, self.expansion*planes, kernel_size=1, stride=stride, bias=False),
                nn.BatchNorm2d(self.expansion*planes)
            )

    def forward(self, x):
        out = F.relu(self.bn1(self.conv1(x)))
        out = F.relu(self.bn2(self.conv2(out)))
        out = self.bn3(self.conv3(out))
        out += self.shortcut(x)
        out = F.relu(out)
        return out

class ResNet(nn.Module):
    def __init__(self, block, num_blocks, num_classes=10):
        super(ResNet, self).__init__()
        self.in_planes = 64

        self.conv1 = nn.Conv2d(3, 64, kernel_size=3, stride=1, padding=1, bias=False)
        self.bn1 = nn.BatchNorm2d(64)
        self.layer1 = self._make_layer(block, 64, num_blocks[0], stride=1)
        # 1/2 width & height
        self.layer2 = self._make_layer(block, 128, num_blocks[1], stride=2)
        self.layer3 = self._make_layer(block, 256, num_blocks[2], stride=2)
        self.layer4 = self._make_layer(block, 512, num_blocks[3], stride=2)
        self.linear = nn.Linear(512*block.expansion, num_classes)
    def _make_layer(self, block, planes, num_blocks, stride):
        strides = [stride] + [1]*(num_blocks-1)
        layers = []
        for stride in strides:
            layers.append(block(self.in_planes, planes, stride))
            self.in_planes = planes * block.expansion
        return nn.Sequential(*layers)

        # 0 - layer1 ... 4 - output
    def forward(self, x):
        #attention_map=[];
        out = F.relu(self.bn1(self.conv1(x)))
        out1 = self.layer1(out)
        #attention_map.append(out1)
        out2 = self.layer2(out1)
        #attention_map.append(out2)
        out3 = self.layer3(out2)
        #attention_map.append(out3)
        out4 = self.layer4(out3)
        #attention_map.append(out4)
        out = F.avg_pool2d(out4, 4)
        out = out.view(out.size(0), -1)
        out = self.linear(out)
        #attention_map.append(out)
        return out

class ResNet_simple(nn.Module):
    def __init__(self, block, num_blocks, num_classes=10):
        super(ResNet_simple, self).__init__()
        self.in_planes = 16

        self.conv1 = nn.Conv2d(3, 16, kernel_size=3, stride=1, padding=1, bias=False)
        self.bn1 = nn.BatchNorm2d(16)
        self.layer1 = self._make_layer(block, 16, num_blocks[0], stride=1)
        # 1/2 width & height
        self.layer2 = self._make_layer(block, 32, num_blocks[1], stride=2)
        self.layer3 = self._make_layer(block, 64, num_blocks[2], stride=2)
        #self.layer4 = self._make_layer(block, 512, num_blocks[3], stride=2)
        self.linear = nn.Linear(64*block.expansion, num_classes)
    def _make_layer(self, block, planes, num_blocks, stride):
        strides = [stride] + [1]*(num_blocks-1)
        layers = []
        for stride in strides:
            layers.append(block(self.in_planes, planes, stride))
            self.in_planes = planes * block.expansion
        return nn.Sequential(*layers)

        # 0 - layer1 ... 3 - output
    def forward(self, x):
        #attention_map=[]
        out = F.relu(self.bn1(self.conv1(x)))
        out1 = self.layer1(out)
        #attention_map.append(out1)
        out2 = self.layer2(out1)
        #attention_map.append(out2)
        out3 = self.layer3(out2)
        #attention_map.append(out3)
        out = F.avg_pool2d(out3, 8)
        out = out.view(out.size(0), -1)
        out = self.linear(out)
        #attention_map.append(out)
        return out


def ResNet20():
    return ResNet_simple(BasicBlock, [3,3,3])

def ResNet56():
    return ResNet_simple(BasicBlock, [9,9,9])

def ResNet112():
    return ResNet_simple(BasicBlock, [18,18,18])

def ResNet34():
    return ResNet(BasicBlock, [3,4,6,3])


In [8]:
teacher_model = ResNet56()
student_model = ResNet20()

teacher_model.to(device)
student_model.to(device)

ResNet_simple(
  (conv1): Conv2d(3, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
  (bn1): BatchNorm2d(16, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
  (layer1): Sequential(
    (0): BasicBlock(
      (conv1): Conv2d(16, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(16, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv2): Conv2d(16, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(16, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (shortcut): Sequential()
    )
    (1): BasicBlock(
      (conv1): Conv2d(16, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(16, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv2): Conv2d(16, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(16, eps=1e-05, momentum=0.1, 

In [9]:
teacher_model.load_state_dict(torch.load('../FactorTransfer/teacher2.pt'))
#teacher_model.load_state_dict(torch.load('./Teacher.pth')['state_dict'])

<All keys matched successfully>

In [10]:
kwargs = {
    'DISTILL_ARGS' : {
        'BETA':500,
        'EPOCHS':163,
        'LR':0.1,
        'WEIGHT_DECAY':0.0005,
        
        'IN_PLANES':64,
        'RATE':0.5,
        
        'TEACHER_LAYER_NAME':'layer3',
        'STUDENT_LAYER_NAME':'layer3',
    },

    'PARAPHRASER' : {
        'IN_PLANES':64,
        'RATE':0.5,
        'EPOCHS':5,
        'LR':0.1,
        'WEIGHT_DECAY':0.0005,
    },
    
    'DEVICE' : device,
    'log_dir' : 'ft_resnet20'
}

In [11]:
box = FactorTransfer(teacher_model, student_model, dataloaders, **kwargs)

In [12]:
box.compress_model()

=====TRAINING PARAPHRASER=====


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:24<00:00, 14.41it/s, loss=0.375]


Epoch 1 | Train loss: 0.3755


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:22<00:00, 15.82it/s, loss=0.206]


Epoch 2 | Train loss: 0.2059


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:22<00:00, 15.58it/s, loss=0.175]


Epoch 3 | Train loss: 0.1748


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:22<00:00, 15.65it/s, loss=0.162]


Epoch 4 | Train loss: 0.1618


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:22<00:00, 15.55it/s, loss=0.153]


Epoch 5 | Train loss: 0.1532
=====TRAINING STUDENT NETWORK=====
Epoch: 1


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.84it/s, loss=7.56]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.40it/s, acc=0.516, loss=7.01]


**Saving checkpoint**
Epoch: 2


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.42it/s, loss=5.87]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.27it/s, acc=0.65, loss=5.44]


**Saving checkpoint**
Epoch: 3


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.10it/s, loss=4.66]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.00it/s, acc=0.734, loss=4.76]


**Saving checkpoint**
Epoch: 4


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 20.20it/s, loss=4.13]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 31.82it/s, acc=0.76, loss=4.34]


**Saving checkpoint**
Epoch: 5


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 19.70it/s, loss=3.88]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.93it/s, acc=0.737, loss=4.5]


Epoch: 6


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.51it/s, loss=3.69]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.38it/s, acc=0.762, loss=4.23]


**Saving checkpoint**
Epoch: 7


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.99it/s, loss=3.55]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 31.99it/s, acc=0.829, loss=3.73]


**Saving checkpoint**
Epoch: 8


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.09it/s, loss=3.47]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.93it/s, acc=0.839, loss=3.66]


**Saving checkpoint**
Epoch: 9


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.76it/s, loss=3.37]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 26.54it/s, acc=0.851, loss=3.5]


**Saving checkpoint**
Epoch: 10


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 19.61it/s, loss=3.3]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 27.90it/s, acc=0.8, loss=3.96]


Epoch: 11


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:19<00:00, 18.52it/s, loss=3.27]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.88it/s, acc=0.844, loss=3.46]


Epoch: 12


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:19<00:00, 18.07it/s, loss=3.21]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 31.26it/s, acc=0.854, loss=3.49]


**Saving checkpoint**
Epoch: 13


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:19<00:00, 18.51it/s, loss=3.2]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 27.26it/s, acc=0.833, loss=3.72]


Epoch: 14


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:19<00:00, 17.99it/s, loss=3.16]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.32it/s, acc=0.85, loss=3.45]


Epoch: 15


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.13it/s, loss=3.13]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 32.43it/s, acc=0.818, loss=3.8]


Epoch: 16


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.20it/s, loss=3.09]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.72it/s, acc=0.827, loss=3.55]


Epoch: 17


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.33it/s, loss=3.06]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.09it/s, acc=0.846, loss=3.5]


Epoch: 18


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.79it/s, loss=3.06]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 31.35it/s, acc=0.874, loss=3.24]


**Saving checkpoint**
Epoch: 19


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.20it/s, loss=3.03]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 28.13it/s, acc=0.803, loss=3.8]


Epoch: 20


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.76it/s, loss=3.03]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 31.17it/s, acc=0.845, loss=3.42]


Epoch: 21


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:19<00:00, 18.32it/s, loss=3.01]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.18it/s, acc=0.843, loss=3.4]


Epoch: 22


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:19<00:00, 18.08it/s, loss=3.01]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 28.11it/s, acc=0.863, loss=3.23]


Epoch: 23


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:19<00:00, 17.88it/s, loss=3]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 28.76it/s, acc=0.871, loss=3.23]


Epoch: 24


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.66it/s, loss=2.96]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 32.33it/s, acc=0.873, loss=3.28]


Epoch: 25


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.92it/s, loss=2.97]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.63it/s, acc=0.875, loss=3.2]


**Saving checkpoint**
Epoch: 26


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.67it/s, loss=2.95]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 27.44it/s, acc=0.879, loss=3.22]


**Saving checkpoint**
Epoch: 27


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:19<00:00, 18.26it/s, loss=2.96]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 21.00it/s, acc=0.862, loss=3.59]


Epoch: 28


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:19<00:00, 17.94it/s, loss=2.95]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.65it/s, acc=0.841, loss=3.42]


Epoch: 29


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:19<00:00, 18.24it/s, loss=2.95]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 28.54it/s, acc=0.876, loss=3.19]


Epoch: 30


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.53it/s, loss=2.92]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 28.69it/s, acc=0.884, loss=3.12]


**Saving checkpoint**
Epoch: 31


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.16it/s, loss=2.93]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 28.72it/s, acc=0.876, loss=3.2]


Epoch: 32


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.22it/s, loss=2.91]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.75it/s, acc=0.88, loss=3.07]


Epoch: 33


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 19.61it/s, loss=2.91]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.17it/s, acc=0.86, loss=3.29]


Epoch: 34


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.11it/s, loss=2.91]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.01it/s, acc=0.873, loss=3.3]


Epoch: 35


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.05it/s, loss=2.9]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 27.91it/s, acc=0.871, loss=3.23]


Epoch: 36


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.41it/s, loss=2.91]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 27.94it/s, acc=0.885, loss=3.1]


**Saving checkpoint**
Epoch: 37


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 20.92it/s, loss=2.89]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.39it/s, acc=0.858, loss=3.33]


Epoch: 38


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.44it/s, loss=2.87]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 27.02it/s, acc=0.879, loss=3.19]


Epoch: 39


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.85it/s, loss=2.88]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.98it/s, acc=0.883, loss=3.11]


Epoch: 40


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 20.34it/s, loss=2.88]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 28.15it/s, acc=0.851, loss=3.42]


Epoch: 41


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.06it/s, loss=2.89]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.37it/s, acc=0.885, loss=3.11]


Epoch: 42


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 20.03it/s, loss=2.86]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.33it/s, acc=0.872, loss=3.19]


Epoch: 43


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.80it/s, loss=2.88]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 27.73it/s, acc=0.876, loss=3.21]


Epoch: 44


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.10it/s, loss=2.86]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 31.91it/s, acc=0.86, loss=3.36]


Epoch: 45


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.25it/s, loss=2.85]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.01it/s, acc=0.872, loss=3.19]


Epoch: 46


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.23it/s, loss=2.87]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.29it/s, acc=0.868, loss=3.25]


Epoch: 47


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.04it/s, loss=2.88]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 31.34it/s, acc=0.879, loss=3.23]


Epoch: 48


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.47it/s, loss=2.85]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 31.14it/s, acc=0.893, loss=3.06]


**Saving checkpoint**
Epoch: 49


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.70it/s, loss=2.85]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.11it/s, acc=0.847, loss=3.45]


Epoch: 50


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.14it/s, loss=2.86]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 28.81it/s, acc=0.893, loss=3.04]


**Saving checkpoint**
Epoch: 51


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.74it/s, loss=2.84]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.59it/s, acc=0.903, loss=2.99]


**Saving checkpoint**
Epoch: 52


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.84it/s, loss=2.85]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.92it/s, acc=0.88, loss=3.21]


Epoch: 53


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.08it/s, loss=2.84]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 28.07it/s, acc=0.874, loss=3.17]


Epoch: 54


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.17it/s, loss=2.83]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.55it/s, acc=0.889, loss=3.16]


Epoch: 55


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.18it/s, loss=2.85]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 27.74it/s, acc=0.89, loss=3.11]


Epoch: 56


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.15it/s, loss=2.84]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.95it/s, acc=0.887, loss=3.09]


Epoch: 57


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.35it/s, loss=2.82]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 27.88it/s, acc=0.84, loss=3.41]


Epoch: 58


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 19.79it/s, loss=2.84]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.30it/s, acc=0.855, loss=3.32]


Epoch: 59


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 19.89it/s, loss=2.83]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 28.27it/s, acc=0.81, loss=3.61]


Epoch: 60


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.17it/s, loss=2.82]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.82it/s, acc=0.884, loss=3.12]


Epoch: 61


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.39it/s, loss=2.82]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 28.54it/s, acc=0.882, loss=3.06]


Epoch: 62


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.09it/s, loss=2.82]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 26.81it/s, acc=0.87, loss=3.17]


Epoch: 63


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.44it/s, loss=2.83]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 31.09it/s, acc=0.891, loss=3.01]


Epoch: 64


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.74it/s, loss=2.82]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.15it/s, acc=0.847, loss=3.41]


Epoch: 65


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.95it/s, loss=2.83]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.65it/s, acc=0.896, loss=3.01]


Epoch: 66


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 19.60it/s, loss=2.82]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 27.54it/s, acc=0.882, loss=3.11]


Epoch: 67


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.49it/s, loss=2.82]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.54it/s, acc=0.821, loss=3.58]


Epoch: 68


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 19.81it/s, loss=2.81]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 28.58it/s, acc=0.873, loss=3.17]


Epoch: 69


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.95it/s, loss=2.81]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 31.54it/s, acc=0.895, loss=3]


Epoch: 70


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.22it/s, loss=2.8]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.98it/s, acc=0.91, loss=2.91]


**Saving checkpoint**
Epoch: 71


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.00it/s, loss=2.8]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 32.14it/s, acc=0.888, loss=3.05]


Epoch: 74


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.22it/s, loss=2.8]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.65it/s, acc=0.893, loss=3.04]


Epoch: 75


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 20.87it/s, loss=2.8]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.43it/s, acc=0.873, loss=3.24]


Epoch: 76


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.52it/s, loss=2.79]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 28.26it/s, acc=0.901, loss=2.98]


Epoch: 77


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 19.58it/s, loss=2.79]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.86it/s, acc=0.905, loss=2.93]


Epoch: 78


 64%|████████████████████████████████████████████████████████████████████                                      | 226/352 [00:09<00:06, 20.24it/s, loss=2.81]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 31.11it/s, acc=0.942, loss=2.32]


**Saving checkpoint**
Epoch: 85


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 20.34it/s, loss=2.22]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.57it/s, acc=0.943, loss=2.31]


**Saving checkpoint**
Epoch: 86


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 19.68it/s, loss=2.2]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 25.35it/s, acc=0.944, loss=2.29]


**Saving checkpoint**
Epoch: 87


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.01it/s, loss=2.18]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 31.94it/s, acc=0.944, loss=2.28]


**Saving checkpoint**
Epoch: 88


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 20.85it/s, loss=2.16]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.77it/s, acc=0.946, loss=2.28]


**Saving checkpoint**
Epoch: 89


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 20.61it/s, loss=2.15]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.05it/s, acc=0.948, loss=2.24]


**Saving checkpoint**
Epoch: 90


 53%|████████████████████████████████████████████████████████▌                                                 | 188/352 [00:09<00:08, 19.06it/s, loss=2.13]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 22.45it/s, loss=2.12]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 26.94it/s, acc=0.951, loss=2.24]


**Saving checkpoint**
Epoch: 93


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.36it/s, loss=2.12]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.36it/s, acc=0.946, loss=2.23]


Epoch: 94


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.16it/s, loss=2.1]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.18it/s, acc=0.95, loss=2.22]


Epoch: 95


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.00it/s, loss=2.1]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.08it/s, acc=0.95, loss=2.23]


Epoch: 96


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.14it/s, loss=2.09]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 31.22it/s, acc=0.946, loss=2.26]


Epoch: 97


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.14it/s, loss=2.09]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 27.97it/s, acc=0.949, loss=2.25]


Epoch: 98


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.32it/s, loss=2.09]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.16it/s, acc=0.949, loss=2.24]


Epoch: 99


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 20.76it/s, loss=2.08]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.12it/s, acc=0.951, loss=2.21]


**Saving checkpoint**
Epoch: 100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.30it/s, loss=2.08]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.30it/s, acc=0.949, loss=2.28]


Epoch: 101


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.28it/s, loss=2.08]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 31.54it/s, acc=0.945, loss=2.23]


Epoch: 102


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 20.62it/s, loss=2.08]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.26it/s, acc=0.95, loss=2.23]


Epoch: 103


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.13it/s, loss=2.07]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.28it/s, acc=0.951, loss=2.23]


Epoch: 104


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 19.77it/s, loss=2.07]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.50it/s, acc=0.945, loss=2.23]


Epoch: 105


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 22.88it/s, loss=2.07]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.34it/s, acc=0.947, loss=2.24]


Epoch: 106


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.20it/s, loss=2.07]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 31.04it/s, acc=0.947, loss=2.23]


Epoch: 107


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.34it/s, loss=2.06]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.03it/s, acc=0.953, loss=2.19]


**Saving checkpoint**
Epoch: 108


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.15it/s, loss=2.07]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 28.77it/s, acc=0.946, loss=2.26]


Epoch: 109


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.91it/s, loss=2.07]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 28.58it/s, acc=0.95, loss=2.24]


Epoch: 110


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 20.66it/s, loss=2.07]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.08it/s, acc=0.95, loss=2.21]


Epoch: 111


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.25it/s, loss=2.07]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.85it/s, acc=0.947, loss=2.23]


Epoch: 115


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.61it/s, loss=2.07]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 32.62it/s, acc=0.951, loss=2.21]


Epoch: 116


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.98it/s, loss=2.08]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 32.01it/s, acc=0.951, loss=2.22]


Epoch: 117


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:19<00:00, 18.09it/s, loss=2.08]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 31.11it/s, acc=0.948, loss=2.27]


Epoch: 118


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 20.13it/s, loss=2.08]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 32.19it/s, acc=0.95, loss=2.26]


Epoch: 119


 62%|██████████████████████████████████████████████████████████████████▎                                       | 220/352 [00:10<00:06, 20.78it/s, loss=2.07]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)

100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.30it/s, loss=2.08]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 27.74it/s, acc=0.945, loss=2.31]


Epoch: 122


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.17it/s, loss=2.08]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.20it/s, acc=0.947, loss=2.27]


Epoch: 123


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.96it/s, loss=2.08]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.53it/s, acc=0.948, loss=2.29]


Epoch: 124


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.95it/s, loss=1.97]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.97it/s, acc=0.956, loss=2.11]


**Saving checkpoint**
Epoch: 125


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.94it/s, loss=1.94]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.95it/s, acc=0.957, loss=2.1]


**Saving checkpoint**
Epoch: 126


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.29it/s, loss=1.94]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 28.98it/s, acc=0.957, loss=2.09]


Epoch: 127


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.50it/s, loss=1.93]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.64it/s, acc=0.957, loss=2.09]


Epoch: 128


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.29it/s, loss=1.92]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.25it/s, acc=0.957, loss=2.1]


Epoch: 129


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.36it/s, loss=1.92]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.60it/s, acc=0.959, loss=2.08]


**Saving checkpoint**
Epoch: 130


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.11it/s, loss=1.92]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 31.45it/s, acc=0.958, loss=2.11]


Epoch: 131


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 20.79it/s, loss=1.92]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.68it/s, acc=0.958, loss=2.09]


Epoch: 132


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 20.35it/s, loss=1.92]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 27.37it/s, acc=0.957, loss=2.09]


Epoch: 133


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.28it/s, loss=1.91]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 31.96it/s, acc=0.957, loss=2.08]


Epoch: 134


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.47it/s, loss=1.91]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.68it/s, acc=0.956, loss=2.08]


Epoch: 135


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 20.28it/s, loss=1.91]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 31.41it/s, acc=0.959, loss=2.09]


Epoch: 136


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.42it/s, loss=1.91]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 28.63it/s, acc=0.959, loss=2.09]


Epoch: 137


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.54it/s, loss=1.91]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 32.11it/s, acc=0.956, loss=2.08]


Epoch: 138


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.50it/s, loss=1.91]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 28.27it/s, acc=0.959, loss=2.09]


Epoch: 139


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.25it/s, loss=1.91]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 31.70it/s, acc=0.959, loss=2.07]


Epoch: 140


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 19.73it/s, loss=1.9]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.65it/s, acc=0.959, loss=2.1]


Epoch: 141


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.07it/s, loss=1.9]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.99it/s, acc=0.959, loss=2.07]


Epoch: 142


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.38it/s, loss=1.9]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.56it/s, acc=0.956, loss=2.08]


Epoch: 143


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:16<00:00, 21.49it/s, loss=1.91]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.85it/s, acc=0.958, loss=2.1]


Epoch: 144


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 20.17it/s, loss=1.9]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.33it/s, acc=0.959, loss=2.07]


Epoch: 145


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.99it/s, loss=1.9]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 25.07it/s, acc=0.958, loss=2.08]


Epoch: 146


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.92it/s, loss=1.9]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 28.56it/s, acc=0.958, loss=2.06]


Epoch: 147


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.00it/s, loss=1.91]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.67it/s, acc=0.958, loss=2.07]


Epoch: 148


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.38it/s, loss=1.9]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 31.84it/s, acc=0.958, loss=2.06]


Epoch: 149


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.05it/s, loss=1.9]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.06it/s, acc=0.958, loss=2.08]


Epoch: 150


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.47it/s, loss=1.89]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.67it/s, acc=0.96, loss=2.06]


**Saving checkpoint**
Epoch: 151


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.99it/s, loss=1.9]
100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.17it/s, acc=0.96, loss=2.06]


Epoch: 152


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.98it/s, loss=1.89]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.00it/s, acc=0.959, loss=2.06]


Epoch: 153


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.07it/s, loss=1.89]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.62it/s, acc=0.958, loss=2.06]


Epoch: 154


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.98it/s, loss=1.89]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.63it/s, acc=0.959, loss=2.06]


Epoch: 155


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.44it/s, loss=1.89]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 32.15it/s, acc=0.958, loss=2.06]


Epoch: 156


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.95it/s, loss=1.9]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 27.08it/s, acc=0.958, loss=2.07]


Epoch: 157


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.26it/s, loss=1.89]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.67it/s, acc=0.958, loss=2.06]


Epoch: 158


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:15<00:00, 22.03it/s, loss=1.89]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 30.66it/s, acc=0.958, loss=2.08]


Epoch: 159


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:17<00:00, 19.68it/s, loss=1.89]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 32.08it/s, acc=0.958, loss=2.06]


Epoch: 160


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.22it/s, loss=1.89]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.65it/s, acc=0.959, loss=2.05]


Epoch: 161


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.81it/s, loss=1.89]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 27.40it/s, acc=0.958, loss=2.06]


Epoch: 162


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 18.91it/s, loss=1.89]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 29.70it/s, acc=0.959, loss=2.07]


Epoch: 163


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 352/352 [00:18<00:00, 19.12it/s, loss=1.89]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 40/40 [00:01<00:00, 32.11it/s, acc=0.958, loss=2.07]


In [15]:
torch.save(student_model.state_dict(), "./checkpoints/ft_resnet20_last.pth")

In [18]:
student_model.load_state_dict(torch.load('./checkpoints/ft_resnet20.pth')['state_dict'])

<All keys matched successfully>

In [19]:
preds = []
valid_labels = []
student_model.eval()
# Run the best model on test set
for step, (images, labels) in tqdm(enumerate(test_loader), total = len(test_loader)):

    images = images.to(device, dtype=torch.float)
    labels = labels.to(device)
    batch_size = labels.size(0)

    with torch.no_grad():
        y_preds = student_model(images)
        
    preds.append(y_preds.softmax(1).to('cpu').numpy())
    valid_labels.append(labels.to('cpu').numpy())

predictions = np.concatenate(preds)
valid_labels = np.concatenate(valid_labels)

# Get the score
score = accuracy_score(valid_labels, predictions.argmax(1))

100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:01<00:00, 52.73it/s]


In [20]:
score

0.931