In [2]:

import torch
import torchvision
import torchvision.transforms as transforms
from torch import nn
import torch.nn.functional as F
import time

# Dataset

In [1]:
from load_dataset import download_dataset
from load_model import create_classification_model


In [231]:
trainloader,testloader = download_dataset(batch_size = 128)

Files already downloaded and verified
Files already downloaded and verified


In [4]:
model = create_classification_model()

In [None]:
%load 

In [268]:
%%writefile load_model.py
import torch
from torch import nn
from torchvision.models import resnet50, ResNet50_Weights

def download_model():
    
    weights = ResNet50_Weights.IMAGENET1K_V2
    model = resnet50(weights=weights)
    
    return model

def create_teacher_model(n_classes=10):
    
    model = download_model()
    classification_model = Resnet_Classification(model,n_classes)
    
    
    return classification_model


def create_student_model(n_classes=10):
    
    model = Student(n_classes)
    
    return model

class Resnet_Classification(nn.Module):
    
    def __init__(self,base_model,n_classes):
        super().__init__()
        self.base_model = base_model
        self.n_classes = n_classes
        self.dropout = nn.Dropout(0.1)
        self.classifier = nn.Linear(1000,n_classes)
        
    def forward(self,inputs,labels = None,**kargs):
        outputs = self.base_model(inputs,**kargs)
        x = self.dropout(outputs)
        logits = self.classifier(x)
        loss = None
        out = {} ## Output dictionary
        out['logits'] = logits
        if labels is not None:
            loss_fct = nn.CrossEntropyLoss()
            loss = loss_fct(logits.view(-1,self.n_classes),labels.view(-1))
            out["loss"] = loss
           
        return out

    
    

class Student(nn.Module):
    
    def __init__(self,n_classes):
        super().__init__()
        self.n_classes = n_classes
        self.conv1 = nn.Conv2d(3, 64, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3), bias=False)
        self.batchnorm = nn.BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        self.maxpool = nn.MaxPool2d(kernel_size=3, stride=2, padding=1, dilation=1, ceil_mode=False)
        self.conv2 = nn.Conv2d(64, 8, kernel_size=(3, 3), stride=(1, 1), bias=False)
        self.classifier = nn.Linear(288,self.n_classes)
    
    def distillation_loss(self,logits,labels,teacher_logits,T,alpha):
    
        train_loss_fct = nn.CrossEntropyLoss() 
        train_loss = train_loss_fct(logits,labels) ## Training loss

        distill_loss_fnt =  nn.KLDivLoss() ## Distillation loss

        distill_loss = distill_loss_fnt(F.log_softmax(logits/T,dim=1),F.log_softmax(teacher_logits/T,dim=1))

        ## Total loss
        loss = T*T*0.9*distill_loss+(1-0.9)*train_loss

        return loss


    def forward(self,x,teacher_logits = None,labels=None,T=5,alpha=0.5):
        x = self.conv1(x)
        x = self.batchnorm(x)
        x = nn.functional.relu(x)
        x = self.maxpool(x)
        
        x = self.conv2(x)
        x = nn.functional.relu(x)
        x = nn.Flatten()(x)
        logits = self.classifier(x)
        
        
        
        out = {}
        out['logits'] = logits
        
        
       
        if teacher_logits is not None and labels is not None:
            
            out['loss'] = self.distillation_loss(logits,labels,teacher_logits,T,alpha)
            
            return out
        
        if labels is not None:
            loss_fct = nn.CrossEntropyLoss()
            train_loss = loss_fct(logits,labels)
            out['loss'] = train_loss
        
   
        return out

Writing load_model.py


In [267]:
%%writefile train.py

from load_dataset import download_dataset
from load_model import create_classification_model




def train(classification_model,trainloader,testloader,optimizer,steps = 100,teacher_logits=None):
    
    
    train_step = 0
    running_loss = []
    while True:
        for batch_count,(batch,labels) in enumerate(trainloader):
            if train_step>steps:
                
                return 
            
            if teacher_logits:
                
                teacher_logit = teacher_logits[batch_count]
                    
                output_dict = classification_model(batch,teacher_logits=teacher_logit,labels=labels)
            else:
                output_dict = classification_model(batch,labels=labels)
                
            loss = output_dict['loss']
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
            
            running_loss.append(loss.item())
           
            if train_step%100 == 0:
                print(f"Step:{train_step}. Train Loss {sum(running_loss)/len(running_loss)}")
                
                running_loss = []
            
            if train_step%500 == 0:
                
                acc,test_loss = test(classification_model,testloader)
                print(f"Step:{train_step}. Validation loss: {test_loss}. Validation Accuracy: {acc}")
        
            train_step+=1
            
            
def test(classification_model,testloader):
    
    test_loss,correct = 0,0
    for batch,labels in testloader:
        
        with torch.no_grad():
            outputs = classification_model(batch,labels=labels)
            logits = outputs['logits']
            preds = torch.argmax(logits,axis=-1)
            test_loss += outputs['loss'].item()
            correct += (preds==labels).sum().item()
    
    
    acc = correct/len(testloader.dataset)
    test_loss = test_loss/len(testloader)
    
    return acc,test_loss

if __name__ == "__main__":
    
    
    trainloader,testloader = download_dataset()
    
    teacher_model = create_classification_model()
    

Writing train.py


In [260]:
for param in model.parameters():
    param.requires_grad = True

In [180]:
optimizer = torch.optim.Adam(params=model.parameters(),lr=1e-3)
loss_fn = nn.CrossEntropyLoss()

In [241]:
from tqdm import tqdm
teacher_logits = []
for batch,_ in tqdm(trainloader):
    teacher_logits.append(predict(model,batch)['logits'])

  0%|▍                                                                                                                                                                      | 1/391 [00:08<54:08,  8.33s/it]

Time taken 5.068665027618408


  1%|▊                                                                                                                                                                      | 2/391 [00:13<41:42,  6.43s/it]

Time taken 5.101564884185791


  1%|█▎                                                                                                                                                                     | 3/391 [00:18<37:41,  5.83s/it]

Time taken 5.107611894607544


  1%|█▋                                                                                                                                                                     | 4/391 [00:23<36:04,  5.59s/it]

Time taken 5.226196050643921


  1%|██▏                                                                                                                                                                    | 5/391 [00:28<34:57,  5.43s/it]

Time taken 5.151278257369995


  2%|██▌                                                                                                                                                                    | 6/391 [00:34<34:05,  5.31s/it]

Time taken 5.0735650062561035


  2%|██▉                                                                                                                                                                    | 7/391 [00:39<33:42,  5.27s/it]

Time taken 5.17392897605896


  2%|███▍                                                                                                                                                                   | 8/391 [00:44<33:14,  5.21s/it]

Time taken 5.075025796890259


  2%|███▊                                                                                                                                                                   | 9/391 [00:49<33:01,  5.19s/it]

Time taken 5.138024806976318


  3%|████▏                                                                                                                                                                 | 10/391 [00:54<32:53,  5.18s/it]

Time taken 5.15868616104126


  3%|████▋                                                                                                                                                                 | 11/391 [01:00<33:19,  5.26s/it]

Time taken 5.444955110549927


  3%|█████                                                                                                                                                                 | 12/391 [01:05<33:27,  5.30s/it]

Time taken 5.373337268829346


  3%|█████▌                                                                                                                                                                | 13/391 [01:10<33:13,  5.27s/it]

Time taken 5.221848964691162


  4%|█████▉                                                                                                                                                                | 14/391 [01:15<33:02,  5.26s/it]

Time taken 5.219935178756714


  4%|██████▎                                                                                                                                                               | 15/391 [01:21<33:01,  5.27s/it]

Time taken 5.29842209815979


  4%|██████▊                                                                                                                                                               | 16/391 [01:26<32:56,  5.27s/it]

Time taken 5.269651889801025


  4%|███████▏                                                                                                                                                              | 17/391 [01:31<32:47,  5.26s/it]

Time taken 5.235844850540161


  5%|███████▋                                                                                                                                                              | 18/391 [01:36<32:45,  5.27s/it]

Time taken 5.286561012268066


  5%|████████                                                                                                                                                              | 19/391 [01:42<32:41,  5.27s/it]

Time taken 5.278520107269287


  5%|████████▍                                                                                                                                                             | 20/391 [01:47<32:37,  5.28s/it]

Time taken 5.278280019760132


  5%|████████▉                                                                                                                                                             | 21/391 [01:52<32:43,  5.31s/it]

Time taken 5.379811763763428


  6%|█████████▎                                                                                                                                                            | 22/391 [01:58<32:41,  5.32s/it]

Time taken 5.332537889480591


  6%|█████████▊                                                                                                                                                            | 23/391 [02:04<34:13,  5.58s/it]

Time taken 6.193948030471802


  6%|██████████▏                                                                                                                                                           | 24/391 [02:11<37:02,  6.06s/it]

Time taken 7.161500930786133


  6%|██████████▌                                                                                                                                                           | 25/391 [02:18<39:12,  6.43s/it]

Time taken 7.296329975128174


  7%|███████████                                                                                                                                                           | 26/391 [02:25<39:40,  6.52s/it]

Time taken 6.737978219985962


  7%|███████████▍                                                                                                                                                          | 27/391 [02:31<38:47,  6.39s/it]

Time taken 6.094312906265259


  7%|███████████▉                                                                                                                                                          | 28/391 [02:37<37:51,  6.26s/it]

Time taken 5.937107801437378


  7%|████████████▎                                                                                                                                                         | 29/391 [02:43<37:11,  6.16s/it]

Time taken 5.9398980140686035


  8%|████████████▋                                                                                                                                                         | 30/391 [02:50<37:46,  6.28s/it]

Time taken 6.541571140289307


  8%|█████████████▏                                                                                                                                                        | 31/391 [02:55<36:44,  6.12s/it]

Time taken 5.756978750228882


  8%|█████████████▌                                                                                                                                                        | 32/391 [03:01<36:09,  6.04s/it]

Time taken 5.851866006851196


  8%|██████████████                                                                                                                                                        | 33/391 [03:07<35:07,  5.89s/it]

Time taken 5.523352146148682


  9%|██████████████▍                                                                                                                                                       | 34/391 [03:13<35:14,  5.92s/it]

Time taken 6.003402948379517


  9%|██████████████▊                                                                                                                                                       | 35/391 [03:19<34:47,  5.86s/it]

Time taken 5.724765062332153


  9%|███████████████▎                                                                                                                                                      | 36/391 [03:24<34:52,  5.90s/it]

Time taken 5.9645280838012695


  9%|███████████████▋                                                                                                                                                      | 37/391 [03:30<34:45,  5.89s/it]

Time taken 5.874920845031738


 10%|████████████████▏                                                                                                                                                     | 38/391 [03:36<34:10,  5.81s/it]

Time taken 5.617530107498169


 10%|████████████████▌                                                                                                                                                     | 39/391 [03:41<33:20,  5.68s/it]

Time taken 5.387067079544067


 10%|████████████████▉                                                                                                                                                     | 40/391 [03:47<33:19,  5.70s/it]

Time taken 5.7283220291137695


 10%|█████████████████▍                                                                                                                                                    | 41/391 [03:54<35:18,  6.05s/it]

Time taken 6.878273963928223


 11%|█████████████████▊                                                                                                                                                    | 42/391 [04:00<35:12,  6.05s/it]

Time taken 6.052013158798218


 11%|██████████████████▎                                                                                                                                                   | 43/391 [04:06<34:36,  5.97s/it]

Time taken 5.767225027084351


 11%|██████████████████▋                                                                                                                                                   | 44/391 [04:12<34:25,  5.95s/it]

Time taken 5.915453910827637


 12%|███████████████████                                                                                                                                                   | 45/391 [04:17<33:02,  5.73s/it]

Time taken 5.209370851516724


 12%|███████████████████▌                                                                                                                                                  | 46/391 [04:22<32:14,  5.61s/it]

Time taken 5.312702894210815


 12%|███████████████████▉                                                                                                                                                  | 47/391 [04:27<31:26,  5.48s/it]

Time taken 5.196053981781006


 12%|████████████████████▍                                                                                                                                                 | 48/391 [04:33<30:56,  5.41s/it]

Time taken 5.243891000747681


 13%|████████████████████▊                                                                                                                                                 | 49/391 [04:38<30:54,  5.42s/it]

Time taken 5.441555976867676


 13%|█████████████████████▏                                                                                                                                                | 50/391 [04:44<31:11,  5.49s/it]

Time taken 5.636430978775024


 13%|█████████████████████▋                                                                                                                                                | 51/391 [04:49<31:21,  5.53s/it]

Time taken 5.642510175704956


 13%|██████████████████████                                                                                                                                                | 52/391 [04:55<31:47,  5.63s/it]

Time taken 5.838809251785278


 14%|██████████████████████▌                                                                                                                                               | 53/391 [05:01<31:22,  5.57s/it]

Time taken 5.437560081481934


 14%|██████████████████████▉                                                                                                                                               | 54/391 [05:06<31:06,  5.54s/it]

Time taken 5.464602947235107


 14%|███████████████████████▎                                                                                                                                              | 55/391 [05:11<30:24,  5.43s/it]

Time taken 5.166975021362305


 14%|███████████████████████▊                                                                                                                                              | 56/391 [05:17<30:22,  5.44s/it]

Time taken 5.467859983444214


 15%|████████████████████████▏                                                                                                                                             | 57/391 [05:23<30:56,  5.56s/it]

Time taken 5.823427200317383


 15%|████████████████████████▌                                                                                                                                             | 58/391 [05:29<32:07,  5.79s/it]

Time taken 6.330146074295044


 15%|█████████████████████████                                                                                                                                             | 59/391 [05:35<32:07,  5.81s/it]

Time taken 5.843814134597778


 15%|█████████████████████████▍                                                                                                                                            | 60/391 [05:41<32:02,  5.81s/it]

Time taken 5.808579206466675


 16%|█████████████████████████▉                                                                                                                                            | 61/391 [05:46<31:33,  5.74s/it]

Time taken 5.572681188583374


 16%|██████████████████████████▎                                                                                                                                           | 62/391 [05:53<33:39,  6.14s/it]

Time taken 7.064939022064209


 16%|██████████████████████████▋                                                                                                                                           | 63/391 [05:59<33:38,  6.16s/it]

Time taken 6.1940531730651855


 16%|███████████████████████████▏                                                                                                                                          | 64/391 [06:05<32:30,  5.96s/it]

Time taken 5.5128538608551025


 17%|███████████████████████████▌                                                                                                                                          | 65/391 [06:10<31:38,  5.82s/it]

Time taken 5.4946229457855225


 17%|████████████████████████████                                                                                                                                          | 66/391 [06:16<31:19,  5.78s/it]

Time taken 5.684873104095459


 17%|████████████████████████████▍                                                                                                                                         | 67/391 [06:21<30:22,  5.62s/it]

Time taken 5.249635934829712


 17%|████████████████████████████▊                                                                                                                                         | 68/391 [06:27<30:56,  5.75s/it]

Time taken 6.0318520069122314


 18%|█████████████████████████████▎                                                                                                                                        | 69/391 [06:33<30:03,  5.60s/it]

Time taken 5.255117893218994


 18%|█████████████████████████████▋                                                                                                                                        | 70/391 [06:38<29:09,  5.45s/it]

Time taken 5.096177101135254


 18%|██████████████████████████████▏                                                                                                                                       | 71/391 [06:43<28:36,  5.36s/it]

Time taken 5.1605212688446045


 18%|██████████████████████████████▌                                                                                                                                       | 72/391 [06:48<28:11,  5.30s/it]

Time taken 5.156808137893677


 19%|██████████████████████████████▉                                                                                                                                       | 73/391 [06:53<27:56,  5.27s/it]

Time taken 5.199557065963745


 19%|███████████████████████████████▍                                                                                                                                      | 74/391 [06:59<27:41,  5.24s/it]

Time taken 5.164950132369995


 19%|███████████████████████████████▊                                                                                                                                      | 75/391 [07:04<27:28,  5.22s/it]

Time taken 5.157250165939331


 19%|████████████████████████████████▎                                                                                                                                     | 76/391 [07:09<27:09,  5.17s/it]

Time taken 5.067901849746704


 20%|████████████████████████████████▋                                                                                                                                     | 77/391 [07:14<27:34,  5.27s/it]

Time taken 5.492749929428101


 20%|█████████████████████████████████                                                                                                                                     | 78/391 [07:20<28:58,  5.55s/it]

Time taken 6.215079069137573


 20%|█████████████████████████████████▌                                                                                                                                    | 79/391 [07:26<29:17,  5.63s/it]

Time taken 5.811642169952393


 20%|█████████████████████████████████▉                                                                                                                                    | 80/391 [07:32<28:51,  5.57s/it]

Time taken 5.415483236312866


 21%|██████████████████████████████████▍                                                                                                                                   | 81/391 [07:37<28:22,  5.49s/it]

Time taken 5.306440830230713


 21%|██████████████████████████████████▊                                                                                                                                   | 82/391 [07:43<28:31,  5.54s/it]

Time taken 5.651479005813599


 21%|███████████████████████████████████▏                                                                                                                                  | 83/391 [07:48<28:06,  5.48s/it]

Time taken 5.3236000537872314


 21%|███████████████████████████████████▋                                                                                                                                  | 84/391 [07:54<28:52,  5.64s/it]

Time taken 6.034833192825317


 22%|████████████████████████████████████                                                                                                                                  | 85/391 [08:00<28:36,  5.61s/it]

Time taken 5.528071165084839


 22%|████████████████████████████████████▌                                                                                                                                 | 86/391 [08:05<27:54,  5.49s/it]

Time taken 5.204347133636475


 22%|████████████████████████████████████▉                                                                                                                                 | 87/391 [08:10<27:33,  5.44s/it]

Time taken 5.32376503944397


 23%|█████████████████████████████████████▎                                                                                                                                | 88/391 [08:15<27:16,  5.40s/it]

Time taken 5.307214021682739


 23%|█████████████████████████████████████▊                                                                                                                                | 89/391 [08:21<27:44,  5.51s/it]

Time taken 5.769704818725586


 23%|██████████████████████████████████████▏                                                                                                                               | 90/391 [08:27<28:16,  5.64s/it]

Time taken 5.9194653034210205


 23%|██████████████████████████████████████▋                                                                                                                               | 91/391 [08:33<28:14,  5.65s/it]

Time taken 5.67330002784729


 24%|███████████████████████████████████████                                                                                                                               | 92/391 [08:38<27:45,  5.57s/it]

Time taken 5.3900840282440186


 24%|███████████████████████████████████████▍                                                                                                                              | 93/391 [08:44<27:55,  5.62s/it]

Time taken 5.734958171844482


 24%|███████████████████████████████████████▉                                                                                                                              | 94/391 [08:49<27:31,  5.56s/it]

Time taken 5.4116668701171875


 24%|████████████████████████████████████████▎                                                                                                                             | 95/391 [08:54<26:45,  5.42s/it]

Time taken 5.101024866104126


 25%|████████████████████████████████████████▊                                                                                                                             | 96/391 [09:00<26:13,  5.33s/it]

Time taken 5.123938083648682


 25%|█████████████████████████████████████████▏                                                                                                                            | 97/391 [09:05<25:50,  5.28s/it]

Time taken 5.136285066604614


 25%|█████████████████████████████████████████▌                                                                                                                            | 98/391 [09:10<26:12,  5.37s/it]

Time taken 5.574643850326538


 25%|██████████████████████████████████████████                                                                                                                            | 99/391 [09:15<25:51,  5.31s/it]

Time taken 5.184037685394287


 26%|██████████████████████████████████████████▏                                                                                                                          | 100/391 [09:21<25:31,  5.26s/it]

Time taken 5.1441490650177


 26%|██████████████████████████████████████████▌                                                                                                                          | 101/391 [09:26<25:09,  5.21s/it]

Time taken 5.074846982955933


 26%|███████████████████████████████████████████                                                                                                                          | 102/391 [09:31<24:53,  5.17s/it]

Time taken 5.071138143539429


 26%|███████████████████████████████████████████▍                                                                                                                         | 103/391 [09:36<24:40,  5.14s/it]

Time taken 5.073583126068115


 27%|███████████████████████████████████████████▉                                                                                                                         | 104/391 [09:41<24:30,  5.12s/it]

Time taken 5.078719139099121


 27%|████████████████████████████████████████████▎                                                                                                                        | 105/391 [09:46<24:26,  5.13s/it]

Time taken 5.132604122161865


 27%|████████████████████████████████████████████▋                                                                                                                        | 106/391 [09:51<24:15,  5.11s/it]

Time taken 5.057119846343994


 27%|█████████████████████████████████████████████▏                                                                                                                       | 107/391 [09:56<24:33,  5.19s/it]

Time taken 5.378127336502075


 28%|█████████████████████████████████████████████▌                                                                                                                       | 108/391 [10:02<25:11,  5.34s/it]

Time taken 5.6960179805755615


 28%|█████████████████████████████████████████████▉                                                                                                                       | 109/391 [10:08<25:19,  5.39s/it]

Time taken 5.495569944381714


 28%|██████████████████████████████████████████████▍                                                                                                                      | 110/391 [10:13<25:20,  5.41s/it]

Time taken 5.467259168624878


 28%|██████████████████████████████████████████████▊                                                                                                                      | 111/391 [10:18<24:52,  5.33s/it]

Time taken 5.138537168502808


 29%|███████████████████████████████████████████████▎                                                                                                                     | 112/391 [10:24<24:39,  5.30s/it]

Time taken 5.239364147186279


 29%|███████████████████████████████████████████████▋                                                                                                                     | 113/391 [10:29<24:28,  5.28s/it]

Time taken 5.234050035476685


 29%|████████████████████████████████████████████████                                                                                                                     | 114/391 [10:34<24:14,  5.25s/it]

Time taken 5.168314218521118


 29%|████████████████████████████████████████████████▌                                                                                                                    | 115/391 [10:39<23:55,  5.20s/it]

Time taken 5.0852720737457275


 30%|████████████████████████████████████████████████▉                                                                                                                    | 116/391 [10:45<24:43,  5.39s/it]

Time taken 5.837297201156616


 30%|█████████████████████████████████████████████████▎                                                                                                                   | 117/391 [10:50<24:22,  5.34s/it]

Time taken 5.20502495765686


 30%|█████████████████████████████████████████████████▊                                                                                                                   | 118/391 [10:55<24:08,  5.31s/it]

Time taken 5.229475021362305


 30%|██████████████████████████████████████████████████▏                                                                                                                  | 119/391 [11:01<23:57,  5.28s/it]

Time taken 5.231122970581055


 31%|██████████████████████████████████████████████████▋                                                                                                                  | 120/391 [11:06<23:37,  5.23s/it]

Time taken 5.106267213821411


 31%|███████████████████████████████████████████████████                                                                                                                  | 121/391 [11:11<23:14,  5.17s/it]

Time taken 5.009869813919067


 31%|███████████████████████████████████████████████████▍                                                                                                                 | 122/391 [11:16<22:59,  5.13s/it]

Time taken 5.037091016769409


 31%|███████████████████████████████████████████████████▉                                                                                                                 | 123/391 [11:21<22:46,  5.10s/it]

Time taken 5.032595872879028


 32%|████████████████████████████████████████████████████▎                                                                                                                | 124/391 [11:26<22:36,  5.08s/it]

Time taken 5.031466007232666


 32%|████████████████████████████████████████████████████▋                                                                                                                | 125/391 [11:31<22:27,  5.07s/it]

Time taken 5.034770965576172


 32%|█████████████████████████████████████████████████████▏                                                                                                               | 126/391 [11:36<22:23,  5.07s/it]

Time taken 5.069519281387329


 32%|█████████████████████████████████████████████████████▌                                                                                                               | 127/391 [11:41<22:22,  5.09s/it]

Time taken 5.123245000839233


 33%|██████████████████████████████████████████████████████                                                                                                               | 128/391 [11:46<22:18,  5.09s/it]

Time taken 5.08919620513916


 33%|██████████████████████████████████████████████████████▍                                                                                                              | 129/391 [11:51<22:09,  5.07s/it]

Time taken 5.040433883666992


 33%|██████████████████████████████████████████████████████▊                                                                                                              | 130/391 [11:57<22:43,  5.22s/it]

Time taken 5.573729991912842


 34%|███████████████████████████████████████████████████████▎                                                                                                             | 131/391 [12:03<23:27,  5.41s/it]

Time taken 5.845786809921265


 34%|███████████████████████████████████████████████████████▋                                                                                                             | 132/391 [12:08<23:37,  5.47s/it]

Time taken 5.608494758605957


 34%|████████████████████████████████████████████████████████▏                                                                                                            | 133/391 [12:13<23:04,  5.37s/it]

Time taken 5.1185338497161865


 34%|████████████████████████████████████████████████████████▌                                                                                                            | 134/391 [12:19<23:09,  5.41s/it]

Time taken 5.499332666397095


 35%|████████████████████████████████████████████████████████▉                                                                                                            | 135/391 [12:24<23:13,  5.44s/it]

Time taken 5.5263917446136475


 35%|█████████████████████████████████████████████████████████▍                                                                                                           | 136/391 [12:30<23:38,  5.56s/it]

Time taken 5.84073281288147


 35%|█████████████████████████████████████████████████████████▊                                                                                                           | 137/391 [12:37<24:39,  5.82s/it]

Time taken 6.429256200790405


 35%|██████████████████████████████████████████████████████████▏                                                                                                          | 138/391 [12:43<25:02,  5.94s/it]

Time taken 6.199445009231567


 36%|██████████████████████████████████████████████████████████▋                                                                                                          | 139/391 [12:49<25:01,  5.96s/it]

Time taken 6.010876893997192


 36%|███████████████████████████████████████████████████████████                                                                                                          | 140/391 [12:55<24:50,  5.94s/it]

Time taken 5.8841307163238525


 36%|███████████████████████████████████████████████████████████▌                                                                                                         | 141/391 [13:00<24:01,  5.77s/it]

Time taken 5.365055799484253


 36%|███████████████████████████████████████████████████████████▉                                                                                                         | 142/391 [13:05<23:00,  5.54s/it]

Time taken 5.0234620571136475


 37%|████████████████████████████████████████████████████████████▎                                                                                                        | 143/391 [13:10<22:17,  5.39s/it]

Time taken 5.04060697555542


 37%|████████████████████████████████████████████████████████████▊                                                                                                        | 144/391 [13:15<21:47,  5.29s/it]

Time taken 5.055462121963501


 37%|█████████████████████████████████████████████████████████████▏                                                                                                       | 145/391 [13:20<21:32,  5.25s/it]

Time taken 5.158578872680664


 37%|█████████████████████████████████████████████████████████████▌                                                                                                       | 146/391 [13:25<21:11,  5.19s/it]

Time taken 5.033411026000977


 38%|██████████████████████████████████████████████████████████████                                                                                                       | 147/391 [13:30<20:55,  5.14s/it]

Time taken 5.039134979248047


 38%|██████████████████████████████████████████████████████████████▍                                                                                                      | 148/391 [13:35<20:42,  5.11s/it]

Time taken 5.036377668380737


 38%|██████████████████████████████████████████████████████████████▉                                                                                                      | 149/391 [13:40<20:30,  5.09s/it]

Time taken 5.02335786819458


 38%|███████████████████████████████████████████████████████████████▎                                                                                                     | 150/391 [13:46<20:26,  5.09s/it]

Time taken 5.0986998081207275


 39%|███████████████████████████████████████████████████████████████▋                                                                                                     | 151/391 [13:51<20:19,  5.08s/it]

Time taken 5.061523199081421


 39%|████████████████████████████████████████████████████████████████▏                                                                                                    | 152/391 [13:56<20:10,  5.06s/it]

Time taken 5.01936411857605


 39%|████████████████████████████████████████████████████████████████▌                                                                                                    | 153/391 [14:01<20:13,  5.10s/it]

Time taken 5.171176910400391


 39%|████████████████████████████████████████████████████████████████▉                                                                                                    | 154/391 [14:07<21:12,  5.37s/it]

Time taken 5.9994590282440186


 40%|█████████████████████████████████████████████████████████████████▍                                                                                                   | 155/391 [14:13<22:31,  5.73s/it]

Time taken 6.556376934051514


 40%|█████████████████████████████████████████████████████████████████▊                                                                                                   | 156/391 [14:19<22:05,  5.64s/it]

Time taken 5.441295146942139


 40%|██████████████████████████████████████████████████████████████████▎                                                                                                  | 157/391 [14:24<21:24,  5.49s/it]

Time taken 5.134415864944458


 40%|██████████████████████████████████████████████████████████████████▋                                                                                                  | 158/391 [14:29<20:46,  5.35s/it]

Time taken 5.026616096496582


 41%|███████████████████████████████████████████████████████████████████                                                                                                  | 159/391 [14:34<20:18,  5.25s/it]

Time taken 5.023396253585815


 41%|███████████████████████████████████████████████████████████████████▌                                                                                                 | 160/391 [14:39<19:58,  5.19s/it]

Time taken 5.03501296043396


 41%|███████████████████████████████████████████████████████████████████▉                                                                                                 | 161/391 [14:44<19:41,  5.14s/it]

Time taken 5.019452095031738


 41%|████████████████████████████████████████████████████████████████████▎                                                                                                | 162/391 [14:49<19:31,  5.11s/it]

Time taken 5.054763078689575


 42%|████████████████████████████████████████████████████████████████████▊                                                                                                | 163/391 [14:54<19:20,  5.09s/it]

Time taken 5.023428201675415


 42%|█████████████████████████████████████████████████████████████████████▏                                                                                               | 164/391 [14:59<19:11,  5.07s/it]

Time taken 5.036219835281372


 42%|█████████████████████████████████████████████████████████████████████▋                                                                                               | 165/391 [15:04<19:03,  5.06s/it]

Time taken 5.022525072097778


 42%|██████████████████████████████████████████████████████████████████████                                                                                               | 166/391 [15:09<18:56,  5.05s/it]

Time taken 5.032764196395874


 43%|██████████████████████████████████████████████████████████████████████▍                                                                                              | 167/391 [15:14<18:48,  5.04s/it]

Time taken 5.006537914276123


 43%|██████████████████████████████████████████████████████████████████████▉                                                                                              | 168/391 [15:19<18:43,  5.04s/it]

Time taken 5.032934904098511


 43%|███████████████████████████████████████████████████████████████████████▎                                                                                             | 169/391 [15:24<18:38,  5.04s/it]

Time taken 5.036739110946655


 43%|███████████████████████████████████████████████████████████████████████▋                                                                                             | 170/391 [15:29<18:33,  5.04s/it]

Time taken 5.031566858291626


 44%|████████████████████████████████████████████████████████████████████████▏                                                                                            | 171/391 [15:34<18:27,  5.03s/it]

Time taken 5.020985126495361


 44%|████████████████████████████████████████████████████████████████████████▌                                                                                            | 172/391 [15:39<18:20,  5.03s/it]

Time taken 5.007689952850342


 44%|█████████████████████████████████████████████████████████████████████████                                                                                            | 173/391 [15:44<18:16,  5.03s/it]

Time taken 5.030426025390625


 45%|█████████████████████████████████████████████████████████████████████████▍                                                                                           | 174/391 [15:49<18:10,  5.03s/it]

Time taken 5.0159149169921875


 45%|█████████████████████████████████████████████████████████████████████████▊                                                                                           | 175/391 [15:55<18:05,  5.03s/it]

Time taken 5.02852988243103


 45%|██████████████████████████████████████████████████████████████████████████▎                                                                                          | 176/391 [16:00<18:27,  5.15s/it]

Time taken 5.4371418952941895


 45%|██████████████████████████████████████████████████████████████████████████▋                                                                                          | 177/391 [16:05<18:30,  5.19s/it]

Time taken 5.269073963165283


 46%|███████████████████████████████████████████████████████████████████████████                                                                                          | 178/391 [16:10<18:18,  5.16s/it]

Time taken 5.088592052459717


 46%|███████████████████████████████████████████████████████████████████████████▌                                                                                         | 179/391 [16:15<18:05,  5.12s/it]

Time taken 5.023136854171753


 46%|███████████████████████████████████████████████████████████████████████████▉                                                                                         | 180/391 [16:20<17:54,  5.09s/it]

Time taken 5.025007724761963


 46%|████████████████████████████████████████████████████████████████████████████▍                                                                                        | 181/391 [16:25<17:49,  5.09s/it]

Time taken 5.091803073883057


 47%|████████████████████████████████████████████████████████████████████████████▊                                                                                        | 182/391 [16:31<17:43,  5.09s/it]

Time taken 5.0700860023498535


 47%|█████████████████████████████████████████████████████████████████████████████▏                                                                                       | 183/391 [16:36<17:42,  5.11s/it]

Time taken 5.150360822677612


 47%|█████████████████████████████████████████████████████████████████████████████▋                                                                                       | 184/391 [16:41<17:52,  5.18s/it]

Time taken 5.354984998703003


 47%|██████████████████████████████████████████████████████████████████████████████                                                                                       | 185/391 [16:46<17:55,  5.22s/it]

Time taken 5.311884880065918


 48%|██████████████████████████████████████████████████████████████████████████████▍                                                                                      | 186/391 [16:52<18:05,  5.29s/it]

Time taken 5.457854986190796


 48%|██████████████████████████████████████████████████████████████████████████████▉                                                                                      | 187/391 [16:58<19:12,  5.65s/it]

Time taken 6.481142997741699


 48%|███████████████████████████████████████████████████████████████████████████████▎                                                                                     | 188/391 [17:04<18:58,  5.61s/it]

Time taken 5.514737844467163


 48%|███████████████████████████████████████████████████████████████████████████████▊                                                                                     | 189/391 [17:09<18:40,  5.55s/it]

Time taken 5.3942179679870605


 49%|████████████████████████████████████████████████████████████████████████████████▏                                                                                    | 190/391 [17:15<19:08,  5.71s/it]

Time taken 6.098062038421631


 49%|████████████████████████████████████████████████████████████████████████████████▌                                                                                    | 191/391 [17:21<19:29,  5.85s/it]

Time taken 6.162755966186523


 49%|█████████████████████████████████████████████████████████████████████████████████                                                                                    | 192/391 [17:27<18:53,  5.70s/it]

Time taken 5.3362321853637695


 49%|█████████████████████████████████████████████████████████████████████████████████▍                                                                                   | 193/391 [17:32<18:10,  5.51s/it]

Time taken 5.066869020462036


 50%|█████████████████████████████████████████████████████████████████████████████████▊                                                                                   | 194/391 [17:37<17:38,  5.37s/it]

Time taken 5.051981687545776


 50%|██████████████████████████████████████████████████████████████████████████████████▎                                                                                  | 195/391 [17:42<17:16,  5.29s/it]

Time taken 5.0991010665893555


 50%|██████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 196/391 [17:47<17:00,  5.23s/it]

Time taken 5.1012349128723145


 50%|███████████████████████████████████████████████████████████████████████████████████▏                                                                                 | 197/391 [17:52<16:47,  5.20s/it]

Time taken 5.100873947143555


 51%|███████████████████████████████████████████████████████████████████████████████████▌                                                                                 | 198/391 [17:58<16:46,  5.22s/it]

Time taken 5.263846158981323


 51%|███████████████████████████████████████████████████████████████████████████████████▉                                                                                 | 199/391 [18:03<16:42,  5.22s/it]

Time taken 5.231952905654907


 51%|████████████████████████████████████████████████████████████████████████████████████▍                                                                                | 200/391 [18:08<16:57,  5.32s/it]

Time taken 5.562258958816528


 51%|████████████████████████████████████████████████████████████████████████████████████▊                                                                                | 201/391 [18:14<17:09,  5.42s/it]

Time taken 5.63153600692749


 52%|█████████████████████████████████████████████████████████████████████████████████████▏                                                                               | 202/391 [18:19<17:05,  5.43s/it]

Time taken 5.443669080734253


 52%|█████████████████████████████████████████████████████████████████████████████████████▋                                                                               | 203/391 [18:25<16:46,  5.35s/it]

Time taken 5.178526878356934


 52%|██████████████████████████████████████████████████████████████████████████████████████                                                                               | 204/391 [18:30<16:33,  5.31s/it]

Time taken 5.217936992645264


 52%|██████████████████████████████████████████████████████████████████████████████████████▌                                                                              | 205/391 [18:35<16:35,  5.35s/it]

Time taken 5.434326887130737


 53%|██████████████████████████████████████████████████████████████████████████████████████▉                                                                              | 206/391 [18:41<16:40,  5.41s/it]

Time taken 5.540349960327148


 53%|███████████████████████████████████████████████████████████████████████████████████████▎                                                                             | 207/391 [18:47<17:12,  5.61s/it]

Time taken 6.078207969665527


 53%|███████████████████████████████████████████████████████████████████████████████████████▊                                                                             | 208/391 [18:52<16:52,  5.53s/it]

Time taken 5.345567941665649


 53%|████████████████████████████████████████████████████████████████████████████████████████▏                                                                            | 209/391 [18:58<16:42,  5.51s/it]

Time taken 5.4531989097595215


 54%|████████████████████████████████████████████████████████████████████████████████████████▌                                                                            | 210/391 [19:03<16:24,  5.44s/it]

Time taken 5.2808520793914795


 54%|█████████████████████████████████████████████████████████████████████████████████████████                                                                            | 211/391 [19:09<16:54,  5.63s/it]

Time taken 6.084315776824951


 54%|█████████████████████████████████████████████████████████████████████████████████████████▍                                                                           | 212/391 [19:14<16:33,  5.55s/it]

Time taken 5.347750902175903


 54%|█████████████████████████████████████████████████████████████████████████████████████████▉                                                                           | 213/391 [19:21<17:17,  5.83s/it]

Time taken 6.476157903671265


 55%|██████████████████████████████████████████████████████████████████████████████████████████▎                                                                          | 214/391 [19:27<17:18,  5.87s/it]

Time taken 5.953500986099243


 55%|██████████████████████████████████████████████████████████████████████████████████████████▋                                                                          | 215/391 [19:33<17:19,  5.91s/it]

Time taken 6.003827810287476


 55%|███████████████████████████████████████████████████████████████████████████████████████████▏                                                                         | 216/391 [19:38<16:51,  5.78s/it]

Time taken 5.483222961425781


 55%|███████████████████████████████████████████████████████████████████████████████████████████▌                                                                         | 217/391 [19:44<16:58,  5.85s/it]

Time taken 6.008946180343628


 56%|███████████████████████████████████████████████████████████████████████████████████████████▉                                                                         | 218/391 [19:50<16:32,  5.74s/it]

Time taken 5.4700608253479


 56%|████████████████████████████████████████████████████████████████████████████████████████████▍                                                                        | 219/391 [19:55<16:13,  5.66s/it]

Time taken 5.4786057472229


 56%|████████████████████████████████████████████████████████████████████████████████████████████▊                                                                        | 220/391 [20:01<16:13,  5.69s/it]

Time taken 5.769911050796509


 57%|█████████████████████████████████████████████████████████████████████████████████████████████▎                                                                       | 221/391 [20:06<15:52,  5.61s/it]

Time taken 5.3933961391448975


 57%|█████████████████████████████████████████████████████████████████████████████████████████████▋                                                                       | 222/391 [20:12<15:50,  5.63s/it]

Time taken 5.6674957275390625


 57%|██████████████████████████████████████████████████████████████████████████████████████████████                                                                       | 223/391 [20:18<15:33,  5.56s/it]

Time taken 5.396679878234863


 57%|██████████████████████████████████████████████████████████████████████████████████████████████▌                                                                      | 224/391 [20:23<15:23,  5.53s/it]

Time taken 5.45756196975708


 58%|██████████████████████████████████████████████████████████████████████████████████████████████▉                                                                      | 225/391 [20:28<15:11,  5.49s/it]

Time taken 5.396950006484985


 58%|███████████████████████████████████████████████████████████████████████████████████████████████▎                                                                     | 226/391 [20:34<14:59,  5.45s/it]

Time taken 5.365642070770264


 58%|███████████████████████████████████████████████████████████████████████████████████████████████▊                                                                     | 227/391 [20:39<14:59,  5.48s/it]

Time taken 5.552994966506958


 58%|████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                    | 228/391 [20:45<14:42,  5.41s/it]

Time taken 5.2511210441589355


 59%|████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                    | 229/391 [20:50<14:23,  5.33s/it]

Time taken 5.121581792831421


 59%|█████████████████████████████████████████████████████████████████████████████████████████████████                                                                    | 230/391 [20:55<14:28,  5.40s/it]

Time taken 5.556441783905029


 59%|█████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                   | 231/391 [21:01<14:40,  5.50s/it]

Time taken 5.743027925491333


 59%|█████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                   | 232/391 [21:06<14:14,  5.38s/it]

Time taken 5.084775924682617


 60%|██████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                  | 233/391 [21:11<13:58,  5.31s/it]

Time taken 5.140769958496094


 60%|██████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                  | 234/391 [21:16<13:41,  5.23s/it]

Time taken 5.061092853546143


 60%|███████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                 | 235/391 [21:21<13:27,  5.18s/it]

Time taken 5.040111303329468


 60%|███████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                 | 236/391 [21:26<13:15,  5.13s/it]

Time taken 5.020949125289917


 61%|████████████████████████████████████████████████████████████████████████████████████████████████████                                                                 | 237/391 [21:31<13:10,  5.13s/it]

Time taken 5.136554002761841


 61%|████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                | 238/391 [21:37<13:18,  5.22s/it]

Time taken 5.409871816635132


 61%|████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                | 239/391 [21:42<13:08,  5.19s/it]

Time taken 5.11772084236145


 61%|█████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                               | 240/391 [21:47<12:58,  5.16s/it]

Time taken 5.084916114807129


 62%|█████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                               | 241/391 [21:52<12:48,  5.12s/it]

Time taken 5.0406270027160645


 62%|██████████████████████████████████████████████████████████████████████████████████████████████████████                                                               | 242/391 [21:57<12:42,  5.12s/it]

Time taken 5.093671798706055


 62%|██████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                              | 243/391 [22:02<12:32,  5.09s/it]

Time taken 5.020354986190796


 62%|██████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                              | 244/391 [22:09<13:29,  5.51s/it]

Time taken 6.485924959182739


 63%|███████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                             | 245/391 [22:15<13:51,  5.70s/it]

Time taken 6.13808798789978


 63%|███████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                             | 246/391 [22:21<13:43,  5.68s/it]

Time taken 5.63906192779541


 63%|████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                            | 247/391 [22:26<13:31,  5.63s/it]

Time taken 5.5160839557647705


 63%|████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                            | 248/391 [22:32<13:48,  5.80s/it]

Time taken 6.17588996887207


 64%|█████████████████████████████████████████████████████████████████████████████████████████████████████████                                                            | 249/391 [22:38<13:24,  5.67s/it]

Time taken 5.359253883361816


 64%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                           | 250/391 [22:43<13:10,  5.60s/it]

Time taken 5.452854156494141


 64%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                           | 251/391 [22:48<12:43,  5.45s/it]

Time taken 5.09143590927124


 64%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                          | 252/391 [22:53<12:19,  5.32s/it]

Time taken 5.0182249546051025


 65%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                          | 253/391 [22:58<12:02,  5.23s/it]

Time taken 5.027590036392212


 65%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                         | 254/391 [23:03<11:48,  5.17s/it]

Time taken 5.029141664505005


 65%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                         | 255/391 [23:08<11:37,  5.13s/it]

Time taken 5.0332112312316895


 65%|████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                         | 256/391 [23:13<11:28,  5.10s/it]

Time taken 5.026362895965576


 66%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                        | 257/391 [23:18<11:20,  5.08s/it]

Time taken 5.017302989959717


 66%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                        | 258/391 [23:23<11:14,  5.07s/it]

Time taken 5.05117392539978


 66%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                       | 259/391 [23:28<11:07,  5.06s/it]

Time taken 5.019776105880737


 66%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                       | 260/391 [23:33<11:00,  5.04s/it]

Time taken 5.005504131317139


 67%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                      | 261/391 [23:38<10:54,  5.04s/it]

Time taken 5.02125096321106


 67%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                      | 262/391 [23:44<10:54,  5.07s/it]

Time taken 5.15365195274353


 67%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                      | 263/391 [23:49<10:53,  5.10s/it]

Time taken 5.170140027999878


 68%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                     | 264/391 [23:54<10:48,  5.11s/it]

Time taken 5.111960172653198


 68%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                     | 265/391 [23:59<10:40,  5.08s/it]

Time taken 5.028595924377441


 68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                    | 266/391 [24:04<10:33,  5.07s/it]

Time taken 5.027787208557129


 68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                    | 267/391 [24:09<10:26,  5.05s/it]

Time taken 5.010351896286011


 69%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                    | 268/391 [24:14<10:21,  5.05s/it]

Time taken 5.057626962661743


 69%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                   | 269/391 [24:19<10:28,  5.15s/it]

Time taken 5.374823808670044


 69%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                   | 270/391 [24:24<10:19,  5.12s/it]

Time taken 5.049011945724487


 69%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                  | 271/391 [24:29<10:12,  5.10s/it]

Time taken 5.050807952880859


 70%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                  | 272/391 [24:35<10:04,  5.08s/it]

Time taken 5.027444124221802


 70%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                 | 273/391 [24:40<09:57,  5.07s/it]

Time taken 5.035735130310059


 70%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                 | 274/391 [24:45<09:53,  5.07s/it]

Time taken 5.085108280181885


 70%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                 | 275/391 [24:50<09:47,  5.07s/it]

Time taken 5.051038026809692


 71%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                | 276/391 [24:55<09:42,  5.07s/it]

Time taken 5.064509868621826


 71%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                | 277/391 [25:00<09:36,  5.06s/it]

Time taken 5.039624214172363


 71%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                               | 278/391 [25:05<09:31,  5.06s/it]

Time taken 5.047235012054443


 71%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                               | 279/391 [25:10<09:26,  5.06s/it]

Time taken 5.052550315856934


 72%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                              | 280/391 [25:15<09:20,  5.05s/it]

Time taken 5.039964914321899


 72%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                              | 281/391 [25:20<09:17,  5.07s/it]

Time taken 5.095087051391602


 72%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                              | 282/391 [25:25<09:13,  5.08s/it]

Time taken 5.095901250839233


 72%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                             | 283/391 [25:30<09:06,  5.06s/it]

Time taken 5.012830972671509


 73%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                             | 284/391 [25:35<08:59,  5.04s/it]

Time taken 5.011538982391357


 73%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                            | 285/391 [25:40<08:54,  5.04s/it]

Time taken 5.039980888366699


 73%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                            | 286/391 [25:45<08:49,  5.04s/it]

Time taken 5.041895866394043


 73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                            | 287/391 [25:50<08:45,  5.05s/it]

Time taken 5.058289289474487


 74%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                           | 288/391 [25:55<08:42,  5.07s/it]

Time taken 5.131070852279663


 74%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                           | 289/391 [26:00<08:36,  5.06s/it]

Time taken 5.0289130210876465


 74%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                          | 290/391 [26:06<08:30,  5.05s/it]

Time taken 5.033467769622803


 74%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                          | 291/391 [26:11<08:29,  5.09s/it]

Time taken 5.176174879074097


 75%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                         | 292/391 [26:16<08:21,  5.07s/it]

Time taken 5.011815786361694


 75%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                         | 293/391 [26:21<08:15,  5.06s/it]

Time taken 5.023198843002319


 75%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                         | 294/391 [26:26<08:11,  5.07s/it]

Time taken 5.087006092071533


 75%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                        | 295/391 [26:31<08:08,  5.08s/it]

Time taken 5.124559164047241


 76%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                        | 296/391 [26:36<08:01,  5.06s/it]

Time taken 5.016853094100952


 76%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                       | 297/391 [26:41<07:55,  5.06s/it]

Time taken 5.034061670303345


 76%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                       | 298/391 [26:46<07:49,  5.05s/it]

Time taken 5.0238447189331055


 76%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                      | 299/391 [26:51<07:43,  5.03s/it]

Time taken 5.001771926879883


 77%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                      | 300/391 [26:56<07:37,  5.02s/it]

Time taken 4.9971089363098145


 77%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                      | 301/391 [27:01<07:31,  5.02s/it]

Time taken 5.0137999057769775


 77%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                     | 302/391 [27:06<07:26,  5.02s/it]

Time taken 5.0203938484191895


 77%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                     | 303/391 [27:11<07:22,  5.02s/it]

Time taken 5.027920246124268


 78%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                    | 304/391 [27:16<07:17,  5.03s/it]

Time taken 5.031237840652466


 78%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                    | 305/391 [27:21<07:13,  5.04s/it]

Time taken 5.055809020996094


 78%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                   | 306/391 [27:26<07:08,  5.04s/it]

Time taken 5.039740324020386


 79%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                   | 307/391 [27:31<07:03,  5.04s/it]

Time taken 5.036769866943359


 79%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                   | 308/391 [27:36<06:58,  5.04s/it]

Time taken 5.053769826889038


 79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                  | 309/391 [27:41<06:53,  5.04s/it]

Time taken 5.037951946258545


 79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                  | 310/391 [27:46<06:48,  5.04s/it]

Time taken 5.024827003479004


 80%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                 | 311/391 [27:51<06:42,  5.03s/it]

Time taken 5.0036633014678955


 80%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                 | 312/391 [27:56<06:36,  5.02s/it]

Time taken 5.007904052734375


 80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                 | 313/391 [28:01<06:31,  5.02s/it]

Time taken 5.025583982467651


 80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                | 314/391 [28:06<06:27,  5.03s/it]

Time taken 5.032351732254028


 81%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                | 315/391 [28:12<06:22,  5.03s/it]

Time taken 5.042097091674805


 81%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                               | 316/391 [28:17<06:17,  5.04s/it]

Time taken 5.053881883621216


 81%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                               | 317/391 [28:22<06:13,  5.04s/it]

Time taken 5.046842813491821


 81%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                              | 318/391 [28:27<06:08,  5.05s/it]

Time taken 5.071319103240967


 82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                              | 319/391 [28:32<06:02,  5.04s/it]

Time taken 5.014080047607422


 82%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                              | 320/391 [28:37<05:57,  5.03s/it]

Time taken 5.01624608039856


 82%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                             | 321/391 [28:42<05:51,  5.03s/it]

Time taken 5.003582954406738


 82%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                             | 322/391 [28:47<05:53,  5.13s/it]

Time taken 5.354602098464966


 83%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                            | 323/391 [28:52<05:46,  5.09s/it]

Time taken 5.005229949951172


 83%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                            | 324/391 [28:57<05:39,  5.07s/it]

Time taken 5.022474050521851


 83%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                           | 325/391 [29:02<05:33,  5.05s/it]

Time taken 5.012388706207275


 83%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                           | 326/391 [29:07<05:27,  5.03s/it]

Time taken 4.978478193283081


 84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                           | 327/391 [29:12<05:22,  5.04s/it]

Time taken 5.05645489692688


 84%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                          | 328/391 [29:17<05:17,  5.04s/it]

Time taken 5.024585008621216


 84%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                          | 329/391 [29:22<05:11,  5.03s/it]

Time taken 5.016825199127197


 84%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                         | 330/391 [29:27<05:06,  5.03s/it]

Time taken 5.008671998977661


 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                         | 331/391 [29:32<05:01,  5.02s/it]

Time taken 5.0049920082092285


 85%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                         | 332/391 [29:37<04:55,  5.02s/it]

Time taken 5.00554084777832


 85%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                        | 333/391 [29:42<04:50,  5.01s/it]

Time taken 5.002759218215942


 85%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                        | 334/391 [29:47<04:45,  5.01s/it]

Time taken 4.99573278427124


 86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                       | 335/391 [29:52<04:43,  5.05s/it]

Time taken 5.159768104553223


 86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                       | 336/391 [29:57<04:37,  5.04s/it]

Time taken 4.997600078582764


 86%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                      | 337/391 [30:02<04:31,  5.02s/it]

Time taken 4.99207615852356


 86%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                      | 338/391 [30:07<04:26,  5.02s/it]

Time taken 5.011332035064697


 87%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                      | 339/391 [30:12<04:21,  5.03s/it]

Time taken 5.032275199890137


 87%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                     | 340/391 [30:17<04:16,  5.02s/it]

Time taken 5.01146388053894


 87%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                     | 341/391 [30:23<04:12,  5.04s/it]

Time taken 5.095976829528809


 87%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                    | 342/391 [30:28<04:07,  5.05s/it]

Time taken 5.048757076263428


 88%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                    | 343/391 [30:33<04:01,  5.03s/it]

Time taken 5.00277304649353


 88%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                   | 344/391 [30:38<03:56,  5.03s/it]

Time taken 5.012031078338623


 88%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                   | 345/391 [30:43<03:52,  5.06s/it]

Time taken 5.132297992706299


 88%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                   | 346/391 [30:48<03:47,  5.05s/it]

Time taken 5.012980937957764


 89%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                  | 347/391 [30:53<03:41,  5.03s/it]

Time taken 5.0007710456848145


 89%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                  | 348/391 [30:58<03:36,  5.02s/it]

Time taken 4.998333215713501


 89%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                 | 349/391 [31:03<03:30,  5.02s/it]

Time taken 5.004971027374268


 90%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                 | 350/391 [31:08<03:25,  5.01s/it]

Time taken 4.9980738162994385


 90%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                 | 351/391 [31:13<03:20,  5.02s/it]

Time taken 5.039513826370239


 90%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                | 352/391 [31:18<03:16,  5.04s/it]

Time taken 5.078864097595215


 90%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                | 353/391 [31:23<03:11,  5.03s/it]

Time taken 5.011955976486206


 91%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍               | 354/391 [31:28<03:06,  5.05s/it]

Time taken 5.088624000549316


 91%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊               | 355/391 [31:33<03:01,  5.04s/it]

Time taken 5.001399993896484


 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏              | 356/391 [31:38<02:56,  5.03s/it]

Time taken 5.015434980392456


 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋              | 357/391 [31:43<02:50,  5.02s/it]

Time taken 4.996129989624023


 92%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████              | 358/391 [31:48<02:45,  5.01s/it]

Time taken 4.995478868484497


 92%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍             | 359/391 [31:53<02:40,  5.01s/it]

Time taken 4.995004177093506


 92%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉             | 360/391 [31:58<02:35,  5.01s/it]

Time taken 4.996252059936523


 92%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎            | 361/391 [32:03<02:30,  5.00s/it]

Time taken 4.992713928222656


 93%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊            | 362/391 [32:08<02:25,  5.01s/it]

Time taken 5.0093817710876465


 93%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏           | 363/391 [32:13<02:20,  5.02s/it]

Time taken 5.042230606079102


 93%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌           | 364/391 [32:18<02:15,  5.02s/it]

Time taken 5.013372898101807


 93%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████           | 365/391 [32:23<02:10,  5.01s/it]

Time taken 4.988036155700684


 94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍          | 366/391 [32:28<02:05,  5.01s/it]

Time taken 5.0219597816467285


 94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊          | 367/391 [32:33<02:00,  5.01s/it]

Time taken 4.991889238357544


 94%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎         | 368/391 [32:38<01:55,  5.01s/it]

Time taken 5.005016803741455


 94%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋         | 369/391 [32:43<01:50,  5.00s/it]

Time taken 4.98221492767334


 95%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏        | 370/391 [32:48<01:45,  5.00s/it]

Time taken 5.000766038894653


 95%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌        | 371/391 [32:53<01:40,  5.02s/it]

Time taken 5.0670130252838135


 95%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉        | 372/391 [32:58<01:35,  5.05s/it]

Time taken 5.098474025726318


 95%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍       | 373/391 [33:03<01:30,  5.04s/it]

Time taken 5.008271932601929


 96%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊       | 374/391 [33:08<01:25,  5.03s/it]

Time taken 5.009094953536987


 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏      | 375/391 [33:13<01:20,  5.02s/it]

Time taken 4.995713949203491


 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋      | 376/391 [33:18<01:15,  5.01s/it]

Time taken 4.992571830749512


 96%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████      | 377/391 [33:23<01:10,  5.01s/it]

Time taken 5.01991605758667


 97%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌     | 378/391 [33:28<01:05,  5.01s/it]

Time taken 4.98943305015564


 97%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉     | 379/391 [33:33<01:00,  5.00s/it]

Time taken 4.985914945602417


 97%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎    | 380/391 [33:38<00:55,  5.00s/it]

Time taken 5.004579067230225


 97%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊    | 381/391 [33:43<00:49,  5.00s/it]

Time taken 4.984123945236206


 98%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏   | 382/391 [33:49<00:46,  5.12s/it]

Time taken 5.386636018753052


 98%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌   | 383/391 [33:54<00:40,  5.09s/it]

Time taken 5.033547878265381


 98%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████   | 384/391 [33:59<00:35,  5.11s/it]

Time taken 5.160978078842163


 98%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍  | 385/391 [34:04<00:30,  5.08s/it]

Time taken 5.0095038414001465


 99%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉  | 386/391 [34:09<00:25,  5.06s/it]

Time taken 5.01046895980835


 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎ | 387/391 [34:14<00:20,  5.05s/it]

Time taken 5.0139758586883545


 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋ | 388/391 [34:19<00:15,  5.04s/it]

Time taken 5.030633211135864


 99%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏| 389/391 [34:24<00:10,  5.04s/it]

Time taken 5.017925024032593


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌| 390/391 [34:29<00:05,  5.03s/it]

Time taken 5.0067298412323


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 391/391 [34:32<00:00,  4.51s/it]

Time taken 3.28872013092041


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 391/391 [34:42<00:00,  5.33s/it]


In [None]:
for p

In [261]:
train(model,trainloader,testloader,optimizer,steps=1000)

Step:0. Train Loss 0.41296520829200745
Step:0. Validation loss: 0.5910269825518886. Validation Accuracy: 0.827
Step:100. Train Loss 0.46224588707089426
Step:200. Train Loss 0.44608253449201585
Step:300. Train Loss 0.41712217807769775
Step:400. Train Loss 0.9450620767474175
Step:500. Train Loss 1.1603494328260422
Step:500. Validation loss: 0.8606878285166584. Validation Accuracy: 0.7267


Exception ignored in: <function _MultiProcessingDataLoaderIter.__del__ at 0x1148990d0>
Traceback (most recent call last):
  File "/Users/hung/miniforge3/envs/bourbon/lib/python3.8/site-packages/torch/utils/data/dataloader.py", line 1510, in __del__
    self._shutdown_workers()
  File "/Users/hung/miniforge3/envs/bourbon/lib/python3.8/site-packages/torch/utils/data/dataloader.py", line 1474, in _shutdown_workers
    w.join(timeout=_utils.MP_STATUS_CHECK_INTERVAL)
  File "/Users/hung/miniforge3/envs/bourbon/lib/python3.8/multiprocessing/process.py", line 149, in join
    res = self._popen.wait(timeout)
  File "/Users/hung/miniforge3/envs/bourbon/lib/python3.8/multiprocessing/popen_fork.py", line 44, in wait
    if not wait([self.sentinel], timeout):
  File "/Users/hung/miniforge3/envs/bourbon/lib/python3.8/multiprocessing/connection.py", line 931, in wait
    ready = selector.select(timeout)
  File "/Users/hung/miniforge3/envs/bourbon/lib/python3.8/selectors.py", line 415, in select
    

KeyboardInterrupt: 

In [243]:
student_model = Student(10)

In [244]:
student_opt = torch.optim.Adam(params=student_model.parameters(),lr=1e-3)


In [252]:
train(student_model,trainloader,testloader,student_opt,steps=5000)

Step:0. Train Loss 0.7889266610145569
Step:0. Validation loss: 1.0580933207198033. Validation Accuracy: 0.627
Step:100. Train Loss 0.9727080065011978
Step:200. Train Loss 0.9813728594779968
Step:300. Train Loss 1.0129813933372498
Step:400. Train Loss 0.9921359550952912
Step:500. Train Loss 0.9745008969306945
Step:500. Validation loss: 1.0568674463260024. Validation Accuracy: 0.6361
Step:600. Train Loss 0.9770104998350143
Step:700. Train Loss 0.9855066519975663
Step:800. Train Loss 0.9667122340202332
Step:900. Train Loss 0.9856679660081863
Step:1000. Train Loss 0.9851827013492584
Step:1000. Validation loss: 1.078304808351058. Validation Accuracy: 0.6292
Step:1100. Train Loss 0.9646671545505524
Step:1200. Train Loss 0.9871096676588058
Step:1300. Train Loss 0.9795529127120972
Step:1400. Train Loss 0.9747875857353211
Step:1500. Train Loss 0.9577085196971893
Step:1500. Validation loss: 1.0452931251706956. Validation Accuracy: 0.638
Step:1600. Train Loss 0.9664068067073822
Step:1700. Train L

In [246]:
student_model_distill = Student(10)
student_opt_distill = torch.optim.Adam(params=student_model_distill.parameters(),lr=1e-3)


In [258]:
train(student_model_distill,trainloader,testloader,student_opt_distill,steps=2500,teacher_logits=teacher_logits)

Step:0. Train Loss 0.06987519562244415
Step:0. Validation loss: 1.0010248664059216. Validation Accuracy: 0.6542
Step:100. Train Loss 0.08398781444877386
Step:200. Train Loss 0.08447678543627263
Step:300. Train Loss 0.08440859839320183
Step:400. Train Loss 0.08577650003135204
Step:500. Train Loss 0.08460785366594792
Step:500. Validation loss: 1.013599473464338. Validation Accuracy: 0.6549
Step:600. Train Loss 0.08441449768841267
Step:700. Train Loss 0.08601541992276907
Step:800. Train Loss 0.08517735738307237
Step:900. Train Loss 0.08541839994490147
Step:1000. Train Loss 0.08511019174009561
Step:1000. Validation loss: 1.0093797173681138. Validation Accuracy: 0.6557
Step:1100. Train Loss 0.08470616422593594
Step:1200. Train Loss 0.08378019031137228
Step:1300. Train Loss 0.08416977971792221
Step:1400. Train Loss 0.08613279845565558
Step:1500. Train Loss 0.08508556980639696
Step:1500. Validation loss: 1.0116978280151947. Validation Accuracy: 0.6574
Step:1600. Train Loss 0.08573085896670818

In [138]:
@torch.no_grad()
def predict(model,data):
    start = time.time()
    out = model(data)
    end = time.time()
    print(f"Time taken {end-start}")
    return out