In [1]:
import numpy as np
import copy
import matplotlib
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D

In [2]:
import torch
import torch.nn as nn
import dtnnlib as dtnn
# import resnet_cifar

from torchvision import datasets, transforms as T
from torch.utils import data

In [3]:
from tqdm import tqdm
import os, time, sys
import json

In [4]:
mnist_transform = T.Compose([
    T.ToTensor(),
    T.Normalize(
        mean=[0.5,],
        std=[0.5,],
    ),
])

train_dataset = datasets.FashionMNIST(root="../../../../_Datasets/", train=True, download=True, transform=mnist_transform)
test_dataset = datasets.FashionMNIST(root="../../../../_Datasets/", train=False, download=True, transform=mnist_transform)

In [5]:
# train_dataset.data = train_dataset.data.view(-1, 28*28)
# test_dataset.data = test_dataset.data.view(-1, 28*28)

In [6]:
batch_size = 50
train_loader = data.DataLoader(dataset=train_dataset, num_workers=4, batch_size=batch_size, shuffle=True)
test_loader = data.DataLoader(dataset=test_dataset, num_workers=4, batch_size=batch_size, shuffle=False)

In [7]:
device = torch.device("cuda:0")

In [8]:
criterion = nn.CrossEntropyLoss()

In [9]:
for xx, yy in train_loader:
    xx, yy = xx.to(device), yy.to(device)
    print(xx.shape, yy.shape)
    break



torch.Size([50, 1, 28, 28]) torch.Size([50])


## Any function as metric

In [10]:
class FunctionDT(nn.Module):
    
    def __init__(self, input_dim, num_centers, func, inv_temp=0.):
        '''
        func [input_dim -> 1]
        '''
        super().__init__()
        self.input_dim = input_dim
        self.num_centers = num_centers
        self.func = func
        
        self.inv_temp = nn.Parameter(torch.ones(1)*inv_temp)
        
        self.centers = torch.randn(num_centers, input_dim)/3.
        self.centers = nn.Parameter(self.centers)
    
    def forward(self, x):
        z = x.unsqueeze(1) - self.centers.unsqueeze(0)
        dists = self.func(z).squeeze(-1)
        dists = -dists*torch.exp(self.inv_temp)
        
        ## COmment out (un-normalized)
#         dists = dists-dists.mean(dim=1, keepdim=True)
#         dists = dists/dists.std(dim=1, keepdim=True)

        return dists

In [11]:
from classes import DistanceRegressor, ConvexNN
from nflib.flows import SequentialFlow, ActNorm
import nflib.res_flow as irf



## Merge all models into single and benchmark

In [12]:
def get_models(h = 5, device='cpu'):
    I = 784
    layer1 = {
        "l_0.5":dtnn.DistanceTransform(I, h, p=0.5, bias=False),
        "l_1":dtnn.DistanceTransform(I, h, p=1, bias=False),
        "l_2":dtnn.DistanceTransform(I, h, bias=False),
        "l_inf":dtnn.DistanceTransform(I, h, p=20, bias=False),
        "stereo":dtnn.StereographicTransform(I, h, bias=False),
        "linear":nn.Linear(I, h, bias=False)
    }
    net_dict = {}
    for key in layer1:
        net = nn.Sequential(
            layer1[key],
            nn.BatchNorm1d(h),
            nn.ELU(),
            nn.Linear(h, 10),
            )
        net_dict[key] = net.to(device)
    return net_dict

In [13]:
def get_models_func(h = 500, func_h=500, device='cpu'):
    layer1 = {
        "convex":ConvexNN([784, func_h, 1]),
        "invex":nn.Sequential(
                    ActNorm(784),
                    irf.ResidualFlow(784, [func_h], activation=irf.LeakyReLU),
                    ActNorm(784),
                    DistanceRegressor(784),
                    ),
        "ordinary":nn.Sequential(
                    ActNorm(784),
                    irf.ResidualFlow(784, [func_h], activation=irf.LeakyReLU),
                    ActNorm(784),
#                     DistanceRegressor(784),
                    nn.Linear(784, 1),
                    ),
    }
    irf.remove_spectral_norm_model(layer1["ordinary"])

    net_dict = {}
    for key in layer1:
        net = nn.Sequential(
            FunctionDT(784, h, layer1[key]),
            nn.BatchNorm1d(h),
            nn.ELU(),
            nn.Linear(h, 10),
            )
        net_dict[key] = net.to(device)
    return net_dict

In [14]:
## Following is copied from 
### https://github.com/kuangliu/pytorch-cifar/blob/master/main.py

# Training
def train(epoch, model, optimizer):
    model.train()
    train_loss = 0
    correct = 0
    total = 0
    for batch_idx, (inputs, targets) in enumerate(tqdm(train_loader)):
        inputs, targets = inputs.to(device).view(-1, 28*28), targets.to(device)
        optimizer.zero_grad()
        outputs = model(inputs)
        loss = criterion(outputs, targets)
        loss.backward()
        optimizer.step()

        train_loss += loss.item()
        _, predicted = outputs.max(1)
        total += targets.size(0)
        correct += predicted.eq(targets).sum().item()
    print(f"[Train] {epoch} Loss: {train_loss/(batch_idx+1):.3f} | Acc: {100.*correct/total:.3f} {correct}/{total}")
    return

In [15]:
best_acc = -1
def test(epoch, model, model_name):
    global best_acc
    model.eval()
    test_loss = 0
    correct = 0
    total = 0
    with torch.no_grad():
        for batch_idx, (inputs, targets) in enumerate(tqdm(test_loader)):
            inputs, targets = inputs.to(device).view(-1, 28*28), targets.to(device)
            outputs = model(inputs)
            loss = criterion(outputs, targets)

            test_loss += loss.item()
            _, predicted = outputs.max(1)
            total += targets.size(0)
            correct += predicted.eq(targets).sum().item()
            
    print(f"[Test] {epoch} Loss: {test_loss/(batch_idx+1):.3f} | Acc: {100.*correct/total:.3f} {correct}/{total}")
    
    # Save checkpoint.
    acc = 100.*correct/total
    if acc > best_acc:
        print('Saving..')
        state = {
            'model': model.state_dict(),
            'acc': acc,
            'epoch': epoch,
        }
        if not os.path.isdir('models'):
            os.mkdir('models')
        torch.save(state, f'./models/{model_name}.pth')
        best_acc = acc

In [16]:
learning_rate = 0.0001
EPOCHS = 50

In [17]:
exp_acc_vals = {}

In [18]:
data_file = "./outputs/00.2_exp_acc_dict_bkp0(un-normalized).json"

with open(data_file, 'r') as f:
    exp_acc_vals = json.load(f)

In [19]:
exp_acc_vals

{'5': {'l_0.5': 67.05,
  'l_1': 70.7,
  'l_2': 78.15,
  'l_inf': 79.52,
  'stereo': 82.19,
  'linear': 82.74,
  'convex': 79.49,
  'invex': 88.26},
 '10': {'l_0.5': 72.08,
  'l_1': 77.91,
  'l_2': 82.35,
  'l_inf': 83.98,
  'stereo': 84.73,
  'linear': 84.89,
  'convex': 78.99,
  'invex': 88.41},
 '20': {'l_0.5': 75.54,
  'l_1': 80.08,
  'l_2': 83.82,
  'l_inf': 85.17,
  'stereo': 85.86,
  'linear': 86.27,
  'convex': 81.03,
  'invex': 88.85},
 '100': {'l_0.5': 78.27,
  'l_1': 82.07,
  'l_2': 86.41,
  'l_inf': 87.02,
  'stereo': 87.99,
  'linear': 88.67,
  'convex': 78.07,
  'invex': 87.85},
 '500': {'l_0.5': 79.94,
  'l_1': 83.43,
  'l_2': 87.98,
  'l_inf': 88.23,
  'stereo': 89.26,
  'linear': 89.62,
  'convex': 79.68,
  'invex': 88.69}}

In [20]:
H = [5, 10, 20, 100, 500]
net_keys = {**get_models(1), **get_models_func(1)}.keys()
# net_keys = {**get_models_func(1)}.keys()

net_keys

Yes Linear(in_features=784, out_features=500, bias=True)
Success
Yes Linear(in_features=500, out_features=784, bias=True)
Success
Yes Linear(in_features=784, out_features=1, bias=True)
Failed


dict_keys(['l_0.5', 'l_1', 'l_2', 'l_inf', 'stereo', 'linear', 'convex', 'invex', 'ordinary'])

In [21]:
# H_ = [h for h in H if str(h) not in exp_acc_vals.keys()]
H_ = []
for h in H:
    if str(h) in exp_acc_vals.keys():
        NET_KEYS = [k for k in net_keys if k not in list(exp_acc_vals[str(h)].keys())]
        print(h, NET_KEYS)
        if len(NET_KEYS) > 0:
            H_.append(h)
    else:
        H_.append(h)

H_

5 ['ordinary']
10 ['ordinary']
20 ['ordinary']
100 ['ordinary']
500 ['ordinary']


[5, 10, 20, 100, 500]

In [22]:
# h = 20
# NET_KEYS = list(net_keys)
# if str(h) in exp_acc_vals.keys():
#     NET_KEYS = [k for k in net_keys if k not in list(exp_acc_vals[str(h)].keys())[:-2]]

In [23]:
# NET_KEYS

In [24]:
# str(h) in exp_acc_vals.keys()

In [25]:
for h in H_:
    net_dict = {**get_models(h), **get_models_func(h)}
    acc_dict = {}
    NET_KEYS = list(net_keys)
    
    if str(h) in exp_acc_vals.keys():
        acc_dict = exp_acc_vals[str(h)]
        NET_KEYS = [k for k in net_keys if k not in list(exp_acc_vals[str(h)].keys())]
        pass
                    
    for key in NET_KEYS:
        print("_________________________")
        print(f"Experimenting for {key} ; h:{h}")
        net = net_dict[key].to(device)
        
        model_name = f"00.2_fmnist_{key}_h{h}"
        
        optimizer = torch.optim.Adam(net.parameters(), lr=learning_rate)
        scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=EPOCHS)
        best_acc = -1
        for epoch in range(EPOCHS):
            train(epoch, net, optimizer)
            test(epoch, net, model_name)
            scheduler.step()
        acc_dict[key] = float(best_acc)
        exp_acc_vals[str(h)] = acc_dict
        
        ## Save it in the file.
        with open(data_file, "w") as f:
            json.dump(exp_acc_vals, f, indent=3)
        
        pass
        

Yes Linear(in_features=784, out_features=500, bias=True)
Success
Yes Linear(in_features=500, out_features=784, bias=True)
Success
Yes Linear(in_features=784, out_features=1, bias=True)
Failed
_________________________
Experimenting for ordinary ; h:5


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 295.39it/s]


[Train] 0 Loss: 1.894 | Acc: 37.630 22578/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 412.33it/s]


[Test] 0 Loss: 1.722 | Acc: 49.210 4921/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 304.73it/s]


[Train] 1 Loss: 1.543 | Acc: 59.585 35751/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 424.37it/s]


[Test] 1 Loss: 1.412 | Acc: 65.920 6592/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 308.75it/s]


[Train] 2 Loss: 1.294 | Acc: 67.548 40529/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 445.19it/s]


[Test] 2 Loss: 1.160 | Acc: 70.260 7026/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 310.97it/s]


[Train] 3 Loss: 1.116 | Acc: 70.332 42199/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 412.41it/s]


[Test] 3 Loss: 1.017 | Acc: 71.930 7193/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 307.43it/s]


[Train] 4 Loss: 0.989 | Acc: 72.165 43299/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 431.89it/s]


[Test] 4 Loss: 0.915 | Acc: 73.530 7353/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 308.24it/s]


[Train] 5 Loss: 0.891 | Acc: 73.993 44396/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 436.17it/s]


[Test] 5 Loss: 0.850 | Acc: 74.580 7458/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 304.70it/s]


[Train] 6 Loss: 0.821 | Acc: 75.378 45227/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 424.87it/s]


[Test] 6 Loss: 0.766 | Acc: 76.820 7682/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 304.98it/s]


[Train] 7 Loss: 0.765 | Acc: 76.712 46027/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 426.64it/s]


[Test] 7 Loss: 0.741 | Acc: 77.700 7770/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 308.30it/s]


[Train] 8 Loss: 0.723 | Acc: 77.655 46593/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 405.47it/s]


[Test] 8 Loss: 0.706 | Acc: 77.850 7785/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 310.08it/s]


[Train] 9 Loss: 0.683 | Acc: 78.428 47057/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 427.73it/s]


[Test] 9 Loss: 0.666 | Acc: 78.800 7880/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 306.07it/s]


[Train] 10 Loss: 0.658 | Acc: 79.075 47445/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 414.13it/s]


[Test] 10 Loss: 0.648 | Acc: 79.280 7928/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 307.26it/s]


[Train] 11 Loss: 0.630 | Acc: 79.795 47877/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 431.05it/s]


[Test] 11 Loss: 0.684 | Acc: 79.210 7921/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 310.54it/s]


[Train] 12 Loss: 0.609 | Acc: 80.108 48065/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 412.45it/s]


[Test] 12 Loss: 0.592 | Acc: 80.190 8019/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 307.15it/s]


[Train] 13 Loss: 0.593 | Acc: 80.467 48280/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 430.98it/s]


[Test] 13 Loss: 0.593 | Acc: 80.680 8068/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 305.18it/s]


[Train] 14 Loss: 0.580 | Acc: 80.897 48538/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 417.21it/s]


[Test] 14 Loss: 0.583 | Acc: 80.400 8040/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 309.36it/s]


[Train] 15 Loss: 0.568 | Acc: 81.048 48629/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 435.77it/s]


[Test] 15 Loss: 0.558 | Acc: 81.210 8121/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 306.35it/s]


[Train] 16 Loss: 0.557 | Acc: 81.312 48787/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 437.67it/s]


[Test] 16 Loss: 0.554 | Acc: 81.180 8118/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 311.64it/s]


[Train] 17 Loss: 0.545 | Acc: 81.787 49072/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 423.15it/s]


[Test] 17 Loss: 0.550 | Acc: 81.400 8140/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 306.09it/s]


[Train] 18 Loss: 0.540 | Acc: 81.682 49009/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 412.75it/s]


[Test] 18 Loss: 0.554 | Acc: 80.930 8093/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 308.88it/s]


[Train] 19 Loss: 0.531 | Acc: 82.018 49211/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 440.53it/s]


[Test] 19 Loss: 0.544 | Acc: 81.630 8163/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 309.84it/s]


[Train] 20 Loss: 0.525 | Acc: 82.032 49219/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 415.32it/s]


[Test] 20 Loss: 0.531 | Acc: 81.830 8183/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 306.95it/s]


[Train] 21 Loss: 0.518 | Acc: 82.427 49456/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 412.70it/s]


[Test] 21 Loss: 0.523 | Acc: 82.000 8200/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 312.21it/s]


[Train] 22 Loss: 0.514 | Acc: 82.405 49443/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 423.08it/s]


[Test] 22 Loss: 0.527 | Acc: 82.030 8203/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 306.42it/s]


[Train] 23 Loss: 0.508 | Acc: 82.483 49490/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 430.93it/s]


[Test] 23 Loss: 0.524 | Acc: 81.830 8183/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 305.28it/s]


[Train] 24 Loss: 0.505 | Acc: 82.748 49649/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 422.44it/s]


[Test] 24 Loss: 0.514 | Acc: 82.280 8228/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 305.83it/s]


[Train] 25 Loss: 0.501 | Acc: 82.820 49692/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 411.71it/s]


[Test] 25 Loss: 0.516 | Acc: 82.230 8223/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 302.87it/s]


[Train] 26 Loss: 0.496 | Acc: 82.895 49737/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 433.88it/s]


[Test] 26 Loss: 0.520 | Acc: 81.980 8198/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 307.27it/s]


[Train] 27 Loss: 0.493 | Acc: 83.008 49805/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 427.13it/s]


[Test] 27 Loss: 0.508 | Acc: 82.490 8249/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 308.59it/s]


[Train] 28 Loss: 0.488 | Acc: 83.083 49850/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 433.87it/s]


[Test] 28 Loss: 0.509 | Acc: 82.610 8261/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 310.15it/s]


[Train] 29 Loss: 0.488 | Acc: 83.197 49918/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 414.66it/s]


[Test] 29 Loss: 0.514 | Acc: 82.380 8238/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 307.46it/s]


[Train] 30 Loss: 0.483 | Acc: 83.217 49930/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 411.92it/s]


[Test] 30 Loss: 0.506 | Acc: 82.690 8269/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 311.04it/s]


[Train] 31 Loss: 0.481 | Acc: 83.358 50015/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 406.76it/s]


[Test] 31 Loss: 0.507 | Acc: 82.390 8239/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 305.57it/s]


[Train] 32 Loss: 0.477 | Acc: 83.647 50188/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 394.77it/s]


[Test] 32 Loss: 0.502 | Acc: 82.830 8283/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 306.55it/s]


[Train] 33 Loss: 0.476 | Acc: 83.452 50071/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 408.54it/s]


[Test] 33 Loss: 0.499 | Acc: 82.870 8287/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 303.99it/s]


[Train] 34 Loss: 0.475 | Acc: 83.450 50070/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 394.75it/s]


[Test] 34 Loss: 0.502 | Acc: 82.900 8290/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 307.81it/s]


[Train] 35 Loss: 0.472 | Acc: 83.552 50131/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 414.54it/s]


[Test] 35 Loss: 0.502 | Acc: 83.030 8303/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 304.25it/s]


[Train] 36 Loss: 0.472 | Acc: 83.633 50180/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 413.27it/s]


[Test] 36 Loss: 0.499 | Acc: 82.860 8286/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 308.92it/s]


[Train] 37 Loss: 0.471 | Acc: 83.637 50182/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 410.74it/s]


[Test] 37 Loss: 0.498 | Acc: 83.000 8300/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 304.24it/s]


[Train] 38 Loss: 0.468 | Acc: 83.588 50153/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 411.95it/s]


[Test] 38 Loss: 0.497 | Acc: 83.100 8310/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 307.27it/s]


[Train] 39 Loss: 0.468 | Acc: 83.672 50203/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 400.95it/s]


[Test] 39 Loss: 0.496 | Acc: 83.000 8300/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 306.90it/s]


[Train] 40 Loss: 0.466 | Acc: 83.828 50297/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 416.33it/s]


[Test] 40 Loss: 0.498 | Acc: 83.070 8307/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 305.16it/s]


[Train] 41 Loss: 0.467 | Acc: 83.743 50246/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 406.95it/s]


[Test] 41 Loss: 0.501 | Acc: 82.930 8293/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 303.18it/s]


[Train] 42 Loss: 0.465 | Acc: 83.840 50304/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 412.76it/s]


[Test] 42 Loss: 0.496 | Acc: 83.070 8307/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 307.33it/s]


[Train] 43 Loss: 0.465 | Acc: 83.753 50252/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 428.58it/s]


[Test] 43 Loss: 0.498 | Acc: 83.090 8309/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 303.89it/s]


[Train] 44 Loss: 0.464 | Acc: 83.753 50252/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 413.23it/s]


[Test] 44 Loss: 0.496 | Acc: 83.140 8314/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 304.11it/s]


[Train] 45 Loss: 0.462 | Acc: 83.920 50352/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 436.53it/s]


[Test] 45 Loss: 0.497 | Acc: 83.030 8303/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 308.51it/s]


[Train] 46 Loss: 0.463 | Acc: 83.958 50375/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 412.41it/s]


[Test] 46 Loss: 0.495 | Acc: 83.170 8317/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 303.63it/s]


[Train] 47 Loss: 0.462 | Acc: 83.892 50335/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 417.93it/s]


[Test] 47 Loss: 0.496 | Acc: 83.260 8326/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 308.88it/s]


[Train] 48 Loss: 0.464 | Acc: 83.728 50237/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 406.81it/s]


[Test] 48 Loss: 0.496 | Acc: 83.170 8317/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 307.41it/s]


[Train] 49 Loss: 0.462 | Acc: 83.908 50345/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 404.87it/s]


[Test] 49 Loss: 0.499 | Acc: 83.080 8308/10000
Yes Linear(in_features=784, out_features=500, bias=True)
Success
Yes Linear(in_features=500, out_features=784, bias=True)
Success
Yes Linear(in_features=784, out_features=1, bias=True)
Failed
_________________________
Experimenting for ordinary ; h:10


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 305.56it/s]


[Train] 0 Loss: 1.665 | Acc: 54.475 32685/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 416.14it/s]


[Test] 0 Loss: 1.337 | Acc: 67.720 6772/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 304.50it/s]


[Train] 1 Loss: 1.156 | Acc: 71.370 42822/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 406.13it/s]


[Test] 1 Loss: 1.011 | Acc: 75.650 7565/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 303.76it/s]


[Train] 2 Loss: 0.893 | Acc: 77.610 46566/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 398.04it/s]


[Test] 2 Loss: 0.793 | Acc: 79.000 7900/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 303.75it/s]


[Train] 3 Loss: 0.732 | Acc: 79.750 47850/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 396.21it/s]


[Test] 3 Loss: 0.673 | Acc: 80.240 8024/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 303.29it/s]


[Train] 4 Loss: 0.634 | Acc: 81.257 48754/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 407.63it/s]


[Test] 4 Loss: 0.612 | Acc: 81.300 8130/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 303.19it/s]


[Train] 5 Loss: 0.574 | Acc: 82.152 49291/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 384.93it/s]


[Test] 5 Loss: 0.575 | Acc: 82.130 8213/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 302.63it/s]


[Train] 6 Loss: 0.532 | Acc: 82.772 49663/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 433.69it/s]


[Test] 6 Loss: 0.534 | Acc: 82.440 8244/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 303.37it/s]


[Train] 7 Loss: 0.507 | Acc: 83.293 49976/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 392.58it/s]


[Test] 7 Loss: 0.510 | Acc: 82.910 8291/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 303.73it/s]


[Train] 8 Loss: 0.481 | Acc: 83.842 50305/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 416.27it/s]


[Test] 8 Loss: 0.487 | Acc: 83.150 8315/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 305.98it/s]


[Train] 9 Loss: 0.463 | Acc: 84.395 50637/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 424.74it/s]


[Test] 9 Loss: 0.488 | Acc: 83.130 8313/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 304.33it/s]


[Train] 10 Loss: 0.451 | Acc: 84.615 50769/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 442.69it/s]


[Test] 10 Loss: 0.485 | Acc: 83.450 8345/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 309.22it/s]


[Train] 11 Loss: 0.438 | Acc: 84.945 50967/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 421.27it/s]


[Test] 11 Loss: 0.469 | Acc: 83.750 8375/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 305.62it/s]


[Train] 12 Loss: 0.429 | Acc: 85.292 51175/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 405.30it/s]


[Test] 12 Loss: 0.462 | Acc: 83.820 8382/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 308.58it/s]


[Train] 13 Loss: 0.418 | Acc: 85.468 51281/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 407.16it/s]


[Test] 13 Loss: 0.453 | Acc: 84.310 8431/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 304.04it/s]


[Train] 14 Loss: 0.412 | Acc: 85.855 51513/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 420.29it/s]


[Test] 14 Loss: 0.445 | Acc: 84.650 8465/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 306.23it/s]


[Train] 15 Loss: 0.403 | Acc: 86.005 51603/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 409.27it/s]


[Test] 15 Loss: 0.456 | Acc: 84.040 8404/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 306.70it/s]


[Train] 16 Loss: 0.400 | Acc: 86.185 51711/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 430.96it/s]


[Test] 16 Loss: 0.432 | Acc: 84.870 8487/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 303.57it/s]


[Train] 17 Loss: 0.392 | Acc: 86.330 51798/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 409.71it/s]


[Test] 17 Loss: 0.428 | Acc: 85.220 8522/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 302.27it/s]


[Train] 18 Loss: 0.388 | Acc: 86.430 51858/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 415.25it/s]


[Test] 18 Loss: 0.427 | Acc: 85.160 8516/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 307.36it/s]


[Train] 19 Loss: 0.381 | Acc: 86.737 52042/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 428.55it/s]


[Test] 19 Loss: 0.424 | Acc: 84.920 8492/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 301.24it/s]


[Train] 20 Loss: 0.376 | Acc: 86.753 52052/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 407.10it/s]


[Test] 20 Loss: 0.428 | Acc: 85.230 8523/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 304.25it/s]


[Train] 21 Loss: 0.372 | Acc: 86.940 52164/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 407.03it/s]


[Test] 21 Loss: 0.420 | Acc: 85.310 8531/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 303.48it/s]


[Train] 22 Loss: 0.368 | Acc: 87.037 52222/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 427.36it/s]


[Test] 22 Loss: 0.425 | Acc: 85.460 8546/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 306.74it/s]


[Train] 23 Loss: 0.364 | Acc: 87.230 52338/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 415.90it/s]


[Test] 23 Loss: 0.423 | Acc: 85.220 8522/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 304.30it/s]


[Train] 24 Loss: 0.358 | Acc: 87.487 52492/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 403.56it/s]


[Test] 24 Loss: 0.425 | Acc: 85.390 8539/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 303.41it/s]


[Train] 25 Loss: 0.357 | Acc: 87.443 52466/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 401.21it/s]


[Test] 25 Loss: 0.428 | Acc: 85.360 8536/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 305.51it/s]


[Train] 26 Loss: 0.354 | Acc: 87.512 52507/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 413.06it/s]


[Test] 26 Loss: 0.414 | Acc: 85.430 8543/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 303.37it/s]


[Train] 27 Loss: 0.350 | Acc: 87.548 52529/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 418.54it/s]


[Test] 27 Loss: 0.418 | Acc: 85.720 8572/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 308.19it/s]


[Train] 28 Loss: 0.349 | Acc: 87.613 52568/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 395.69it/s]


[Test] 28 Loss: 0.410 | Acc: 85.570 8557/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 306.15it/s]


[Train] 29 Loss: 0.345 | Acc: 87.773 52664/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 405.21it/s]


[Test] 29 Loss: 0.408 | Acc: 85.770 8577/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 304.97it/s]


[Train] 30 Loss: 0.342 | Acc: 87.860 52716/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 406.85it/s]


[Test] 30 Loss: 0.417 | Acc: 85.100 8510/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 303.88it/s]


[Train] 31 Loss: 0.341 | Acc: 87.963 52778/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 406.25it/s]


[Test] 31 Loss: 0.406 | Acc: 85.770 8577/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 306.05it/s]


[Train] 32 Loss: 0.338 | Acc: 88.058 52835/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 396.43it/s]


[Test] 32 Loss: 0.408 | Acc: 85.960 8596/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 301.27it/s]


[Train] 33 Loss: 0.337 | Acc: 87.977 52786/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 423.22it/s]


[Test] 33 Loss: 0.404 | Acc: 85.920 8592/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 303.81it/s]


[Train] 34 Loss: 0.333 | Acc: 88.165 52899/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 413.86it/s]


[Test] 34 Loss: 0.406 | Acc: 85.740 8574/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 304.47it/s]


[Train] 35 Loss: 0.334 | Acc: 88.130 52878/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 401.51it/s]


[Test] 35 Loss: 0.405 | Acc: 86.000 8600/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 300.80it/s]


[Train] 36 Loss: 0.331 | Acc: 88.217 52930/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 410.95it/s]


[Test] 36 Loss: 0.405 | Acc: 85.940 8594/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 304.15it/s]


[Train] 37 Loss: 0.329 | Acc: 88.220 52932/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 401.76it/s]


[Test] 37 Loss: 0.403 | Acc: 85.960 8596/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 304.85it/s]


[Train] 38 Loss: 0.329 | Acc: 88.233 52940/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 407.88it/s]


[Test] 38 Loss: 0.403 | Acc: 85.960 8596/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 303.27it/s]


[Train] 39 Loss: 0.326 | Acc: 88.327 52996/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 413.14it/s]


[Test] 39 Loss: 0.404 | Acc: 85.970 8597/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 306.20it/s]


[Train] 40 Loss: 0.326 | Acc: 88.333 53000/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 397.92it/s]


[Test] 40 Loss: 0.404 | Acc: 85.880 8588/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 305.03it/s]


[Train] 41 Loss: 0.326 | Acc: 88.348 53009/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 424.33it/s]


[Test] 41 Loss: 0.404 | Acc: 86.110 8611/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 305.74it/s]


[Train] 42 Loss: 0.325 | Acc: 88.455 53073/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 411.24it/s]


[Test] 42 Loss: 0.404 | Acc: 85.920 8592/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 309.91it/s]


[Train] 43 Loss: 0.324 | Acc: 88.450 53070/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 396.04it/s]


[Test] 43 Loss: 0.402 | Acc: 86.030 8603/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 306.95it/s]


[Train] 44 Loss: 0.323 | Acc: 88.548 53129/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 383.81it/s]


[Test] 44 Loss: 0.404 | Acc: 86.050 8605/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 304.28it/s]


[Train] 45 Loss: 0.323 | Acc: 88.560 53136/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 413.22it/s]


[Test] 45 Loss: 0.402 | Acc: 86.040 8604/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 301.69it/s]


[Train] 46 Loss: 0.323 | Acc: 88.437 53062/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 396.15it/s]


[Test] 46 Loss: 0.403 | Acc: 85.980 8598/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 303.95it/s]


[Train] 47 Loss: 0.323 | Acc: 88.468 53081/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 388.56it/s]


[Test] 47 Loss: 0.403 | Acc: 86.110 8611/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 304.16it/s]


[Train] 48 Loss: 0.323 | Acc: 88.358 53015/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 403.39it/s]


[Test] 48 Loss: 0.403 | Acc: 86.030 8603/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 303.94it/s]


[Train] 49 Loss: 0.323 | Acc: 88.525 53115/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 394.17it/s]


[Test] 49 Loss: 0.403 | Acc: 86.060 8606/10000
Yes Linear(in_features=784, out_features=500, bias=True)
Success
Yes Linear(in_features=500, out_features=784, bias=True)
Success
Yes Linear(in_features=784, out_features=1, bias=True)
Failed
_________________________
Experimenting for ordinary ; h:20


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 297.95it/s]


[Train] 0 Loss: 1.520 | Acc: 58.758 35255/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 383.36it/s]


[Test] 0 Loss: 1.115 | Acc: 71.210 7121/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 297.90it/s]


[Train] 1 Loss: 0.948 | Acc: 73.430 44058/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 383.34it/s]


[Test] 1 Loss: 0.801 | Acc: 75.680 7568/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 297.04it/s]


[Train] 2 Loss: 0.732 | Acc: 77.062 46237/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 402.50it/s]


[Test] 2 Loss: 0.675 | Acc: 77.470 7747/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:03<00:00, 300.13it/s]


[Train] 3 Loss: 0.636 | Acc: 79.182 47509/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 407.00it/s]


[Test] 3 Loss: 0.616 | Acc: 79.140 7914/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 298.61it/s]


[Train] 4 Loss: 0.581 | Acc: 80.402 48241/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 398.22it/s]


[Test] 4 Loss: 0.572 | Acc: 80.270 8027/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 298.06it/s]


[Train] 5 Loss: 0.542 | Acc: 81.630 48978/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 407.41it/s]


[Test] 5 Loss: 0.527 | Acc: 81.430 8143/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 297.71it/s]


[Train] 6 Loss: 0.517 | Acc: 82.303 49382/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 410.23it/s]


[Test] 6 Loss: 0.506 | Acc: 82.180 8218/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 297.23it/s]


[Train] 7 Loss: 0.490 | Acc: 82.948 49769/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 417.03it/s]


[Test] 7 Loss: 0.492 | Acc: 82.300 8230/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 294.74it/s]


[Train] 8 Loss: 0.479 | Acc: 83.432 50059/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 394.90it/s]


[Test] 8 Loss: 0.530 | Acc: 82.510 8251/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 295.60it/s]


[Train] 9 Loss: 0.459 | Acc: 84.085 50451/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 419.16it/s]


[Test] 9 Loss: 0.466 | Acc: 83.290 8329/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 297.71it/s]


[Train] 10 Loss: 0.454 | Acc: 84.253 50552/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 407.98it/s]


[Test] 10 Loss: 0.462 | Acc: 83.110 8311/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 297.81it/s]


[Train] 11 Loss: 0.439 | Acc: 84.572 50743/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 406.36it/s]


[Test] 11 Loss: 0.470 | Acc: 83.460 8346/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 299.42it/s]


[Train] 12 Loss: 0.432 | Acc: 84.873 50924/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 411.77it/s]


[Test] 12 Loss: 0.442 | Acc: 83.760 8376/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 298.59it/s]


[Train] 13 Loss: 0.424 | Acc: 85.167 51100/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 425.47it/s]


[Test] 13 Loss: 0.446 | Acc: 83.750 8375/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 296.15it/s]


[Train] 14 Loss: 0.422 | Acc: 85.175 51105/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 423.76it/s]


[Test] 14 Loss: 0.440 | Acc: 84.000 8400/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 297.10it/s]


[Train] 15 Loss: 0.411 | Acc: 85.520 51312/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 403.93it/s]


[Test] 15 Loss: 0.454 | Acc: 83.660 8366/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 298.40it/s]


[Train] 16 Loss: 0.404 | Acc: 85.800 51480/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 422.66it/s]


[Test] 16 Loss: 0.426 | Acc: 84.450 8445/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 294.68it/s]


[Train] 17 Loss: 0.398 | Acc: 85.900 51540/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 401.76it/s]


[Test] 17 Loss: 0.422 | Acc: 84.590 8459/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 296.86it/s]


[Train] 18 Loss: 0.395 | Acc: 85.972 51583/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 394.93it/s]


[Test] 18 Loss: 0.423 | Acc: 84.700 8470/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 295.79it/s]


[Train] 19 Loss: 0.389 | Acc: 86.133 51680/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 414.89it/s]


[Test] 19 Loss: 0.416 | Acc: 84.900 8490/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 296.67it/s]


[Train] 20 Loss: 0.386 | Acc: 86.257 51754/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 401.35it/s]


[Test] 20 Loss: 0.429 | Acc: 84.450 8445/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 296.09it/s]


[Train] 21 Loss: 0.381 | Acc: 86.510 51906/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 414.09it/s]


[Test] 21 Loss: 0.411 | Acc: 84.880 8488/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 296.40it/s]


[Train] 22 Loss: 0.378 | Acc: 86.592 51955/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 417.68it/s]


[Test] 22 Loss: 0.410 | Acc: 84.930 8493/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 297.07it/s]


[Train] 23 Loss: 0.376 | Acc: 86.645 51987/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 390.43it/s]


[Test] 23 Loss: 0.407 | Acc: 84.990 8499/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 297.71it/s]


[Train] 24 Loss: 0.369 | Acc: 86.885 52131/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 391.39it/s]


[Test] 24 Loss: 0.409 | Acc: 85.280 8528/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 298.30it/s]


[Train] 25 Loss: 0.369 | Acc: 86.930 52158/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 412.00it/s]


[Test] 25 Loss: 0.404 | Acc: 85.190 8519/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 297.66it/s]


[Train] 26 Loss: 0.365 | Acc: 87.005 52203/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 419.17it/s]


[Test] 26 Loss: 0.404 | Acc: 85.140 8514/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 297.81it/s]


[Train] 27 Loss: 0.362 | Acc: 87.092 52255/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 416.57it/s]


[Test] 27 Loss: 0.401 | Acc: 85.540 8554/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 297.75it/s]


[Train] 28 Loss: 0.360 | Acc: 87.115 52269/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 423.29it/s]


[Test] 28 Loss: 0.431 | Acc: 84.600 8460/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 295.99it/s]


[Train] 29 Loss: 0.359 | Acc: 87.167 52300/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 422.67it/s]


[Test] 29 Loss: 0.398 | Acc: 85.480 8548/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 297.19it/s]


[Train] 30 Loss: 0.355 | Acc: 87.352 52411/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 401.10it/s]


[Test] 30 Loss: 0.400 | Acc: 85.360 8536/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 296.79it/s]


[Train] 31 Loss: 0.355 | Acc: 87.395 52437/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 395.61it/s]


[Test] 31 Loss: 0.399 | Acc: 85.720 8572/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 296.08it/s]


[Train] 32 Loss: 0.355 | Acc: 87.325 52395/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 387.16it/s]


[Test] 32 Loss: 0.398 | Acc: 85.430 8543/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 294.54it/s]


[Train] 33 Loss: 0.351 | Acc: 87.472 52483/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 419.52it/s]


[Test] 33 Loss: 0.395 | Acc: 85.650 8565/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 298.06it/s]


[Train] 34 Loss: 0.349 | Acc: 87.503 52502/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 421.39it/s]


[Test] 34 Loss: 0.396 | Acc: 85.620 8562/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 296.57it/s]


[Train] 35 Loss: 0.349 | Acc: 87.482 52489/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 436.00it/s]


[Test] 35 Loss: 0.393 | Acc: 85.820 8582/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 298.20it/s]


[Train] 36 Loss: 0.347 | Acc: 87.505 52503/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 424.23it/s]


[Test] 36 Loss: 0.394 | Acc: 85.740 8574/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 294.60it/s]


[Train] 37 Loss: 0.346 | Acc: 87.640 52584/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 419.27it/s]


[Test] 37 Loss: 0.396 | Acc: 85.670 8567/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 296.71it/s]


[Train] 38 Loss: 0.345 | Acc: 87.540 52524/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 425.83it/s]


[Test] 38 Loss: 0.393 | Acc: 85.740 8574/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 294.38it/s]


[Train] 39 Loss: 0.346 | Acc: 87.488 52493/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 414.74it/s]


[Test] 39 Loss: 0.396 | Acc: 85.530 8553/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 298.46it/s]


[Train] 40 Loss: 0.343 | Acc: 87.690 52614/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 405.93it/s]


[Test] 40 Loss: 0.393 | Acc: 85.890 8589/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 296.31it/s]


[Train] 41 Loss: 0.342 | Acc: 87.733 52640/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 420.02it/s]


[Test] 41 Loss: 0.394 | Acc: 85.600 8560/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 294.67it/s]


[Train] 42 Loss: 0.342 | Acc: 87.745 52647/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 417.15it/s]


[Test] 42 Loss: 0.392 | Acc: 85.780 8578/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 295.82it/s]


[Train] 43 Loss: 0.342 | Acc: 87.687 52612/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 422.88it/s]


[Test] 43 Loss: 0.395 | Acc: 85.740 8574/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 296.24it/s]


[Train] 44 Loss: 0.342 | Acc: 87.700 52620/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 398.72it/s]


[Test] 44 Loss: 0.394 | Acc: 85.710 8571/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 295.17it/s]


[Train] 45 Loss: 0.338 | Acc: 87.818 52691/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 397.83it/s]


[Test] 45 Loss: 0.393 | Acc: 85.680 8568/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 294.87it/s]


[Train] 46 Loss: 0.341 | Acc: 87.775 52665/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 423.83it/s]


[Test] 46 Loss: 0.391 | Acc: 85.770 8577/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 297.43it/s]


[Train] 47 Loss: 0.342 | Acc: 87.702 52621/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 411.72it/s]


[Test] 47 Loss: 0.394 | Acc: 85.740 8574/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 298.63it/s]


[Train] 48 Loss: 0.341 | Acc: 87.745 52647/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 407.59it/s]


[Test] 48 Loss: 0.393 | Acc: 85.690 8569/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:04<00:00, 295.32it/s]


[Train] 49 Loss: 0.340 | Acc: 87.762 52657/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 419.43it/s]


[Test] 49 Loss: 0.393 | Acc: 85.730 8573/10000
Yes Linear(in_features=784, out_features=500, bias=True)
Success
Yes Linear(in_features=500, out_features=784, bias=True)
Success
Yes Linear(in_features=784, out_features=1, bias=True)
Failed
_________________________
Experimenting for ordinary ; h:100


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.75it/s]


[Train] 0 Loss: 0.963 | Acc: 71.995 43197/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 222.71it/s]


[Test] 0 Loss: 0.652 | Acc: 79.030 7903/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.94it/s]


[Train] 1 Loss: 0.584 | Acc: 80.737 48442/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 218.49it/s]


[Test] 1 Loss: 0.532 | Acc: 81.600 8160/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.83it/s]


[Train] 2 Loss: 0.508 | Acc: 82.877 49726/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 214.04it/s]


[Test] 2 Loss: 0.492 | Acc: 83.010 8301/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.75it/s]


[Train] 3 Loss: 0.466 | Acc: 84.048 50429/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 217.77it/s]


[Test] 3 Loss: 0.487 | Acc: 83.280 8328/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.59it/s]


[Train] 4 Loss: 0.448 | Acc: 84.613 50768/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 221.77it/s]


[Test] 4 Loss: 0.465 | Acc: 83.820 8382/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.44it/s]


[Train] 5 Loss: 0.423 | Acc: 85.192 51115/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 218.35it/s]


[Test] 5 Loss: 0.441 | Acc: 84.510 8451/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.46it/s]


[Train] 6 Loss: 0.414 | Acc: 85.762 51457/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 219.60it/s]


[Test] 6 Loss: 0.454 | Acc: 84.620 8462/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.70it/s]


[Train] 7 Loss: 0.399 | Acc: 86.035 51621/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 218.18it/s]


[Test] 7 Loss: 0.420 | Acc: 85.000 8500/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.71it/s]


[Train] 8 Loss: 0.389 | Acc: 86.413 51848/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 222.30it/s]


[Test] 8 Loss: 0.417 | Acc: 85.130 8513/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.40it/s]


[Train] 9 Loss: 0.378 | Acc: 86.748 52049/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 221.06it/s]


[Test] 9 Loss: 0.410 | Acc: 85.460 8546/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.68it/s]


[Train] 10 Loss: 0.369 | Acc: 87.053 52232/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 213.94it/s]


[Test] 10 Loss: 0.403 | Acc: 85.660 8566/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.53it/s]


[Train] 11 Loss: 0.362 | Acc: 87.300 52380/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 218.48it/s]


[Test] 11 Loss: 0.397 | Acc: 85.780 8578/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.24it/s]


[Train] 12 Loss: 0.355 | Acc: 87.563 52538/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 226.99it/s]


[Test] 12 Loss: 0.391 | Acc: 86.040 8604/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.64it/s]


[Train] 13 Loss: 0.347 | Acc: 87.702 52621/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 214.51it/s]


[Test] 13 Loss: 0.389 | Acc: 86.050 8605/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.92it/s]


[Train] 14 Loss: 0.340 | Acc: 87.840 52704/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 224.67it/s]


[Test] 14 Loss: 0.390 | Acc: 85.950 8595/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.18it/s]


[Train] 15 Loss: 0.338 | Acc: 88.127 52876/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 223.94it/s]


[Test] 15 Loss: 0.386 | Acc: 85.870 8587/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.76it/s]


[Train] 16 Loss: 0.329 | Acc: 88.135 52881/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 222.44it/s]


[Test] 16 Loss: 0.380 | Acc: 86.300 8630/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.57it/s]


[Train] 17 Loss: 0.327 | Acc: 88.350 53010/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 212.82it/s]


[Test] 17 Loss: 0.386 | Acc: 86.460 8646/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.42it/s]


[Train] 18 Loss: 0.320 | Acc: 88.617 53170/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 216.32it/s]


[Test] 18 Loss: 0.377 | Acc: 86.530 8653/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.27it/s]


[Train] 19 Loss: 0.314 | Acc: 88.795 53277/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 219.78it/s]


[Test] 19 Loss: 0.380 | Acc: 86.700 8670/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.25it/s]


[Train] 20 Loss: 0.310 | Acc: 88.870 53322/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 215.80it/s]


[Test] 20 Loss: 0.384 | Acc: 86.710 8671/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.55it/s]


[Train] 21 Loss: 0.305 | Acc: 89.027 53416/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 217.81it/s]


[Test] 21 Loss: 0.376 | Acc: 86.620 8662/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.54it/s]


[Train] 22 Loss: 0.302 | Acc: 89.217 53530/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 215.88it/s]


[Test] 22 Loss: 0.372 | Acc: 86.820 8682/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.27it/s]


[Train] 23 Loss: 0.298 | Acc: 89.262 53557/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 221.83it/s]


[Test] 23 Loss: 0.370 | Acc: 86.730 8673/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.55it/s]


[Train] 24 Loss: 0.294 | Acc: 89.545 53727/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 223.72it/s]


[Test] 24 Loss: 0.369 | Acc: 86.790 8679/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.55it/s]


[Train] 25 Loss: 0.291 | Acc: 89.542 53725/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 219.74it/s]


[Test] 25 Loss: 0.369 | Acc: 86.900 8690/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.88it/s]


[Train] 26 Loss: 0.288 | Acc: 89.622 53773/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 217.41it/s]


[Test] 26 Loss: 0.369 | Acc: 86.900 8690/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.61it/s]


[Train] 27 Loss: 0.285 | Acc: 89.733 53840/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 213.53it/s]


[Test] 27 Loss: 0.368 | Acc: 87.000 8700/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.65it/s]


[Train] 28 Loss: 0.281 | Acc: 89.883 53930/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 221.26it/s]


[Test] 28 Loss: 0.364 | Acc: 86.880 8688/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.40it/s]


[Train] 29 Loss: 0.277 | Acc: 89.983 53990/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 221.64it/s]


[Test] 29 Loss: 0.362 | Acc: 86.980 8698/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.61it/s]


[Train] 30 Loss: 0.275 | Acc: 90.093 54056/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 225.58it/s]


[Test] 30 Loss: 0.365 | Acc: 87.150 8715/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.58it/s]


[Train] 31 Loss: 0.274 | Acc: 90.160 54096/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 221.72it/s]


[Test] 31 Loss: 0.362 | Acc: 86.960 8696/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.40it/s]


[Train] 32 Loss: 0.270 | Acc: 90.267 54160/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 215.81it/s]


[Test] 32 Loss: 0.365 | Acc: 87.180 8718/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.43it/s]


[Train] 33 Loss: 0.268 | Acc: 90.375 54225/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 218.37it/s]


[Test] 33 Loss: 0.365 | Acc: 87.080 8708/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.17it/s]


[Train] 34 Loss: 0.266 | Acc: 90.402 54241/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 218.59it/s]


[Test] 34 Loss: 0.361 | Acc: 87.170 8717/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.46it/s]


[Train] 35 Loss: 0.263 | Acc: 90.567 54340/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 221.96it/s]


[Test] 35 Loss: 0.363 | Acc: 87.110 8711/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.57it/s]


[Train] 36 Loss: 0.263 | Acc: 90.627 54376/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 221.43it/s]


[Test] 36 Loss: 0.365 | Acc: 87.140 8714/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.16it/s]


[Train] 37 Loss: 0.262 | Acc: 90.622 54373/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 216.03it/s]


[Test] 37 Loss: 0.362 | Acc: 87.170 8717/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.24it/s]


[Train] 38 Loss: 0.260 | Acc: 90.697 54418/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 220.70it/s]


[Test] 38 Loss: 0.363 | Acc: 87.040 8704/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.45it/s]


[Train] 39 Loss: 0.259 | Acc: 90.732 54439/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 221.79it/s]


[Test] 39 Loss: 0.361 | Acc: 87.250 8725/10000
Saving..


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.48it/s]


[Train] 40 Loss: 0.256 | Acc: 90.808 54485/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 217.91it/s]


[Test] 40 Loss: 0.362 | Acc: 87.150 8715/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.16it/s]


[Train] 41 Loss: 0.254 | Acc: 90.818 54491/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 212.99it/s]


[Test] 41 Loss: 0.358 | Acc: 87.160 8716/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.07it/s]


[Train] 42 Loss: 0.255 | Acc: 90.852 54511/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 218.26it/s]


[Test] 42 Loss: 0.362 | Acc: 87.210 8721/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 111.98it/s]


[Train] 43 Loss: 0.254 | Acc: 90.843 54506/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 216.29it/s]


[Test] 43 Loss: 0.363 | Acc: 87.220 8722/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.12it/s]


[Train] 44 Loss: 0.254 | Acc: 90.845 54507/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 215.00it/s]


[Test] 44 Loss: 0.361 | Acc: 87.160 8716/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.22it/s]


[Train] 45 Loss: 0.253 | Acc: 90.923 54554/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 222.71it/s]


[Test] 45 Loss: 0.360 | Acc: 87.210 8721/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.40it/s]


[Train] 46 Loss: 0.252 | Acc: 91.008 54605/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 218.18it/s]


[Test] 46 Loss: 0.363 | Acc: 87.140 8714/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.12it/s]


[Train] 47 Loss: 0.252 | Acc: 90.982 54589/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 215.06it/s]


[Test] 47 Loss: 0.364 | Acc: 87.190 8719/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 111.95it/s]


[Train] 48 Loss: 0.251 | Acc: 90.932 54559/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 217.32it/s]


[Test] 48 Loss: 0.362 | Acc: 87.180 8718/10000


100%|████████████████████████████████████████████████| 1200/1200 [00:10<00:00, 112.32it/s]


[Train] 49 Loss: 0.251 | Acc: 91.053 54632/60000


100%|██████████████████████████████████████████████████| 200/200 [00:00<00:00, 218.31it/s]


[Test] 49 Loss: 0.362 | Acc: 87.090 8709/10000
Yes Linear(in_features=784, out_features=500, bias=True)
Success
Yes Linear(in_features=500, out_features=784, bias=True)
Success
Yes Linear(in_features=784, out_features=1, bias=True)
Failed
_________________________
Experimenting for ordinary ; h:500


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.20it/s]


[Train] 0 Loss: 0.889 | Acc: 72.625 43575/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 53.90it/s]


[Test] 0 Loss: 0.625 | Acc: 79.400 7940/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.22it/s]


[Train] 1 Loss: 0.571 | Acc: 80.675 48405/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.24it/s]


[Test] 1 Loss: 0.533 | Acc: 81.840 8184/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.21it/s]


[Train] 2 Loss: 0.509 | Acc: 82.740 49644/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.17it/s]


[Test] 2 Loss: 0.500 | Acc: 82.510 8251/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.16it/s]


[Train] 3 Loss: 0.473 | Acc: 83.780 50268/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 53.81it/s]


[Test] 3 Loss: 0.485 | Acc: 83.300 8330/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.20it/s]


[Train] 4 Loss: 0.449 | Acc: 84.602 50761/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.06it/s]


[Test] 4 Loss: 0.459 | Acc: 83.880 8388/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.21it/s]


[Train] 5 Loss: 0.436 | Acc: 84.958 50975/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.30it/s]


[Test] 5 Loss: 0.451 | Acc: 83.940 8394/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.23it/s]


[Train] 6 Loss: 0.418 | Acc: 85.608 51365/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.36it/s]


[Test] 6 Loss: 0.441 | Acc: 84.510 8451/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.12it/s]


[Train] 7 Loss: 0.407 | Acc: 85.843 51506/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.13it/s]


[Test] 7 Loss: 0.431 | Acc: 84.360 8436/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.16it/s]


[Train] 8 Loss: 0.394 | Acc: 86.195 51717/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 53.92it/s]


[Test] 8 Loss: 0.423 | Acc: 84.890 8489/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.20it/s]


[Train] 9 Loss: 0.385 | Acc: 86.522 51913/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.00it/s]


[Test] 9 Loss: 0.443 | Acc: 84.800 8480/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:49<00:00, 24.04it/s]


[Train] 10 Loss: 0.378 | Acc: 86.892 52135/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 52.42it/s]


[Test] 10 Loss: 0.418 | Acc: 85.130 8513/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.06it/s]


[Train] 11 Loss: 0.372 | Acc: 86.900 52140/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.10it/s]


[Test] 11 Loss: 0.420 | Acc: 85.040 8504/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.06it/s]


[Train] 12 Loss: 0.363 | Acc: 87.142 52285/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 53.91it/s]


[Test] 12 Loss: 0.405 | Acc: 85.630 8563/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.15it/s]


[Train] 13 Loss: 0.356 | Acc: 87.527 52516/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 51.24it/s]


[Test] 13 Loss: 0.405 | Acc: 85.650 8565/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:51<00:00, 23.48it/s]


[Train] 14 Loss: 0.351 | Acc: 87.705 52623/60000


100%|███████████████████████████████████████████████████| 200/200 [00:04<00:00, 48.24it/s]


[Test] 14 Loss: 0.398 | Acc: 85.930 8593/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:52<00:00, 22.65it/s]


[Train] 15 Loss: 0.342 | Acc: 87.862 52717/60000


100%|███████████████████████████████████████████████████| 200/200 [00:04<00:00, 48.24it/s]


[Test] 15 Loss: 0.400 | Acc: 85.800 8580/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:49<00:00, 24.26it/s]


[Train] 16 Loss: 0.339 | Acc: 88.078 52847/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 53.97it/s]


[Test] 16 Loss: 0.401 | Acc: 85.640 8564/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.19it/s]


[Train] 17 Loss: 0.331 | Acc: 88.298 52979/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 53.92it/s]


[Test] 17 Loss: 0.391 | Acc: 86.000 8600/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:52<00:00, 23.04it/s]


[Train] 18 Loss: 0.326 | Acc: 88.343 53006/60000


100%|███████████████████████████████████████████████████| 200/200 [00:04<00:00, 43.08it/s]


[Test] 18 Loss: 0.389 | Acc: 86.140 8614/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:53<00:00, 22.36it/s]


[Train] 19 Loss: 0.322 | Acc: 88.665 53199/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.18it/s]


[Test] 19 Loss: 0.398 | Acc: 85.790 8579/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.21it/s]


[Train] 20 Loss: 0.315 | Acc: 88.787 53272/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.01it/s]


[Test] 20 Loss: 0.390 | Acc: 85.890 8589/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.21it/s]


[Train] 21 Loss: 0.312 | Acc: 89.005 53403/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 53.85it/s]


[Test] 21 Loss: 0.388 | Acc: 86.350 8635/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.20it/s]


[Train] 22 Loss: 0.309 | Acc: 88.998 53399/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 53.71it/s]


[Test] 22 Loss: 0.385 | Acc: 86.410 8641/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.18it/s]


[Train] 23 Loss: 0.302 | Acc: 89.287 53572/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 53.90it/s]


[Test] 23 Loss: 0.389 | Acc: 86.380 8638/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.19it/s]


[Train] 24 Loss: 0.300 | Acc: 89.412 53647/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 53.90it/s]


[Test] 24 Loss: 0.383 | Acc: 86.540 8654/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.16it/s]


[Train] 25 Loss: 0.295 | Acc: 89.528 53717/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.07it/s]


[Test] 25 Loss: 0.382 | Acc: 86.500 8650/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:49<00:00, 24.17it/s]


[Train] 26 Loss: 0.291 | Acc: 89.660 53796/60000


100%|███████████████████████████████████████████████████| 200/200 [00:04<00:00, 47.93it/s]


[Test] 26 Loss: 0.381 | Acc: 86.590 8659/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:52<00:00, 22.66it/s]


[Train] 27 Loss: 0.287 | Acc: 89.755 53853/60000


100%|███████████████████████████████████████████████████| 200/200 [00:04<00:00, 48.20it/s]


[Test] 27 Loss: 0.381 | Acc: 86.670 8667/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:52<00:00, 22.73it/s]


[Train] 28 Loss: 0.284 | Acc: 89.820 53892/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 53.80it/s]


[Test] 28 Loss: 0.379 | Acc: 86.650 8665/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:55<00:00, 21.62it/s]


[Train] 29 Loss: 0.279 | Acc: 89.965 53979/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 53.40it/s]


[Test] 29 Loss: 0.381 | Acc: 86.860 8686/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.19it/s]


[Train] 30 Loss: 0.277 | Acc: 90.110 54066/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.07it/s]


[Test] 30 Loss: 0.376 | Acc: 86.910 8691/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.19it/s]


[Train] 31 Loss: 0.274 | Acc: 90.253 54152/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 53.84it/s]


[Test] 31 Loss: 0.385 | Acc: 86.770 8677/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.15it/s]


[Train] 32 Loss: 0.271 | Acc: 90.390 54234/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.15it/s]


[Test] 32 Loss: 0.375 | Acc: 86.730 8673/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.07it/s]


[Train] 33 Loss: 0.268 | Acc: 90.468 54281/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 52.15it/s]


[Test] 33 Loss: 0.374 | Acc: 86.720 8672/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:51<00:00, 23.29it/s]


[Train] 34 Loss: 0.267 | Acc: 90.493 54296/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.15it/s]


[Test] 34 Loss: 0.378 | Acc: 86.860 8686/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.21it/s]


[Train] 35 Loss: 0.262 | Acc: 90.680 54408/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 53.71it/s]


[Test] 35 Loss: 0.375 | Acc: 86.860 8686/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.22it/s]


[Train] 36 Loss: 0.261 | Acc: 90.767 54460/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.32it/s]


[Test] 36 Loss: 0.372 | Acc: 86.740 8674/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.21it/s]


[Train] 37 Loss: 0.259 | Acc: 90.898 54539/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 53.50it/s]


[Test] 37 Loss: 0.373 | Acc: 86.860 8686/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.22it/s]


[Train] 38 Loss: 0.257 | Acc: 90.837 54502/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.11it/s]


[Test] 38 Loss: 0.374 | Acc: 86.960 8696/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.19it/s]


[Train] 39 Loss: 0.255 | Acc: 90.978 54587/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.05it/s]


[Test] 39 Loss: 0.375 | Acc: 86.950 8695/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:48<00:00, 24.55it/s]


[Train] 40 Loss: 0.254 | Acc: 90.975 54585/60000


100%|███████████████████████████████████████████████████| 200/200 [00:04<00:00, 43.56it/s]


[Test] 40 Loss: 0.380 | Acc: 86.960 8696/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:58<00:00, 20.49it/s]


[Train] 41 Loss: 0.253 | Acc: 91.018 54611/60000


100%|███████████████████████████████████████████████████| 200/200 [00:04<00:00, 44.24it/s]


[Test] 41 Loss: 0.373 | Acc: 87.010 8701/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:58<00:00, 20.47it/s]


[Train] 42 Loss: 0.251 | Acc: 91.137 54682/60000


100%|███████████████████████████████████████████████████| 200/200 [00:04<00:00, 43.12it/s]


[Test] 42 Loss: 0.372 | Acc: 87.040 8704/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:52<00:00, 22.93it/s]


[Train] 43 Loss: 0.251 | Acc: 91.108 54665/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.11it/s]


[Test] 43 Loss: 0.371 | Acc: 87.080 8708/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:48<00:00, 24.69it/s]


[Train] 44 Loss: 0.250 | Acc: 91.240 54744/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.18it/s]


[Test] 44 Loss: 0.376 | Acc: 86.890 8689/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.21it/s]


[Train] 45 Loss: 0.248 | Acc: 91.185 54711/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.07it/s]


[Test] 45 Loss: 0.368 | Acc: 86.950 8695/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.17it/s]


[Train] 46 Loss: 0.248 | Acc: 91.292 54775/60000


100%|███████████████████████████████████████████████████| 200/200 [00:04<00:00, 44.36it/s]


[Test] 46 Loss: 0.372 | Acc: 87.020 8702/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:48<00:00, 24.92it/s]


[Train] 47 Loss: 0.249 | Acc: 91.162 54697/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.04it/s]


[Test] 47 Loss: 0.379 | Acc: 87.050 8705/10000


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.20it/s]


[Train] 48 Loss: 0.247 | Acc: 91.265 54759/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.14it/s]


[Test] 48 Loss: 0.372 | Acc: 87.140 8714/10000
Saving..


100%|█████████████████████████████████████████████████| 1200/1200 [00:47<00:00, 25.20it/s]


[Train] 49 Loss: 0.248 | Acc: 91.327 54796/60000


100%|███████████████████████████████████████████████████| 200/200 [00:03<00:00, 54.23it/s]

[Test] 49 Loss: 0.375 | Acc: 86.920 8692/10000





In [26]:
exp_acc_vals

{'5': {'l_0.5': 67.05,
  'l_1': 70.7,
  'l_2': 78.15,
  'l_inf': 79.52,
  'stereo': 82.19,
  'linear': 82.74,
  'convex': 79.49,
  'invex': 88.26,
  'ordinary': 83.26},
 '10': {'l_0.5': 72.08,
  'l_1': 77.91,
  'l_2': 82.35,
  'l_inf': 83.98,
  'stereo': 84.73,
  'linear': 84.89,
  'convex': 78.99,
  'invex': 88.41,
  'ordinary': 86.11},
 '20': {'l_0.5': 75.54,
  'l_1': 80.08,
  'l_2': 83.82,
  'l_inf': 85.17,
  'stereo': 85.86,
  'linear': 86.27,
  'convex': 81.03,
  'invex': 88.85,
  'ordinary': 85.89},
 '100': {'l_0.5': 78.27,
  'l_1': 82.07,
  'l_2': 86.41,
  'l_inf': 87.02,
  'stereo': 87.99,
  'linear': 88.67,
  'convex': 78.07,
  'invex': 87.85,
  'ordinary': 87.25},
 '500': {'l_0.5': 79.94,
  'l_1': 83.43,
  'l_2': 87.98,
  'l_inf': 88.23,
  'stereo': 89.26,
  'linear': 89.62,
  'convex': 79.68,
  'invex': 88.69,
  'ordinary': 87.14}}

In [27]:
xx

tensor([[[[-1., -1., -1.,  ..., -1., -1., -1.],
          [-1., -1., -1.,  ..., -1., -1., -1.],
          [-1., -1., -1.,  ..., -1., -1., -1.],
          ...,
          [-1., -1., -1.,  ..., -1., -1., -1.],
          [-1., -1., -1.,  ..., -1., -1., -1.],
          [-1., -1., -1.,  ..., -1., -1., -1.]]],


        [[[-1., -1., -1.,  ..., -1., -1., -1.],
          [-1., -1., -1.,  ..., -1., -1., -1.],
          [-1., -1., -1.,  ..., -1., -1., -1.],
          ...,
          [-1., -1., -1.,  ..., -1., -1., -1.],
          [-1., -1., -1.,  ..., -1., -1., -1.],
          [-1., -1., -1.,  ..., -1., -1., -1.]]],


        [[[-1., -1., -1.,  ..., -1., -1., -1.],
          [-1., -1., -1.,  ..., -1., -1., -1.],
          [-1., -1., -1.,  ..., -1., -1., -1.],
          ...,
          [-1., -1., -1.,  ..., -1., -1., -1.],
          [-1., -1., -1.,  ..., -1., -1., -1.],
          [-1., -1., -1.,  ..., -1., -1., -1.]]],


        ...,


        [[[-1., -1., -1.,  ..., -1., -1., -1.],
          [-1., 

In [28]:
# net[0].centers.shape

In [29]:
# exp_acc_vals = \
# {'5': {'l_0.5': 67.05,
#   'l_1': 70.7,
#   'l_2': 78.15,
#   'l_inf': 79.52,
#   'stereo': 82.19,
#   'linear': 82.74,
#   'convex': 79.49,
#   'invex': 88.26,
#   'ordinary': 83.55},
#  '10': {'l_0.5': 72.08,
#   'l_1': 77.91,
#   'l_2': 82.35,
#   'l_inf': 83.98,
#   'stereo': 84.73,
#   'linear': 84.89,
#   'convex': 78.99,
#   'invex': 88.41,
#   'ordinary': 81.69}}

In [30]:
# data_file = "./outputs/00.2_exp_acc_dict.json"
# with open(data_file, "w") as f:
#     json.dump(exp_acc_vals, f, indent=3)

In [31]:
# # Opening JSON file
# with open(data_file, 'r') as f:
#     exp_acc_vals = json.load(f)

In [32]:
exp_acc_vals

{'5': {'l_0.5': 67.05,
  'l_1': 70.7,
  'l_2': 78.15,
  'l_inf': 79.52,
  'stereo': 82.19,
  'linear': 82.74,
  'convex': 79.49,
  'invex': 88.26,
  'ordinary': 83.26},
 '10': {'l_0.5': 72.08,
  'l_1': 77.91,
  'l_2': 82.35,
  'l_inf': 83.98,
  'stereo': 84.73,
  'linear': 84.89,
  'convex': 78.99,
  'invex': 88.41,
  'ordinary': 86.11},
 '20': {'l_0.5': 75.54,
  'l_1': 80.08,
  'l_2': 83.82,
  'l_inf': 85.17,
  'stereo': 85.86,
  'linear': 86.27,
  'convex': 81.03,
  'invex': 88.85,
  'ordinary': 85.89},
 '100': {'l_0.5': 78.27,
  'l_1': 82.07,
  'l_2': 86.41,
  'l_inf': 87.02,
  'stereo': 87.99,
  'linear': 88.67,
  'convex': 78.07,
  'invex': 87.85,
  'ordinary': 87.25},
 '500': {'l_0.5': 79.94,
  'l_1': 83.43,
  'l_2': 87.98,
  'l_inf': 88.23,
  'stereo': 89.26,
  'linear': 89.62,
  'convex': 79.68,
  'invex': 88.69,
  'ordinary': 87.14}}