In [2]:
import torch
import torchvision
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
import torch.backends.cudnn as cudnn
import torchvision.transforms as transforms 

import warnings
warnings.filterwarnings('ignore')

In [3]:
import timm
import torch
import torchvision.transforms as transforms

device = torch.device('cuda:2' if torch.cuda.is_available() else 'cpu')

def get_models(dataset, model_name, key):
    """
    Creates a model for CIFAR-10 or ImageNet dataset.
    For CIFAR-10: uses pretrained ImageNet weights, replaces classifier head with num_classes=10.
    """
    if dataset == 'imagenet':
        model = timm.create_model(model_name, pretrained=True, num_classes=1000).to(device)
        model.eval()
        if any(x in key for x in ['inc', 'vit', 'bit']):
            norm = transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
        else:
            norm = transforms.Normalize((0.485, 0.456, 0.406), (0.229, 0.224, 0.225))
        return torch.nn.Sequential(norm, model)
    
    if dataset == 'cifar100':
        # For Inception, resize to 299x299; otherwise 32x32 is fine
        if any(x in key for x in ['inc', 'vit', 'bit']):
            transform_resize = transforms.Resize((299, 299))
            norm = transforms.Normalize((0.5,), (0.5,)) 
            
        else:
            transform_resize = transforms.Resize((224, 224)) # do nothing
            # Standard CIFAR-10 normalization
            norm = transforms.Normalize((0.4914, 0.4822, 0.4465),
                                        (0.2023, 0.1994, 0.2010)) 
    
        # Create model
        model = timm.create_model(model_name, pretrained=True, num_classes=100).to(device)
        model.eval()
        
        # Wrap resize + normalization + model in Sequential
        return torch.nn.Sequential(
            transform_resize,   # resize if Inception
            norm,               # normalization
            model
        )

In [4]:
import torchvision
from torch.utils.data import random_split, DataLoader

# CIFAR-10 normalization for training and test
train_transform = transforms.Compose([
    transforms.RandomCrop(32, padding=4),
    transforms.RandomHorizontalFlip(),
    transforms.ToTensor(),
    # transforms.Normalize((0.4914, 0.4822, 0.4465),
    #                      (0.2023, 0.1994, 0.2010)),
])

test_transform = transforms.Compose([
    transforms.ToTensor(),
    # transforms.Normalize((0.4914, 0.4822, 0.4465),
    #                      (0.2023, 0.1994, 0.2010)),
])

# Load datasets
trainset = torchvision.datasets.CIFAR100(root='./data', train=True, download=True, transform=train_transform)
testset = torchvision.datasets.CIFAR100(root='./data', train=False, download=True, transform=test_transform)

# Split train into train/val
train_size = int(0.9 * len(trainset))
val_size = len(trainset) - train_size
train_subset, val_subset = random_split(trainset, [train_size, val_size], generator=torch.Generator().manual_seed(56))

# DataLoaders
trainloader = DataLoader(train_subset, batch_size=32, shuffle=True, num_workers=4)
valloader = DataLoader(val_subset, batch_size=32, shuffle=False, num_workers=4)
testloader = DataLoader(testset, batch_size=32, shuffle=False, num_workers=4)

print(f"Train: {len(train_subset)}, Val: {len(val_subset)}, Test: {len(testset)}")

Train: 45000, Val: 5000, Test: 10000


### Train 

In [5]:
import torch
import torch.nn as nn
import torch.optim as optim
from tqdm import tqdm

def train_model(
    model,
    trainloader,
    valloader,
    epochs=10,
    lr=1e-3,
    checkpoint_path="best_model.pth",
    early_stop_patience=None,
):

    model = model.to(device)
    criterion = nn.CrossEntropyLoss()
    optimizer = optim.SGD(model.parameters(), lr=lr, momentum=0.9, weight_decay=5e-4 )
    scaler = torch.cuda.amp.GradScaler()     # Mixed precision

    best_val_acc = 0
    patience_counter = 0

    for epoch in range(epochs):
        model.train()
        running_loss, total, correct = 0, 0, 0

        pbar = tqdm(trainloader, desc=f"Epoch {epoch+1}/{epochs}")

        for images, labels in pbar:
            images, labels = images.to(device), labels.to(device)

            optimizer.zero_grad()

            with torch.cuda.amp.autocast():   # FP16 forward
                outputs = model(images)
                loss = criterion(outputs, labels)

            scaler.scale(loss).backward()
            scaler.step(optimizer)
            scaler.update()

            running_loss += loss.item() * images.size(0)
            _, predicted = outputs.max(1)
            total += labels.size(0)
            correct += predicted.eq(labels).sum().item()

            pbar.set_postfix(loss=loss.item())

        train_acc = 100 * correct / total
        val_acc = evaluate(model, valloader)

        print(
            f"Epoch {epoch+1}: "
            f"Loss={running_loss/total:.4f}, "
            f"Train Acc={train_acc:.2f}%, "
            f"Val Acc={val_acc:.2f}%"
        )

        # -------------------------------
        # Save Best Model Checkpoint
        # -------------------------------
        if val_acc > best_val_acc:
            best_val_acc = val_acc
            torch.save(
                {
                    "epoch": epoch + 1,
                    "model_state": model.state_dict(),
                    "optimizer_state": optimizer.state_dict(),
                    "val_acc": best_val_acc,
                },
                checkpoint_path,
            )
            print(f"✨ Saved Best Model (Val Acc: {best_val_acc:.2f}%)")

            patience_counter = 0
        else:
            patience_counter += 1

        # -------------------------------
        # Early Stopping
        # -------------------------------
        if early_stop_patience is not None:
            if patience_counter >= early_stop_patience:
                print("⛔ Early stopping triggered.")
                break

    print(f"Training completed. Best Val Acc: {best_val_acc:.2f}%")
    return best_val_acc


In [6]:
def evaluate(model, loader):
    model.eval()
    correct, total = 0, 0
    with torch.no_grad():
        for x, y in loader:
            x, y = x.to(device), y.to(device)
            outputs = model(x)
            _, predicted = outputs.max(1)
            total += y.size(0)
            correct += predicted.eq(y).sum().item()
    return 100 * correct / total

In [7]:
model_name = "resnetv2_101x1_bitm" # regnety_160, efficientvit_b0, convmixer_768_32  

model = get_models('cifar100', model_name, "resnetv2_101x1_bitm") 

train_model(model, trainloader, valloader, epochs=100, lr=0.005, checkpoint_path=f"checkpoints/{model_name}_cifar100.pth", 
           early_stop_patience=None)

Epoch 1/100: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:06<00:00,  3.30it/s, loss=0.487]


Epoch 1: Loss=1.6514, Train Acc=55.36%, Val Acc=63.02%
✨ Saved Best Model (Val Acc: 63.02%)


Epoch 2/100: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:03<00:00,  3.32it/s, loss=0.891]


Epoch 2: Loss=0.8985, Train Acc=73.21%, Val Acc=70.58%
✨ Saved Best Model (Val Acc: 70.58%)


Epoch 3/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:03<00:00,  3.32it/s, loss=1.4]


Epoch 3: Loss=0.6783, Train Acc=79.15%, Val Acc=75.06%
✨ Saved Best Model (Val Acc: 75.06%)


Epoch 4/100: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:03<00:00,  3.32it/s, loss=0.788]


Epoch 4: Loss=0.5630, Train Acc=82.48%, Val Acc=76.16%
✨ Saved Best Model (Val Acc: 76.16%)


Epoch 5/100: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.89]


Epoch 5: Loss=0.4727, Train Acc=84.96%, Val Acc=75.64%


Epoch 6/100: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.904]


Epoch 6: Loss=0.4114, Train Acc=86.75%, Val Acc=77.02%
✨ Saved Best Model (Val Acc: 77.02%)


Epoch 7/100: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.436]


Epoch 7: Loss=0.3610, Train Acc=88.29%, Val Acc=77.00%


Epoch 8/100: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:03<00:00,  3.33it/s, loss=0.253]


Epoch 8: Loss=0.3268, Train Acc=89.42%, Val Acc=77.48%
✨ Saved Best Model (Val Acc: 77.48%)


Epoch 9/100: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.156]


Epoch 9: Loss=0.3033, Train Acc=90.01%, Val Acc=77.10%


Epoch 10/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.0767]


Epoch 10: Loss=0.2781, Train Acc=90.75%, Val Acc=77.74%
✨ Saved Best Model (Val Acc: 77.74%)


Epoch 11/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.0165]


Epoch 11: Loss=0.2550, Train Acc=91.66%, Val Acc=78.42%
✨ Saved Best Model (Val Acc: 78.42%)


Epoch 12/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.219]


Epoch 12: Loss=0.2376, Train Acc=92.21%, Val Acc=78.46%
✨ Saved Best Model (Val Acc: 78.46%)


Epoch 13/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.0238]


Epoch 13: Loss=0.2200, Train Acc=92.55%, Val Acc=78.18%


Epoch 14/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:03<00:00,  3.32it/s, loss=0.362]


Epoch 14: Loss=0.2086, Train Acc=93.09%, Val Acc=78.26%


Epoch 15/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.788]


Epoch 15: Loss=0.2020, Train Acc=93.25%, Val Acc=78.18%


Epoch 16/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:03<00:00,  3.32it/s, loss=0.476]


Epoch 16: Loss=0.1973, Train Acc=93.59%, Val Acc=78.78%
✨ Saved Best Model (Val Acc: 78.78%)


Epoch 17/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.378]


Epoch 17: Loss=0.1869, Train Acc=93.77%, Val Acc=77.62%


Epoch 18/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.159]


Epoch 18: Loss=0.1786, Train Acc=94.11%, Val Acc=78.12%


Epoch 19/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.0257]


Epoch 19: Loss=0.1657, Train Acc=94.58%, Val Acc=77.66%


Epoch 20/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.0158]


Epoch 20: Loss=0.1610, Train Acc=94.76%, Val Acc=78.02%


Epoch 21/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:00<00:00,  3.35it/s, loss=0.0977]


Epoch 21: Loss=0.1682, Train Acc=94.44%, Val Acc=77.28%


Epoch 22/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:01<00:00,  3.33it/s, loss=0.317]


Epoch 22: Loss=0.1590, Train Acc=94.80%, Val Acc=76.60%


Epoch 23/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.0325]


Epoch 23: Loss=0.1502, Train Acc=95.16%, Val Acc=79.22%
✨ Saved Best Model (Val Acc: 79.22%)


Epoch 24/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.021]


Epoch 24: Loss=0.1546, Train Acc=94.89%, Val Acc=78.36%


Epoch 25/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.0702]


Epoch 25: Loss=0.1451, Train Acc=95.35%, Val Acc=78.58%


Epoch 26/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.0105]


Epoch 26: Loss=0.1476, Train Acc=95.13%, Val Acc=76.02%


Epoch 27/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.136]


Epoch 27: Loss=0.1527, Train Acc=95.04%, Val Acc=76.62%


Epoch 28/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.0909]


Epoch 28: Loss=0.1412, Train Acc=95.39%, Val Acc=77.80%


Epoch 29/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.0942]


Epoch 29: Loss=0.1375, Train Acc=95.63%, Val Acc=76.96%


Epoch 30/100: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.13]


Epoch 30: Loss=0.1406, Train Acc=95.52%, Val Acc=76.82%


Epoch 31/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.384]


Epoch 31: Loss=0.1458, Train Acc=95.40%, Val Acc=77.60%


Epoch 32/100: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.00299]


Epoch 32: Loss=0.1311, Train Acc=95.85%, Val Acc=75.52%


Epoch 33/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:01<00:00,  3.34it/s, loss=0.441]


Epoch 33: Loss=0.1462, Train Acc=95.31%, Val Acc=77.96%


Epoch 34/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:01<00:00,  3.34it/s, loss=0.0319]


Epoch 34: Loss=0.1390, Train Acc=95.56%, Val Acc=77.74%


Epoch 35/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:01<00:00,  3.34it/s, loss=0.0223]


Epoch 35: Loss=0.1386, Train Acc=95.65%, Val Acc=76.86%


Epoch 36/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:01<00:00,  3.34it/s, loss=0.0463]


Epoch 36: Loss=0.1421, Train Acc=95.55%, Val Acc=77.66%


Epoch 37/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:00<00:00,  3.34it/s, loss=0.409]


Epoch 37: Loss=0.1447, Train Acc=95.42%, Val Acc=75.90%


Epoch 38/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:01<00:00,  3.34it/s, loss=0.105]


Epoch 38: Loss=0.1297, Train Acc=96.00%, Val Acc=75.68%


Epoch 39/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:01<00:00,  3.34it/s, loss=0.0088]


Epoch 39: Loss=0.1459, Train Acc=95.34%, Val Acc=77.84%


Epoch 40/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.0627]


Epoch 40: Loss=0.1387, Train Acc=95.70%, Val Acc=78.32%


Epoch 41/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.028]


Epoch 41: Loss=0.1494, Train Acc=95.39%, Val Acc=77.56%


Epoch 42/100: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:03<00:00,  3.32it/s, loss=0.00554]


Epoch 42: Loss=0.1402, Train Acc=95.55%, Val Acc=78.02%


Epoch 43/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.0597]


Epoch 43: Loss=0.1494, Train Acc=95.29%, Val Acc=76.54%


Epoch 44/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:01<00:00,  3.34it/s, loss=0.0266]


Epoch 44: Loss=0.1470, Train Acc=95.44%, Val Acc=77.00%


Epoch 45/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.182]


Epoch 45: Loss=0.1478, Train Acc=95.38%, Val Acc=75.96%


Epoch 46/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:00<00:00,  3.35it/s, loss=0.061]


Epoch 46: Loss=0.1479, Train Acc=95.38%, Val Acc=75.24%


Epoch 47/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:59<00:00,  3.35it/s, loss=0.0308]


Epoch 47: Loss=0.1476, Train Acc=95.43%, Val Acc=76.64%


Epoch 48/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:59<00:00,  3.35it/s, loss=0.0622]


Epoch 48: Loss=0.1473, Train Acc=95.33%, Val Acc=74.86%


Epoch 49/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:00<00:00,  3.35it/s, loss=0.304]


Epoch 49: Loss=0.1647, Train Acc=94.92%, Val Acc=73.78%


Epoch 50/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:00<00:00,  3.35it/s, loss=0.0341]


Epoch 50: Loss=0.1557, Train Acc=95.17%, Val Acc=75.70%


Epoch 51/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:59<00:00,  3.35it/s, loss=0.0409]


Epoch 51: Loss=0.1651, Train Acc=94.96%, Val Acc=74.72%


Epoch 52/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:00<00:00,  3.35it/s, loss=0.638]


Epoch 52: Loss=0.1566, Train Acc=95.06%, Val Acc=76.06%


Epoch 53/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:01<00:00,  3.34it/s, loss=0.412]


Epoch 53: Loss=0.1668, Train Acc=94.79%, Val Acc=75.26%


Epoch 54/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:59<00:00,  3.35it/s, loss=0.186]


Epoch 54: Loss=0.1584, Train Acc=95.11%, Val Acc=75.26%


Epoch 55/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:59<00:00,  3.35it/s, loss=0.0126]


Epoch 55: Loss=0.1702, Train Acc=94.68%, Val Acc=76.50%


Epoch 56/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:59<00:00,  3.35it/s, loss=0.0486]


Epoch 56: Loss=0.1526, Train Acc=95.22%, Val Acc=75.66%


Epoch 57/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:59<00:00,  3.36it/s, loss=0.157]


Epoch 57: Loss=0.1799, Train Acc=94.50%, Val Acc=76.64%


Epoch 58/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:58<00:00,  3.36it/s, loss=0.0892]


Epoch 58: Loss=0.1648, Train Acc=94.84%, Val Acc=76.82%


Epoch 59/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:58<00:00,  3.36it/s, loss=0.214]


Epoch 59: Loss=0.1710, Train Acc=94.82%, Val Acc=74.96%


Epoch 60/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:59<00:00,  3.36it/s, loss=0.308]


Epoch 60: Loss=0.1818, Train Acc=94.50%, Val Acc=76.54%


Epoch 61/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:58<00:00,  3.36it/s, loss=0.0141]


Epoch 61: Loss=0.1762, Train Acc=94.63%, Val Acc=77.20%


Epoch 62/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:58<00:00,  3.36it/s, loss=0.0192]


Epoch 62: Loss=0.1735, Train Acc=94.69%, Val Acc=72.24%


Epoch 63/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:58<00:00,  3.36it/s, loss=0.0363]


Epoch 63: Loss=0.1861, Train Acc=94.29%, Val Acc=75.14%


Epoch 64/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:58<00:00,  3.36it/s, loss=0.179]


Epoch 64: Loss=0.1768, Train Acc=94.70%, Val Acc=73.68%


Epoch 65/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:58<00:00,  3.36it/s, loss=0.0197]


Epoch 65: Loss=0.1749, Train Acc=94.75%, Val Acc=74.78%


Epoch 66/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:58<00:00,  3.36it/s, loss=0.0887]


Epoch 66: Loss=0.1862, Train Acc=94.29%, Val Acc=77.92%


Epoch 67/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:59<00:00,  3.36it/s, loss=0.504]


Epoch 67: Loss=0.1990, Train Acc=94.00%, Val Acc=75.72%


Epoch 68/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:58<00:00,  3.36it/s, loss=0.0535]


Epoch 68: Loss=0.1811, Train Acc=94.49%, Val Acc=75.48%


Epoch 69/100: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:59<00:00,  3.35it/s, loss=1.13]


Epoch 69: Loss=0.1985, Train Acc=93.95%, Val Acc=74.16%


Epoch 70/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:59<00:00,  3.36it/s, loss=0.023]


Epoch 70: Loss=0.1971, Train Acc=93.97%, Val Acc=74.74%


Epoch 71/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:59<00:00,  3.35it/s, loss=0.0102]


Epoch 71: Loss=0.1910, Train Acc=94.31%, Val Acc=74.14%


Epoch 72/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:59<00:00,  3.36it/s, loss=0.063]


Epoch 72: Loss=0.1838, Train Acc=94.44%, Val Acc=76.04%


Epoch 73/100: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:58<00:00,  3.36it/s, loss=0.15]


Epoch 73: Loss=0.1903, Train Acc=94.21%, Val Acc=73.42%


Epoch 74/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:59<00:00,  3.36it/s, loss=0.0447]


Epoch 74: Loss=0.1795, Train Acc=94.56%, Val Acc=74.10%


Epoch 75/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:59<00:00,  3.36it/s, loss=0.528]


Epoch 75: Loss=0.1813, Train Acc=94.53%, Val Acc=74.22%


Epoch 76/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:58<00:00,  3.36it/s, loss=0.0465]


Epoch 76: Loss=0.2003, Train Acc=94.06%, Val Acc=73.26%


Epoch 77/100: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:59<00:00,  3.36it/s, loss=1.01]


Epoch 77: Loss=0.2028, Train Acc=93.86%, Val Acc=75.18%


Epoch 78/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:59<00:00,  3.36it/s, loss=0.0398]


Epoch 78: Loss=0.1891, Train Acc=94.37%, Val Acc=77.40%


Epoch 79/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [06:59<00:00,  3.36it/s, loss=0.0454]


Epoch 79: Loss=0.1959, Train Acc=94.15%, Val Acc=74.76%


Epoch 80/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:00<00:00,  3.35it/s, loss=1]


Epoch 80: Loss=0.1875, Train Acc=94.29%, Val Acc=75.84%


Epoch 81/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:01<00:00,  3.34it/s, loss=0.0463]


Epoch 81: Loss=0.2098, Train Acc=93.66%, Val Acc=74.84%


Epoch 82/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:01<00:00,  3.34it/s, loss=0.163]


Epoch 82: Loss=0.1995, Train Acc=93.93%, Val Acc=74.62%


Epoch 83/100: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:01<00:00,  3.34it/s, loss=0.759]


Epoch 83: Loss=0.1896, Train Acc=94.31%, Val Acc=73.48%


Epoch 84/100: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:02<00:00,  3.33it/s, loss=0.00465]


Epoch 84: Loss=0.2105, Train Acc=93.67%, Val Acc=74.06%


Epoch 85/100: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1407/1407 [07:04<00:00,  3.31it/s, loss=0.0592]


Epoch 85: Loss=0.2018, Train Acc=93.95%, Val Acc=75.42%


Epoch 86/100:  23%|█████████████████████████████                                                                                               | 330/1407 [01:40<05:27,  3.29it/s, loss=0.107]


KeyboardInterrupt: 