In [1]:
# !pip install torch torchvision tqdm matplotlib onnx onnxscript
# sudo docker run -it --rm --gpus all --ipc=host --ulimit memlock=-1 --ulimit stack=67108864 -v$(pwd):/run/host -p 8888:8888 nvcr.io/nvidia/pytorch:24.12-py3


import random
import os

import torch
torch.set_float32_matmul_precision('high')
import torch.utils.data as tud
import torch.nn as nn
import torch.nn.functional as F

import torchvision.transforms as tvt
import torchvision.transforms.v2 as tv2
import torchvision.transforms.functional as tvf
import torchvision.datasets as tds
import torchvision.utils as tu
import torchvision

from tqdm import tqdm
import matplotlib.pyplot as plt

device = 'cuda:0' if torch.cuda.is_available() else 'cpu'
# device = 'cpu'
cpu_num = os.cpu_count() // 2

In [2]:
import loaders
batchsize = 64
DIM, train_loader, val_loader = loaders.get_loaders(batchsize)

In [3]:
model = torchvision.models.resnet18(weights=None)
# Replace the head b/c imagenette has only 10 classes.
model.fc = nn.Linear(in_features=512, out_features=10, bias=True)

model = model.to(device).train()

In [4]:
from apex.contrib.sparsity import ASP

optimizer = torch.optim.SGD(model.parameters(), lr=0.01, momentum=0.9, weight_decay=5e-4)
epochs = 30
scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=epochs)

ASP.prune_trained_model(model, optimizer)

lossfn = nn.CrossEntropyLoss()
loss_plot = []
for epoch in range(epochs):
    model.train()
    for i, (images, target) in enumerate(tqdm(train_loader)):
        optimizer.zero_grad()
        images = images.to(device)
        targets = target.to(device)

        outs = model(images)
        loss = lossfn(outs, targets)
        loss.backward()
        optimizer.step()
    scheduler.step()

    losses = []
    model.eval()
    correct = 0
    total = len(val_loader.dataset)
    for i, (images, target) in enumerate(val_loader):
        with torch.no_grad():
            images = images.to(device)
            targets = target.to(device)
            outs = model(images)

            loss = lossfn(outs, targets)
            losses.append(loss)
            for x in range(outs.shape[0]):
                preds = F.softmax(outs, dim=1)
                cls = preds[x].argmax()
                lbl = targets[x]
                if cls == lbl:
                    correct += 1

    epoch_loss = torch.Tensor(losses).mean().item()
    print("Epoch {}: {} ".format(epoch, epoch_loss))
    print("Current LR is {}".format(scheduler.get_last_lr()))
    print("{}/{} correct, {:.2f}%".format(correct, total, 100*correct/total))
    loss_plot.append(epoch_loss)

Found permutation search CUDA kernels
[ASP][Info] permutation_search_kernels can be imported.
[ASP] torchvision is imported, can work with the MaskRCNN/KeypointRCNN from torchvision.
[ASP] Auto skipping pruning conv1::weight of size=torch.Size([64, 3, 7, 7]) and type=torch.float32 for sparsity
[ASP] Auto skipping pruning fc::weight of size=torch.Size([10, 512]) and type=torch.float32 for sparsity
[set_permutation_params_from_asp] Set permutation needed parameters
	Sparse parameter names: ['layer1.0.conv1:weight', 'layer1.0.conv2:weight', 'layer1.1.conv1:weight', 'layer1.1.conv2:weight', 'layer2.0.conv1:weight', 'layer2.0.conv2:weight', 'layer2.0.downsample.0:weight', 'layer2.1.conv1:weight', 'layer2.1.conv2:weight', 'layer3.0.conv1:weight', 'layer3.0.conv2:weight', 'layer3.0.downsample.0:weight', 'layer3.1.conv1:weight', 'layer3.1.conv2:weight', 'layer4.0.conv1:weight', 'layer4.0.conv2:weight', 'layer4.0.downsample.0:weight', 'layer4.1.conv1:weight', 'layer4.1.conv2:weight']
	All param

  mask = torch.cuda.IntTensor(matrix.shape).fill_(1).view(-1,m)


[accelerated_search_for_good_permutation] Take 2.8250 seconds to search the permutation sequence.
[search_for_good_permutation] Take 2.8318 seconds to finish accelerated_search_for_good_permutation function and with final magnitude 29342.548828125.
Permutation for sibling group 12: [59, 130, 312, 38, 4, 275, 326, 511, 8, 142, 170, 454, 12, 105, 319, 90, 205, 300, 104, 284, 20, 349, 320, 198, 24, 224, 147, 145, 178, 301, 240, 161, 428, 210, 47, 385, 252, 88, 444, 487, 291, 61, 318, 383, 190, 256, 504, 106, 48, 427, 49, 437, 52, 403, 35, 507, 328, 78, 330, 331, 60, 134, 11, 414, 453, 64, 389, 321, 68, 71, 69, 276, 72, 486, 119, 112, 334, 100, 333, 509, 431, 265, 442, 117, 44, 348, 314, 128, 66, 323, 239, 322, 203, 168, 163, 13, 41, 257, 466, 136, 42, 196, 40, 98, 471, 367, 227, 407, 108, 350, 338, 441, 484, 46, 343, 340, 116, 299, 264, 366, 295, 120, 292, 353, 267, 255, 364, 365, 74, 186, 129, 75, 132, 496, 109, 285, 317, 200, 97, 73, 191, 409, 499, 341, 110, 344, 131, 144, 148, 149, 324




Epoch 0: 2.5715417861938477 
Current LR is [0.009972609476841367]
1061/3925 correct, 27.03%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 54.46it/s]

Epoch 1: 1.8728474378585815 
Current LR is [0.009890738003669028]
1676/3925 correct, 42.70%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 54.71it/s]

Epoch 2: 1.2360942363739014 
Current LR is [0.009755282581475769]
2358/3925 correct, 60.08%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 53.83it/s]

Epoch 3: 1.4558587074279785 
Current LR is [0.009567727288213004]
2095/3925 correct, 53.38%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 54.67it/s]

Epoch 4: 1.1891218423843384 
Current LR is [0.009330127018922194]
2476/3925 correct, 63.08%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 54.00it/s]

Epoch 5: 2.1081368923187256 
Current LR is [0.009045084971874737]
1702/3925 correct, 43.36%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 53.64it/s]

Epoch 6: 1.5070277452468872 
Current LR is [0.00871572412738697]
2339/3925 correct, 59.59%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 53.70it/s]

Epoch 7: 1.1745232343673706 
Current LR is [0.008345653031794291]
2479/3925 correct, 63.16%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 53.85it/s]

Epoch 8: 1.982565999031067 
Current LR is [0.007938926261462365]
1670/3925 correct, 42.55%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 54.09it/s]

Epoch 9: 0.9643592238426208 
Current LR is [0.007499999999999999]
2685/3925 correct, 68.41%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 53.67it/s]

Epoch 10: 0.9910804033279419 
Current LR is [0.007033683215379001]
2712/3925 correct, 69.10%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 53.97it/s]

Epoch 11: 0.7725822925567627 
Current LR is [0.0065450849718747366]
2967/3925 correct, 75.59%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 53.16it/s]

Epoch 12: 0.7226162552833557 
Current LR is [0.006039558454088796]
3038/3925 correct, 77.40%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 52.98it/s]

Epoch 13: 0.8984676599502563 
Current LR is [0.0055226423163382676]
2812/3925 correct, 71.64%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 53.60it/s]

Epoch 14: 0.7187636494636536 
Current LR is [0.005000000000000001]
3032/3925 correct, 77.25%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 53.56it/s]

Epoch 15: 0.675044596195221 
Current LR is [0.0044773576836617335]
3060/3925 correct, 77.96%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 54.05it/s]

Epoch 16: 0.6567634344100952 
Current LR is [0.003960441545911203]
3113/3925 correct, 79.31%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 54.01it/s]

Epoch 17: 0.6024516820907593 
Current LR is [0.003454915028125263]
3174/3925 correct, 80.87%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 52.99it/s]

Epoch 18: 0.6780432462692261 
Current LR is [0.0029663167846209998]
3110/3925 correct, 79.24%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 53.64it/s]

Epoch 19: 0.5982910990715027 
Current LR is [0.002500000000000001]
3195/3925 correct, 81.40%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 53.95it/s]

Epoch 20: 0.5808752775192261 
Current LR is [0.0020610737385376348]
3180/3925 correct, 81.02%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 53.78it/s]

Epoch 21: 0.5678159594535828 
Current LR is [0.0016543469682057104]
3229/3925 correct, 82.27%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 53.93it/s]

Epoch 22: 0.6271165609359741 
Current LR is [0.0012842758726130299]
3182/3925 correct, 81.07%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 53.76it/s]

Epoch 23: 0.5499690175056458 
Current LR is [0.0009549150281252634]
3258/3925 correct, 83.01%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 54.04it/s]

Epoch 24: 0.5233604907989502 
Current LR is [0.0006698729810778065]
3287/3925 correct, 83.75%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 54.02it/s]

Epoch 25: 0.5240201354026794 
Current LR is [0.00043227271178699516]
3261/3925 correct, 83.08%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 53.18it/s]

Epoch 26: 0.5107554793357849 
Current LR is [0.00024471741852423234]
3301/3925 correct, 84.10%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 53.47it/s]

Epoch 27: 0.5127426385879517 
Current LR is [0.00010926199633097157]
3306/3925 correct, 84.23%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 53.95it/s]

Epoch 28: 0.506304919719696 
Current LR is [2.7390523158632995e-05]
3304/3925 correct, 84.18%



00%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 148/148 [00:02<00:00, 53.84it/s]

Epoch 29: 0.5037730932235718 
Current LR is [0.0]
3311/3925 correct, 84.36%


In [5]:
torch.save(model, "sparse_resnet.pth")

In [6]:
# TODO Tensorrt has problems importing the model if it's exported by dynamo.
torch_input = torch.randn(1, 3, DIM, DIM).to(device)
onnx_program = torch.onnx.export(
    model,
    (torch_input,),
    "sparse_resnet.onnx",
    input_names=["input"],
    output_names=["output"],
    dynamo=False,
    external_data=False,
)

In [7]:
from ipywidgets import interact

@interact(index=(0, len(val_loader.dataset) - 1, 1))
def draw_preds(index=0):
    model.eval()
    with torch.no_grad():
        image = val_loader.dataset[index][0]
        pred = model(image.float().unsqueeze(0).to(device))
        pred = F.softmax(pred, dim=1)
        clsid = pred.argmax()
        plt.imshow(image.float().cpu().squeeze().permute(1, 2, 0), cmap='gray')
        print(int(clsid))

interactive(children=(IntSlider(value=0, description='index', max=3924), Output()), _dom_classes=('widget-inte…