In [1]:
%cd ../src

/home/ubuntu/SPVD_Lightning/src


In [2]:
from models.ddpm_unet_cattn import SPVUnet
import torch
import lightning as L
from models.g_spvd import GSPVD



In [3]:
model_args = {
    'voxel_size' : 0.1,
    'nfs' : (32, 64, 128, 256), 
    'attn_chans' : 8, 
    'attn_start' : 3, 
    'cross_attn_chans' : 8, 
    'cross_attn_start' : 2, 
    'cross_attn_cond_dim' : 768,
}

model = SPVUnet(**model_args)
model = GSPVD(model=model, lr=0.1, training_steps=1)

In [18]:
from dataloaders.shapenet.shapenet_loader import ShapeNet

categories = ['car']
path = "../data/ShapeNet"

te = ShapeNet(path, "val", 2048, categories, load_renders=True)

Loading (val) renders for bowl (02880940): 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 17/17 [00:00<00:00, 38.04it/s]


In [19]:
import numpy as np

samples = 16
references = [te[idx] for idx in np.random.choice(list(range(len(te))), size=(samples,))]

reference_images = torch.stack([r["render-features"] for r in references]).to("cuda")

In [47]:
steps = 125
scheduler = 'ddpm'
ckpt_path = f'../checkpoints/distillation/GSPVD/{"-".join(categories)}/{steps}-steps.ckpt'
ckpt = torch.load(ckpt_path, weights_only=True)
# ckpt_path = '../checkpoints/distillation/GSPVD/starting.ckpt'
# ckpt = torch.load(ckpt_path, weights_only=True)['state_dict']
model.load_state_dict(ckpt)

<All keys matched successfully>

In [48]:
model = model.cuda().eval()

In [49]:
from my_schedulers.ddpm_scheduler import DDPMSparseScheduler
from my_schedulers.ddim_scheduler import DDIMSparseScheduler
from utils.visualization import display_pointclouds_grid

if scheduler == 'ddim':
    sched = DDIMSparseScheduler(beta_min=0.0001, beta_max=0.02, steps=steps, init_steps=1000)
else:
    sched = DDPMSparseScheduler(beta_min=0.0001, beta_max=0.02, steps=steps, init_steps=1000)

In [None]:
preds = sched.sample(model, samples, 2048, reference=reference_images)

Sampling:   3%|█████▏                                                                                                                                                              | 4/125 [00:00<00:06, 19.45it/s]

tensor(4.6156, device='cuda:0')
tensor(4.7315, device='cuda:0')
tensor(4.7525, device='cuda:0')
tensor(5.1452, device='cuda:0')


Sampling:   6%|██████████▍                                                                                                                                                         | 8/125 [00:00<00:05, 19.52it/s]

tensor(5.1952, device='cuda:0')
tensor(5.3107, device='cuda:0')
tensor(5.7945, device='cuda:0')
tensor(4.9846, device='cuda:0')


Sampling:  10%|███████████████▋                                                                                                                                                   | 12/125 [00:00<00:05, 19.56it/s]

tensor(4.8966, device='cuda:0')
tensor(4.8748, device='cuda:0')
tensor(4.6360, device='cuda:0')
tensor(4.2022, device='cuda:0')


Sampling:  13%|████████████████████▊                                                                                                                                              | 16/125 [00:00<00:05, 19.55it/s]

tensor(4.1319, device='cuda:0')
tensor(4.4376, device='cuda:0')
tensor(4.3539, device='cuda:0')
tensor(4.4719, device='cuda:0')


Sampling:  16%|██████████████████████████                                                                                                                                         | 20/125 [00:01<00:05, 19.53it/s]

tensor(4.5267, device='cuda:0')
tensor(4.3707, device='cuda:0')
tensor(4.3234, device='cuda:0')
tensor(4.2805, device='cuda:0')


Sampling:  19%|███████████████████████████████▎                                                                                                                                   | 24/125 [00:01<00:05, 19.58it/s]

tensor(4.5171, device='cuda:0')
tensor(4.3782, device='cuda:0')
tensor(4.3654, device='cuda:0')
tensor(4.0221, device='cuda:0')


Sampling:  22%|████████████████████████████████████▌                                                                                                                              | 28/125 [00:01<00:04, 19.64it/s]

tensor(4.6446, device='cuda:0')
tensor(4.5575, device='cuda:0')
tensor(4.2194, device='cuda:0')
tensor(4.0591, device='cuda:0')


Sampling:  26%|█████████████████████████████████████████▋                                                                                                                         | 32/125 [00:01<00:04, 19.59it/s]

tensor(4.2901, device='cuda:0')
tensor(4.1807, device='cuda:0')
tensor(4.1819, device='cuda:0')
tensor(4.1706, device='cuda:0')


Sampling:  29%|██████████████████████████████████████████████▉                                                                                                                    | 36/125 [00:01<00:04, 19.60it/s]

tensor(4.5299, device='cuda:0')
tensor(4.2402, device='cuda:0')
tensor(3.8938, device='cuda:0')
tensor(4.3571, device='cuda:0')


Sampling:  32%|████████████████████████████████████████████████████▏                                                                                                              | 40/125 [00:02<00:04, 19.58it/s]

tensor(4.4438, device='cuda:0')
tensor(4.5887, device='cuda:0')
tensor(4.5450, device='cuda:0')
tensor(4.4020, device='cuda:0')


Sampling:  35%|█████████████████████████████████████████████████████████▍                                                                                                         | 44/125 [00:02<00:04, 19.56it/s]

tensor(4.4670, device='cuda:0')
tensor(4.8537, device='cuda:0')
tensor(4.6855, device='cuda:0')
tensor(4.0606, device='cuda:0')


Sampling:  38%|██████████████████████████████████████████████████████████████▌                                                                                                    | 48/125 [00:02<00:03, 19.53it/s]

tensor(4.1916, device='cuda:0')
tensor(4.1058, device='cuda:0')
tensor(4.4588, device='cuda:0')
tensor(4.4156, device='cuda:0')


Sampling:  42%|███████████████████████████████████████████████████████████████████▊                                                                                               | 52/125 [00:02<00:03, 19.58it/s]

tensor(4.2095, device='cuda:0')
tensor(4.0749, device='cuda:0')
tensor(4.1311, device='cuda:0')
tensor(4.0190, device='cuda:0')


Sampling:  45%|█████████████████████████████████████████████████████████████████████████                                                                                          | 56/125 [00:02<00:03, 19.62it/s]

tensor(4.1745, device='cuda:0')
tensor(4.1555, device='cuda:0')
tensor(4.1675, device='cuda:0')
tensor(4.1945, device='cuda:0')


Sampling:  48%|██████████████████████████████████████████████████████████████████████████████▏                                                                                    | 60/125 [00:03<00:03, 19.55it/s]

tensor(4.0896, device='cuda:0')
tensor(3.8714, device='cuda:0')
tensor(4.1007, device='cuda:0')
tensor(4.2607, device='cuda:0')


Sampling:  51%|███████████████████████████████████████████████████████████████████████████████████▍                                                                               | 64/125 [00:03<00:03, 19.53it/s]

tensor(4.3512, device='cuda:0')
tensor(4.2286, device='cuda:0')
tensor(4.1663, device='cuda:0')
tensor(4.3390, device='cuda:0')


Sampling:  54%|████████████████████████████████████████████████████████████████████████████████████████▋                                                                          | 68/125 [00:03<00:02, 19.53it/s]

tensor(4.4867, device='cuda:0')
tensor(4.2778, device='cuda:0')
tensor(4.0249, device='cuda:0')
tensor(4.2109, device='cuda:0')


Sampling:  58%|█████████████████████████████████████████████████████████████████████████████████████████████▉                                                                     | 72/125 [00:03<00:02, 19.47it/s]

tensor(4.3708, device='cuda:0')
tensor(4.2124, device='cuda:0')
tensor(4.3854, device='cuda:0')
tensor(4.2529, device='cuda:0')


Sampling:  61%|███████████████████████████████████████████████████████████████████████████████████████████████████                                                                | 76/125 [00:03<00:02, 19.47it/s]

tensor(4.2118, device='cuda:0')
tensor(4.2081, device='cuda:0')
tensor(4.1600, device='cuda:0')
tensor(3.9108, device='cuda:0')


Sampling:  64%|████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                          | 80/125 [00:04<00:02, 19.40it/s]

tensor(4.0204, device='cuda:0')
tensor(3.9560, device='cuda:0')
tensor(4.0648, device='cuda:0')
tensor(4.2448, device='cuda:0')


Sampling:  67%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                     | 84/125 [00:04<00:02, 19.46it/s]

tensor(4.0428, device='cuda:0')
tensor(4.0764, device='cuda:0')
tensor(4.0573, device='cuda:0')
tensor(4.2157, device='cuda:0')


Sampling:  70%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                | 88/125 [00:04<00:01, 19.44it/s]

tensor(4.1117, device='cuda:0')
tensor(4.0983, device='cuda:0')
tensor(4.1792, device='cuda:0')
tensor(4.1056, device='cuda:0')


Sampling:  74%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                           | 92/125 [00:04<00:01, 19.47it/s]

tensor(4.2122, device='cuda:0')
tensor(4.0059, device='cuda:0')
tensor(4.0325, device='cuda:0')
tensor(4.0669, device='cuda:0')


Sampling:  77%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                     | 96/125 [00:04<00:01, 19.47it/s]

tensor(4.1034, device='cuda:0')
tensor(3.9524, device='cuda:0')
tensor(3.9554, device='cuda:0')
tensor(3.8538, device='cuda:0')


Sampling:  80%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                | 100/125 [00:05<00:01, 19.52it/s]

tensor(3.9519, device='cuda:0')
tensor(3.8224, device='cuda:0')
tensor(3.7144, device='cuda:0')
tensor(3.7778, device='cuda:0')


Sampling:  84%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                          | 105/125 [00:05<00:01, 19.73it/s]

tensor(3.7951, device='cuda:0')
tensor(3.9838, device='cuda:0')
tensor(3.8996, device='cuda:0')
tensor(3.7862, device='cuda:0')
tensor(3.7318, device='cuda:0')


Sampling:  88%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                   | 110/125 [00:05<00:00, 19.99it/s]

tensor(3.4391, device='cuda:0')
tensor(3.4468, device='cuda:0')
tensor(3.4721, device='cuda:0')
tensor(3.2506, device='cuda:0')
tensor(3.2478, device='cuda:0')


Sampling:  90%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍               | 113/125 [00:05<00:00, 20.20it/s]

tensor(3.1998, device='cuda:0')
tensor(3.2203, device='cuda:0')
tensor(3.1564, device='cuda:0')
tensor(3.2254, device='cuda:0')
tensor(2.9842, device='cuda:0')


Sampling:  95%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏       | 119/125 [00:06<00:00, 21.44it/s]

tensor(2.8528, device='cuda:0')
tensor(2.8025, device='cuda:0')
tensor(2.6850, device='cuda:0')
tensor(2.6433, device='cuda:0')
tensor(2.6214, device='cuda:0')


Sampling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 125/125 [00:06<00:00, 19.86it/s]

In [None]:
display_pointclouds_grid(preds.cpu().numpy(), offset=8, point_size=0.3)

In [None]:
real = torch.stack([r["pc"] for r in references]).numpy()
display_pointclouds_grid(real, offset=8, point_size=0.3)