The same as exp_1 but with LayerNorms, relu as activation and l2 component in the loss. Also all initial weights are set to 0 (Its equivalent to std=1)

In [1]:
%load_ext autoreload
%autoreload 2

In [2]:
import sys
sys.path.append('../../src')

In [3]:
import torch
from torch.utils.data import DataLoader

from flow_regressors.flow_dataset import FlowDataset
from flow_regressors.regressors import DensePoseRegressorV2

from training.train_flow import train
from training.loss_pose import LossPose

from tqdm.auto import tqdm

  from .autonotebook import tqdm as notebook_tqdm


### 1. Data

In [4]:
train_data = FlowDataset(
    root_path='/home/project/data_sample/flow/train',
    intrinsics_path='/home/project/ScanNet/scannet_indices/intrinsics.npz'
    )

train_loader = DataLoader(train_data, batch_size=128, shuffle=True, drop_last=True, pin_memory=True, num_workers=0)

val_data = FlowDataset(
    root_path='/home/project/data_sample/flow/val',
    intrinsics_path='/home/project/ScanNet/scannet_indices/intrinsics.npz'
    )

val_loader = DataLoader(val_data, batch_size=128, shuffle=False, drop_last=False, pin_memory=True, num_workers=0)

### 2. Configuration

In [5]:
torch.backends.cuda.matmul.allow_tf32 = True
torch.backends.cudnn.allow_tf32 = True

config = dict(
    general = dict(
        experiment_name='FLOW_TO_POSE_EXP_6',
        device=torch.device('cuda:0' if torch.cuda.is_available() else 'cpu'),
        
        n_epochs=10,
        n_steps_per_epoch=len(train_loader.dataset) // train_loader.batch_size,
        n_accum_steps=1,
        batch_size=train_loader.batch_size,
        
        swa=False,
        n_epochs_swa=None,
        n_steps_between_swa_updates=None,
          
        repeat_val_epoch=1,
        repeat_save_epoch=5,
          
        model_save_path='../../src/weights/FLOW_TO_POSE_EXP_6'
    )
)

### 3. Model

In [6]:
# Inference on (120, 160) input:

model = DensePoseRegressorV2(init_loss_weights=[0.0, 0.0, 0.0], activation='relu')
model.to(config['general']['device']);

In [7]:
# data = train_data[0]
# data['flow'] = torch.from_numpy(data['flow']).cuda().unsqueeze(0) 
# data['K_q'] = torch.from_numpy(data['K_q']).cuda().unsqueeze(0) 
# data['K_s'] = torch.from_numpy(data['K_s']).cuda().unsqueeze(0) 
# model.eval();

In [8]:
# %%timeit

# with torch.no_grad():
#     q, t = model(
#         data['flow'], data['K_q'], data['K_s'], (0.25, 0.25), (0.25, 0.25)
#        )

### 4. Loss, optimizer, scheduler

In [9]:
train_loss = LossPose(agg_type='mean')
val_loss = LossPose()

In [10]:
optimizer = torch.optim.AdamW(model.parameters(), lr=1e-4, weight_decay=1e-6)
config['optimizer'] = optimizer.__dict__['defaults']

In [11]:
scheduler = torch.optim.lr_scheduler.StepLR(optimizer,
                   step_size=2,
                   gamma=0.8)

### 6. Experiment

In [12]:
train(model, optimizer, scheduler, train_loss, val_loss, train_loader, val_loader, config, **config['general'])

[34m[1mwandb[0m: Currently logged in as: [33mkovanic[0m. Use [1m`wandb login --relogin`[0m to force relogin


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 775/775 [11:49<00:00,  1.09it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 333/333 [04:47<00:00,  1.16it/s]


epoch 0: train loss=0.8204382198269199, val loss(q)=0.1595212068987336, val loss(t)=0.49910314400721145


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 775/775 [11:59<00:00,  1.08it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 333/333 [04:41<00:00,  1.18it/s]


epoch 1: train loss=-0.5696301029812058, val loss(q)=0.12963433930210516, val loss(t)=0.4155396868223487


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 775/775 [11:52<00:00,  1.09it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 333/333 [04:41<00:00,  1.18it/s]


epoch 2: train loss=-1.3459195552539052, val loss(q)=0.11169483598607392, val loss(t)=0.37313453205763225


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 775/775 [11:52<00:00,  1.09it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 333/333 [04:43<00:00,  1.18it/s]


epoch 3: train loss=-1.973801632230772, val loss(q)=0.10951023893719984, val loss(t)=0.3594674154262479


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 775/775 [11:53<00:00,  1.09it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 333/333 [04:37<00:00,  1.20it/s]


epoch 4: train loss=-2.5603207403412553, val loss(q)=0.09482834488662262, val loss(t)=0.3327370231312279


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 775/775 [11:58<00:00,  1.08it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 333/333 [04:38<00:00,  1.20it/s]


epoch 5: train loss=-3.0566812753479926, val loss(q)=0.0945303598049309, val loss(t)=0.3286754683835696


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 775/775 [11:59<00:00,  1.08it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 333/333 [04:37<00:00,  1.20it/s]


epoch 6: train loss=-3.5179752876019217, val loss(q)=0.09626636780515999, val loss(t)=0.3263475434190787


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 775/775 [11:54<00:00,  1.08it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 333/333 [04:38<00:00,  1.20it/s]


epoch 7: train loss=-3.9116064709675293, val loss(q)=0.08626321804648235, val loss(t)=0.2998064851792599


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 775/775 [11:51<00:00,  1.09it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 333/333 [04:39<00:00,  1.19it/s]


epoch 8: train loss=-4.276196745115332, val loss(q)=0.08625592301593957, val loss(t)=0.2988046437284789


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 775/775 [12:01<00:00,  1.07it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 333/333 [04:37<00:00,  1.20it/s]

epoch 9: train loss=-4.585704438566821, val loss(q)=0.0830660281228062, val loss(t)=0.2944225589753715





0,1
Train batch loss,█▆▆▅▅▅▅▄▄▄▄▄▄▄▃▃▃▃▃▃▃▃▃▂▂▂▂▂▂▂▂▂▂▁▁▁▁▁▁▁
Train loss epoch,█▆▅▄▄▃▂▂▁▁
Val loss epoch(q),█▅▄▃▂▂▂▁▁▁
Val loss epoch(t),█▅▄▃▂▂▂▁▁▁

0,1
Train batch loss,-4.76985
Train loss epoch,-4.5857
Val loss epoch(q),0.08307
Val loss epoch(t),0.29442
