In [11]:
%load_ext autoreload
%autoreload 2

import copy
import os
import sys
import time
from tqdm import tqdm

import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import pandas as pd
import pickle
import sklearn

import torch

torch.manual_seed(0)

import torchvision
from torchvision import transforms
import torch.nn as nn

sys.path.append('./../')
from src.dataset import VehiclePredictorDataset
from src.utils import train_model, evaluate_model, get_model, visualize_model
#from src.bilinear import BCNN

The autoreload extension is already loaded. To reload it, use:
  %reload_ext autoreload


## GPU Check

In [12]:
device = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')
print(device)

cuda:0


## Config Variables

In [13]:
root_path = './../'
data_path = os.path.join(root_path, 'data')
dataset_path = os.path.join(data_path, 'VMMRdb')

# modify this line if you want to train a model on top 100/top 200/top 300 most common make_models
with open(os.path.join(data_path, 'make_model_year_most_common_100.pkl'), 'rb') as f:
    target_make_model_year_labels = pickle.load(f)

# load the dataset for some stats
vp_dataset = VehiclePredictorDataset(root_dir=dataset_path, target_make_model_year_labels=target_make_model_year_labels)
num_images = len(vp_dataset)
num_labels = len(vp_dataset.make_model_year_counts)
class_distribution = vp_dataset.make_model_year_counts
print(f"num_images: {num_images}")
print(f"num_labels: {num_labels}")

num_images: 38098
num_labels: 100


## Define the transforms
- Add other transforms here later, if needed. 
- Do we need any specific transforms for train and val?

In [14]:
def get_transform():
    
    transform = transforms.Compose([
        #transforms.Resize((224, 224)),
        #transforms.Resize((448, 448)),
        
        torchvision.transforms.Resize(size=224),
        transforms.RandomHorizontalFlip(),
        #random affine transformation
        torchvision.transforms.CenterCrop(size=224),
        
        transforms.ToTensor(),
        transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
    ])
    
    return transform

## Instantiate the train, val and test dataloaders

In [15]:
train_split_ratio = 0.8
val_split_ratio = 0.1
test_split_ration = 0.1

# later see if you can have train-specific transforms
dataset = VehiclePredictorDataset(root_dir=dataset_path, target_make_model_year_labels=target_make_model_year_labels, transform=get_transform())

# split dataset in train and val set
dataset_len = len(dataset)
indices = torch.randperm(dataset_len).tolist()
train_split_index = int(train_split_ratio * dataset_len)
val_split_index = train_split_index + int(val_split_ratio * dataset_len)
train_dataset = torch.utils.data.Subset(dataset, indices[0:train_split_index])
val_dataset = torch.utils.data.Subset(dataset, indices[train_split_index:val_split_index])
test_dataset = torch.utils.data.Subset(dataset, indices[val_split_index:])

set_num_workers = 8;
batch_size = 64

# define the dataloaders
dataloader_train = torch.utils.data.DataLoader(
    train_dataset,
    batch_size=batch_size,
    shuffle=True,
    num_workers=set_num_workers,
)

dataloader_val = torch.utils.data.DataLoader(
    val_dataset,
    batch_size=batch_size,
    shuffle=False,
    num_workers=set_num_workers,
)

dataloader_test = torch.utils.data.DataLoader(
    test_dataset,
    batch_size=1,
    shuffle=True,
    num_workers=set_num_workers,
)

dataset_sizes = {
    'train': len(train_dataset),
    'val': len(val_dataset),
    'test': len(val_dataset)
}

print(f'train: 0 to {train_split_index}\nval: {train_split_index} to {val_split_index}\ntest: {val_split_index} to {dataset_len-1}')
print(f'dataset_sizes : {dataset_sizes}')

train: 0 to 30478
val: 30478 to 34287
test: 34287 to 38097
dataset_sizes : {'train': 30478, 'val': 3809, 'test': 3809}


## Model config

In [19]:
# check https://pytorch.org/vision/0.8/models.html to experiment with other backbone model
backbone_model = 'bilinear_vgg16_ft'
num_epochs = 30
lr = 0.01

# get the model
model = get_model(num_labels, backbone_model).to(device)
model_name = 'bilinear_vgg16_ft_100classes_25epochs_makemodelyear_acc_0.628.pth'
model.load_state_dict(torch.load(os.path.join(root_path, 'models', model_name)))

# the reason for computing weights is to account for the class imbalance
weight_distribution = 1 / torch.tensor(list(class_distribution.values()))
weight_distribution = weight_distribution / weight_distribution.sum()
weight_distribution = weight_distribution.to(device)

# define the loss function
criterion = nn.CrossEntropyLoss(weight=weight_distribution)

# define the optimizer
optimizer = torch.optim.SGD(model.parameters(), lr, momentum=0.9, weight_decay = 1e-4)

# define the scheduler
#exp_lr_scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=100, gamma=0.8)
exp_lr_scheduler = torch.optim.lr_scheduler.ReduceLROnPlateau(optimizer, mode='max', factor=0.1, patience=3, verbose=True)

target_labels = 'makemodelyear'
model_info = {
    'backbone': backbone_model,
    'num_classes': f"{num_labels}classes",
    'num_epochs': f"{num_epochs}epochs",
    'labels': target_labels
}
model_name = "_".join([model_info[key] for key in model_info]) + ".pth"
print(f"model_name: {model_name}")

model_name: bilinear_vgg16_ft_100classes_30epochs_makemodelyear.pth


## Train
- Uncomment this line if you want to train again. 
- The trained models are all stored in this [drive folder]( https://drive.google.com/drive/folders/1RXaKgStTFnVRaLvk-eIHEGhwvQp-y1-c?usp=sharing)

In [20]:
train_model(model, model_info, dataset_sizes, dataloader_train, dataloader_val, criterion, optimizer, exp_lr_scheduler, target_labels, num_epochs)

Epoch 0/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0340 Acc: 0.9985 Time: 2m 10s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.01it/s]


val Loss: 1.0143 Acc: 0.6188 Time: 2m 18s
learning rate: 0.01
Epoch 1/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0325 Acc: 0.9983 Time: 4m 28s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.00it/s]


val Loss: 1.0124 Acc: 0.6272 Time: 5m 35s
learning rate: 0.01
Epoch 2/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0304 Acc: 0.9985 Time: 7m 46s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.10it/s]


val Loss: 1.0092 Acc: 0.6246 Time: 7m 53s
learning rate: 0.01
Epoch 3/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0303 Acc: 0.9984 Time: 9m 3s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.01it/s]


val Loss: 1.0155 Acc: 0.6277 Time: 9m 11s
learning rate: 0.01
Epoch 4/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0279 Acc: 0.9983 Time: 11m 21s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.10it/s]


val Loss: 1.0180 Acc: 0.6233 Time: 11m 28s
learning rate: 0.01
Epoch 5/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0262 Acc: 0.9986 Time: 14m 39s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  7.52it/s]


val Loss: 1.0223 Acc: 0.6264 Time: 14m 47s
learning rate: 0.01
Epoch 6/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0254 Acc: 0.9987 Time: 16m 57s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.04it/s]


val Loss: 1.0298 Acc: 0.6198 Time: 16m 5s
learning rate: 0.01
Epoch 7/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0248 Acc: 0.9987 Time: 18m 15s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.16it/s]


val Loss: 1.0345 Acc: 0.6269 Time: 18m 22s
Epoch 00008: reducing learning rate of group 0 to 1.0000e-03.
learning rate: 0.001
Epoch 8/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0216 Acc: 0.9988 Time: 21m 32s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.07it/s]


val Loss: 1.0192 Acc: 0.6303 Time: 21m 40s
learning rate: 0.001
Epoch 9/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0214 Acc: 0.9989 Time: 23m 50s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.15it/s]


val Loss: 1.0302 Acc: 0.6306 Time: 23m 57s
learning rate: 0.001
Epoch 10/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0210 Acc: 0.9990 Time: 25m 8s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.09it/s]


val Loss: 1.0199 Acc: 0.6298 Time: 25m 15s
learning rate: 0.001
Epoch 11/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0206 Acc: 0.9990 Time: 27m 26s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  7.97it/s]


val Loss: 1.0260 Acc: 0.6324 Time: 28m 33s
learning rate: 0.001
Epoch 12/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0204 Acc: 0.9990 Time: 30m 43s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.08it/s]


val Loss: 1.0273 Acc: 0.6324 Time: 30m 51s
learning rate: 0.001
Epoch 13/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.67it/s]


train Loss: 0.0206 Acc: 0.9988 Time: 32m 1s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.05it/s]


val Loss: 1.0280 Acc: 0.6317 Time: 32m 8s
learning rate: 0.001
Epoch 14/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0204 Acc: 0.9989 Time: 34m 19s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.06it/s]


val Loss: 1.0237 Acc: 0.6314 Time: 34m 26s
learning rate: 0.001
Epoch 15/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0203 Acc: 0.9988 Time: 37m 36s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  7.53it/s]


val Loss: 1.0303 Acc: 0.6288 Time: 37m 44s
Epoch 00016: reducing learning rate of group 0 to 1.0000e-04.
learning rate: 0.0001
Epoch 16/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0202 Acc: 0.9990 Time: 39m 55s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.11it/s]


val Loss: 1.0251 Acc: 0.6275 Time: 39m 2s
learning rate: 0.0001
Epoch 17/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.67it/s]


train Loss: 0.0200 Acc: 0.9990 Time: 41m 12s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.10it/s]


val Loss: 1.0369 Acc: 0.6235 Time: 41m 19s
learning rate: 0.0001
Epoch 18/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0200 Acc: 0.9991 Time: 43m 30s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.12it/s]


val Loss: 1.0225 Acc: 0.6303 Time: 44m 37s
learning rate: 0.0001
Epoch 19/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0203 Acc: 0.9989 Time: 46m 47s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.03it/s]


val Loss: 1.0274 Acc: 0.6275 Time: 46m 55s
Epoch 00020: reducing learning rate of group 0 to 1.0000e-05.
learning rate: 1e-05
Epoch 20/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0200 Acc: 0.9989 Time: 48m 5s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.07it/s]


val Loss: 1.0258 Acc: 0.6314 Time: 48m 13s
learning rate: 1e-05
Epoch 21/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0199 Acc: 0.9990 Time: 50m 23s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.01it/s]


val Loss: 1.0167 Acc: 0.6290 Time: 51m 30s
learning rate: 1e-05
Epoch 22/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0200 Acc: 0.9990 Time: 53m 40s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.05it/s]


val Loss: 1.0229 Acc: 0.6298 Time: 53m 48s
learning rate: 1e-05
Epoch 23/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0201 Acc: 0.9990 Time: 55m 58s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.10it/s]


val Loss: 1.0370 Acc: 0.6219 Time: 55m 6s
Epoch 00024: reducing learning rate of group 0 to 1.0000e-06.
learning rate: 1.0000000000000002e-06
Epoch 24/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0198 Acc: 0.9992 Time: 57m 16s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.16it/s]


val Loss: 1.0275 Acc: 0.6261 Time: 57m 23s
learning rate: 1.0000000000000002e-06
Epoch 25/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0199 Acc: 0.9990 Time: 60m 33s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.00it/s]


val Loss: 1.0249 Acc: 0.6311 Time: 60m 41s
learning rate: 1.0000000000000002e-06
Epoch 26/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0202 Acc: 0.9988 Time: 62m 51s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.10it/s]


val Loss: 1.0319 Acc: 0.6264 Time: 62m 58s
learning rate: 1.0000000000000002e-06
Epoch 27/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0200 Acc: 0.9991 Time: 64m 9s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.08it/s]


val Loss: 1.0282 Acc: 0.6290 Time: 64m 16s
Epoch 00028: reducing learning rate of group 0 to 1.0000e-07.
learning rate: 1.0000000000000002e-07
Epoch 28/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0199 Acc: 0.9990 Time: 66m 26s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.06it/s]


val Loss: 1.0267 Acc: 0.6314 Time: 67m 34s
learning rate: 1.0000000000000002e-07
Epoch 29/29
----------


100%|█████████████████████████████████████████████████████████████████████████████████████████████| 477/477 [02:10<00:00,  3.66it/s]


train Loss: 0.0200 Acc: 0.9990 Time: 69m 44s


100%|███████████████████████████████████████████████████████████████████████████████████████████████| 60/60 [00:07<00:00,  8.10it/s]


val Loss: 1.0285 Acc: 0.6293 Time: 69m 51s
learning rate: 1.0000000000000002e-07
Training complete in 68m 51s
Best val Acc: 0.632449


## Evaluate on test set

In [21]:
# Load saved model
model_name = 'bilinear_vgg16_ft_100classes_30epochs_makemodelyear_acc_0.632.pth'
backbone_model = 'bilinear_vgg16_ft'
target_labels = 'makemodelyear'
model = get_model(num_labels, backbone_model).to(device)
model.load_state_dict(torch.load(os.path.join(root_path, 'models', model_name)))

cm, cr = evaluate_model(model, dataset_sizes, dataloader_test, target_labels, target_make_model_year_labels)

# plot the CM
cm_pd = cm.astype('float') / cm.sum(axis=1)[:, np.newaxis]
cm_pd = pd.DataFrame(cm_pd, index=target_make_model_year_labels, columns=target_make_model_year_labels)
cr_pd = pd.DataFrame(cr).transpose()

100%|██████████████████████████████████████████████████████████████████████████████████████████| 3811/3811 [00:22<00:00, 169.90it/s]

Test Acc: 0.6301
Average time per image: 0.0059 seconds





In [None]:
model

- Confusion matrix

In [None]:
cm_pd

- Classification Report

In [None]:
cr_pd

- Save/Load the metrics

In [22]:
cm_pd.to_csv(os.path.join(root_path, 'results', 'bilinear', f"confusion_matrix_{model_name}.csv"), index=False)
cr_pd.to_csv(os.path.join(root_path, 'results', 'bilinear', f"classification_report_{model_name}.csv"), index=False)
#cm_pd_df = pd.read_csv(os.path.join(root_path, 'results', 'baseline_methods', f"confusion_matrix_{model_name}.csv"))
#cr_pd_df = pd.read_csv(os.path.join(root_path, 'results', 'baseline_methods', f"classification_report_{model_name}.csv"))

## Visually Inspect performance
- Load a target model to inpect

In [None]:
# Load saved model
model = get_model(num_labels, backbone_model).to(device)
model.load_state_dict(torch.load(os.path.join(root_path, 'models', model_name)))

- Visualize for a few examples from the test set

In [None]:
visualize_model(model, dataset, dataloader_test, target_labels, target_make_model_year_labels, num_images=10)