In [7]:
import torch
from torch.utils.data import DataLoader
import pandas as pd
import numpy as np
import copy
import time
import json
import numpy as np
import matplotlib.pyplot as plt 
import albumentations as A
from albumentations.pytorch import ToTensorV2
from pytorch_metric_learning import losses, miners, testers, samplers
from pytorch_metric_learning.utils.accuracy_calculator import AccuracyCalculator
from tqdm import tqdm
import random
import wandb

In [8]:
from models.efficientnet import EffNetModel
from models.swin import SwinTransformerModel
from models.efficientnet_v2 import EffNetV2Model

In [9]:
from datasets_handlers.base_dataset import BaseImageDataset, ClassLabelsMapper
from datasets_handlers.dataset_cub import cub200_dataset
from datasets_handlers.in_shop import in_shop_dataset
from datasets_handlers.stanford_online_products import stanford_products_dataset
from datasets_handlers.google_landmark import google_landmark_dataset
from datasets_handlers.cub200_2011 import cub200_2011_dataset

In [10]:
torch.manual_seed(0)
np.random.seed(0)
random.seed(0)

In [11]:
#stanford_train = stanford_products_dataset(split='train')
#stanford_test = stanford_products_dataset(split='test')

In [12]:
cub200_2011_train = cub200_2011_dataset(split='train')
cub200_2011_test = cub200_2011_dataset(split='test')

In [13]:
#cub200_train = cub200_dataset(split='train')
#cub200_test = cub200_dataset(split='test')

In [14]:
#inshop_train = in_shop_dataset(split='train')
#inshop_gallery = in_shop_dataset(split='gallery')
#inshop_query = in_shop_dataset(split='query')

In [15]:
#glm_train = google_landmark_dataset()

In [16]:
image_size = 224
train_transform = A.Compose(
    [
        A.HorizontalFlip(p=0.5),
        A.ImageCompression(quality_lower=99, quality_upper=100),
        A.ShiftScaleRotate(shift_limit=0.2, scale_limit=0.2, rotate_limit=10, border_mode=0, p=0.7),
        A.Resize(image_size, image_size),
        A.CoarseDropout(max_height=int(image_size * 0.4), max_width=int(image_size * 0.4), max_holes=1, p=0.5),
        A.Normalize(
            mean=[0.485, 0.456, 0.406],
            std=[0.229, 0.224, 0.225],
        ),
        ToTensorV2()
    ]
)

test_transform = A.Compose([
    A.Resize(image_size, image_size),
    A.Normalize(
        mean=[0.485, 0.456, 0.406],
        std=[0.229, 0.224, 0.225],
    ),
    ToTensorV2()
])

In [17]:
dataset_train = BaseImageDataset(ClassLabelsMapper(cub200_2011_train), path_prefix='data/', augmentations=train_transform)
dataset_test = BaseImageDataset(cub200_2011_test, path_prefix='data/', augmentations=test_transform)
#dataset_query = BaseImageDataset(inshop_query, path_prefix='data/', augmentations=test_transform)
#dataset_gallery = BaseImageDataset(inshop_gallery, path_prefix='data/', augmentations=test_transform)
#dataset_query = BaseImageDataset(inshop_query, path_prefix='data/', augmentations=test_transform)

In [33]:
len(dataset_train)

5994

In [34]:
len(dataset_test)

5794

In [35]:
5994+5794

11788

In [18]:
parameters = {
    'dataset:': type(dataset_train.dataset.dataset).__name__,
    'n_epochs': 500,
    'batch_size': 16,
    'lr': 1e-5
}

In [19]:
wandb.init(project="my-test-project", entity="ilya_fedorov", config=parameters)

[34m[1mwandb[0m: Currently logged in as: [33milya_fedorov[0m (use `wandb login --relogin` to force relogin)


In [20]:
%%time
train_targets = []
for x, target in cub200_2011_train:
    train_targets.append(target)

CPU times: user 872 ms, sys: 571 µs, total: 872 ms
Wall time: 872 ms


In [21]:
sampler = samplers.MPerClassSampler(
    train_targets, m=4, length_before_new_iter=len(dataset_train)
)

In [22]:
dataloader_train = DataLoader(
    dataset_train,
    batch_size=parameters['batch_size'],
    num_workers=8,
    pin_memory=True,
    sampler=sampler
)

In [68]:
#model = EffNetModel('efficientnet-b0').cuda()
#model = SwinTransformerModel('microsoft/swin-base-patch4-window7-224')
timm_model_name = 'tf_efficientnet_b5'
model = EffNetV2Model(2048, timm_model_name)
model.cuda()
model = model.train()

In [69]:
embedding_size = model(dataset_train[0][0].unsqueeze(0).cuda()).shape[1]
train_n_classes = len(dataset_train.dataset.labels_map)
model_total_params = sum(p.numel() for p in model.parameters())
print(model_total_params)
print(embedding_size)

30438960
1024


In [25]:
loss_args = {'margin': 0.02}
loss_func = losses.TripletMarginLoss(**loss_args)
#loss_func = losses.ArcFaceLoss(embedding_size=embedding_size, num_classes=train_n_classes).cuda()

miner = miners.TripletMarginMiner(**loss_args)

In [26]:
dataset_gallery = dataset_test
dataset_query = dataset_test

skip_first_neighbour = dataset_query == dataset_gallery

In [27]:
wandb.config.update({"skip_first_neighbour": skip_first_neighbour, 
                     "loss": type(loss_func).__name__, 
                     "model": type(model).__name__,
                     "timm_model_name": timm_model_name,
                     "embedding_size": embedding_size,
                     "train_n_classes": train_n_classes,
                     "model_total_parameters": model_total_params,
                     **loss_args
})

In [28]:
optimizer = torch.optim.AdamW(model.parameters(), lr=parameters['lr'])

scheduler = torch.optim.lr_scheduler.LinearLR(optimizer,
                                              start_factor=1.0,
                                              end_factor=0.1,
                                              total_iters=parameters['n_epochs'])

In [29]:
def get_all_embeddings(dataset, model):
    tester = testers.BaseTester()
    return tester.get_all_embeddings(dataset, model)

def test(train_set, test_set, model, accuracy_calculator):
    train_embeddings, train_labels = get_all_embeddings(train_set, model)
    if train_set != test_set:
        test_embeddings, test_labels = get_all_embeddings(test_set, model)
    else:
        test_embeddings, test_labels = train_embeddings, train_labels
    train_labels = train_labels.squeeze(1)
    test_labels = test_labels.squeeze(1)
    accuracies = accuracy_calculator.get_accuracy(
        test_embeddings, train_embeddings, test_labels, train_labels, skip_first_neighbour
    )
    return accuracies

In [30]:
accuracy_calculator = AccuracyCalculator(include=("mean_average_precision", "precision_at_1"), k=5)

In [31]:
train_iter_log_freq = 50

# first to see how it works out of box
model.eval()
test_results = test(dataset_gallery, dataset_query, model, accuracy_calculator)
wandb.log({"test/map@1": test_results['precision_at_1']})
wandb.log({"test/map@5": test_results['mean_average_precision']})
model.train()

i = 0
mean_loss = 0
for epoch in range(parameters['n_epochs']):
    print(f'Starting epoch {epoch}')
    wandb.log({"epoch": epoch})
    
    for data, labels in tqdm(dataloader_train):
        data = data.cuda()
        labels = labels.cuda()
        optimizer.zero_grad()
        embeddings = model(data)
        hard_pairs = miner(embeddings, labels)
        loss = loss_func(embeddings, labels, hard_pairs)
        mean_loss += loss.item()
        
        loss.backward()
        optimizer.step()
        if (i + 1) % train_iter_log_freq == 0:
            mean_loss /= train_iter_log_freq
            wandb.log({"train/loss": mean_loss})
            mean_loss = 0
        i += 1
        
    wandb.log({"train/lr": optimizer.param_groups[0]["lr"]})
    scheduler.step()
    if (epoch + 1) % 10 == 0:
        # query!
        model.eval()
        test_results = test(dataset_gallery, dataset_query, model, accuracy_calculator)
        wandb.log({"test/map@1": test_results['precision_at_1']})
        wandb.log({"test/map@5": test_results['mean_average_precision']})
        model.train()

100%|████████████████████████████████████████| 182/182 [00:11<00:00, 15.78it/s]


Starting epoch 0


100%|████████████████████████████████████████| 350/350 [00:32<00:00, 10.89it/s]


Starting epoch 1


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 11.08it/s]


Starting epoch 2


100%|████████████████████████████████████████| 350/350 [00:30<00:00, 11.57it/s]


Starting epoch 3


100%|████████████████████████████████████████| 350/350 [00:30<00:00, 11.56it/s]


Starting epoch 4


100%|████████████████████████████████████████| 350/350 [00:30<00:00, 11.55it/s]


Starting epoch 5


100%|████████████████████████████████████████| 350/350 [00:30<00:00, 11.53it/s]


Starting epoch 6


100%|████████████████████████████████████████| 350/350 [00:32<00:00, 10.67it/s]


Starting epoch 7


100%|████████████████████████████████████████| 350/350 [00:34<00:00, 10.19it/s]


Starting epoch 8


100%|████████████████████████████████████████| 350/350 [00:34<00:00, 10.04it/s]


Starting epoch 9


100%|████████████████████████████████████████| 350/350 [00:32<00:00, 10.80it/s]
100%|████████████████████████████████████████| 182/182 [00:11<00:00, 16.45it/s]


Starting epoch 10


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 11.10it/s]


Starting epoch 11


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 11.12it/s]


Starting epoch 12


100%|████████████████████████████████████████| 350/350 [00:32<00:00, 10.79it/s]


Starting epoch 13


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 11.08it/s]


Starting epoch 14


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 11.22it/s]


Starting epoch 15


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 11.20it/s]


Starting epoch 16


100%|████████████████████████████████████████| 350/350 [00:32<00:00, 10.79it/s]


Starting epoch 17


100%|████████████████████████████████████████| 350/350 [00:33<00:00, 10.49it/s]


Starting epoch 18


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 10.94it/s]


Starting epoch 19


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 11.29it/s]
100%|████████████████████████████████████████| 182/182 [00:11<00:00, 16.27it/s]


Starting epoch 20


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 11.21it/s]


Starting epoch 21


100%|████████████████████████████████████████| 350/350 [00:30<00:00, 11.34it/s]


Starting epoch 22


100%|████████████████████████████████████████| 350/350 [00:32<00:00, 10.61it/s]


Starting epoch 23


100%|████████████████████████████████████████| 350/350 [00:30<00:00, 11.34it/s]


Starting epoch 24


100%|████████████████████████████████████████| 350/350 [00:30<00:00, 11.32it/s]


Starting epoch 25


100%|████████████████████████████████████████| 350/350 [00:30<00:00, 11.32it/s]


Starting epoch 26


100%|████████████████████████████████████████| 350/350 [00:30<00:00, 11.32it/s]


Starting epoch 27


100%|████████████████████████████████████████| 350/350 [00:33<00:00, 10.56it/s]


Starting epoch 28


100%|████████████████████████████████████████| 350/350 [00:33<00:00, 10.56it/s]


Starting epoch 29


100%|████████████████████████████████████████| 350/350 [00:33<00:00, 10.47it/s]
100%|████████████████████████████████████████| 182/182 [00:11<00:00, 16.18it/s]


Starting epoch 30


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 11.12it/s]


Starting epoch 31


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.69it/s]


Starting epoch 32


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.76it/s]


Starting epoch 33


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.81it/s]


Starting epoch 34


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.83it/s]


Starting epoch 35


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.83it/s]


Starting epoch 36


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.79it/s]


Starting epoch 37


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.89it/s]


Starting epoch 38


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.84it/s]


Starting epoch 39


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.84it/s]
100%|████████████████████████████████████████| 182/182 [00:10<00:00, 17.06it/s]


Starting epoch 40


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.82it/s]


Starting epoch 41


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.82it/s]


Starting epoch 42


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.85it/s]


Starting epoch 43


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.83it/s]


Starting epoch 44


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.87it/s]


Starting epoch 45


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.85it/s]


Starting epoch 46


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.84it/s]


Starting epoch 47


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.83it/s]


Starting epoch 48


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.83it/s]


Starting epoch 49


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.85it/s]
100%|████████████████████████████████████████| 182/182 [00:10<00:00, 16.95it/s]


Starting epoch 50


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.83it/s]


Starting epoch 51


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.87it/s]


Starting epoch 52


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.84it/s]


Starting epoch 53


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.82it/s]


Starting epoch 54


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.78it/s]


Starting epoch 55


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.86it/s]


Starting epoch 56


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.86it/s]


Starting epoch 57


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.84it/s]


Starting epoch 58


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.87it/s]


Starting epoch 59


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.84it/s]
100%|████████████████████████████████████████| 182/182 [00:10<00:00, 17.03it/s]


Starting epoch 60


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.82it/s]


Starting epoch 61


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.87it/s]


Starting epoch 62


100%|████████████████████████████████████████| 350/350 [00:29<00:00, 11.87it/s]


Starting epoch 63


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 10.95it/s]


Starting epoch 64


100%|████████████████████████████████████████| 350/350 [00:34<00:00, 10.18it/s]


Starting epoch 65


100%|████████████████████████████████████████| 350/350 [00:34<00:00, 10.24it/s]


Starting epoch 66


100%|████████████████████████████████████████| 350/350 [00:33<00:00, 10.51it/s]


Starting epoch 67


100%|████████████████████████████████████████| 350/350 [00:34<00:00, 10.17it/s]


Starting epoch 68


100%|████████████████████████████████████████| 350/350 [00:33<00:00, 10.56it/s]


Starting epoch 69


100%|████████████████████████████████████████| 350/350 [00:33<00:00, 10.60it/s]
100%|████████████████████████████████████████| 182/182 [00:11<00:00, 16.40it/s]


Starting epoch 70


100%|████████████████████████████████████████| 350/350 [00:32<00:00, 10.84it/s]


Starting epoch 71


100%|████████████████████████████████████████| 350/350 [00:34<00:00, 10.29it/s]


Starting epoch 72


100%|████████████████████████████████████████| 350/350 [00:33<00:00, 10.55it/s]


Starting epoch 73


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 11.07it/s]


Starting epoch 74


100%|████████████████████████████████████████| 350/350 [00:30<00:00, 11.33it/s]


Starting epoch 75


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 11.21it/s]


Starting epoch 76


100%|████████████████████████████████████████| 350/350 [00:32<00:00, 10.77it/s]


Starting epoch 77


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 10.97it/s]


Starting epoch 78


100%|████████████████████████████████████████| 350/350 [00:32<00:00, 10.73it/s]


Starting epoch 79


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 11.20it/s]
100%|████████████████████████████████████████| 182/182 [00:11<00:00, 16.50it/s]


Starting epoch 80


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 11.19it/s]


Starting epoch 81


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 11.22it/s]


Starting epoch 82


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 11.13it/s]


Starting epoch 83


100%|████████████████████████████████████████| 350/350 [00:32<00:00, 10.69it/s]


Starting epoch 84


100%|████████████████████████████████████████| 350/350 [00:33<00:00, 10.47it/s]


Starting epoch 85


100%|████████████████████████████████████████| 350/350 [00:33<00:00, 10.32it/s]


Starting epoch 86


100%|████████████████████████████████████████| 350/350 [00:32<00:00, 10.77it/s]


Starting epoch 87


100%|████████████████████████████████████████| 350/350 [00:34<00:00, 10.14it/s]


Starting epoch 88


100%|████████████████████████████████████████| 350/350 [00:33<00:00, 10.48it/s]


Starting epoch 89


100%|████████████████████████████████████████| 350/350 [00:34<00:00, 10.03it/s]
100%|████████████████████████████████████████| 182/182 [00:10<00:00, 16.60it/s]


Starting epoch 90


100%|████████████████████████████████████████| 350/350 [00:34<00:00, 10.05it/s]


Starting epoch 91


100%|████████████████████████████████████████| 350/350 [00:33<00:00, 10.57it/s]


Starting epoch 92


100%|████████████████████████████████████████| 350/350 [00:35<00:00,  9.73it/s]


Starting epoch 93


100%|████████████████████████████████████████| 350/350 [00:32<00:00, 10.79it/s]


Starting epoch 94


100%|████████████████████████████████████████| 350/350 [00:33<00:00, 10.33it/s]


Starting epoch 95


100%|████████████████████████████████████████| 350/350 [00:32<00:00, 10.71it/s]


Starting epoch 96


100%|████████████████████████████████████████| 350/350 [00:32<00:00, 10.61it/s]


Starting epoch 97


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 11.00it/s]


Starting epoch 98


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 11.09it/s]


Starting epoch 99


100%|████████████████████████████████████████| 350/350 [00:32<00:00, 10.66it/s]
100%|████████████████████████████████████████| 182/182 [00:10<00:00, 16.65it/s]


Starting epoch 100


100%|████████████████████████████████████████| 350/350 [00:33<00:00, 10.36it/s]


Starting epoch 101


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 11.03it/s]


Starting epoch 102


100%|████████████████████████████████████████| 350/350 [00:33<00:00, 10.41it/s]


Starting epoch 103


100%|████████████████████████████████████████| 350/350 [00:33<00:00, 10.33it/s]


Starting epoch 104


100%|████████████████████████████████████████| 350/350 [00:35<00:00,  9.83it/s]


Starting epoch 105


100%|████████████████████████████████████████| 350/350 [00:36<00:00,  9.47it/s]


Starting epoch 106


100%|████████████████████████████████████████| 350/350 [00:37<00:00,  9.31it/s]


Starting epoch 107


100%|████████████████████████████████████████| 350/350 [00:36<00:00,  9.48it/s]


Starting epoch 108


100%|████████████████████████████████████████| 350/350 [00:34<00:00, 10.28it/s]


Starting epoch 109


100%|████████████████████████████████████████| 350/350 [00:36<00:00,  9.70it/s]
100%|████████████████████████████████████████| 182/182 [00:11<00:00, 15.80it/s]


Starting epoch 110


100%|████████████████████████████████████████| 350/350 [00:37<00:00,  9.35it/s]


Starting epoch 111


100%|████████████████████████████████████████| 350/350 [00:38<00:00,  8.98it/s]


Starting epoch 112


100%|████████████████████████████████████████| 350/350 [00:34<00:00, 10.20it/s]


Starting epoch 113


100%|████████████████████████████████████████| 350/350 [00:36<00:00,  9.55it/s]


Starting epoch 114


100%|████████████████████████████████████████| 350/350 [00:35<00:00,  9.81it/s]


Starting epoch 115


100%|████████████████████████████████████████| 350/350 [00:33<00:00, 10.36it/s]


Starting epoch 116


100%|████████████████████████████████████████| 350/350 [00:34<00:00, 10.21it/s]


Starting epoch 117


100%|████████████████████████████████████████| 350/350 [00:31<00:00, 11.06it/s]


Starting epoch 118


 97%|██████████████████████████████████████▋ | 339/350 [00:31<00:01, 10.63it/s]


KeyboardInterrupt: 

In [None]:
test_results = test(dataset_train, dataset_train, model, accuracy_calculator)

In [22]:
test_results

{'mean_average_precision': 0.8537094955024545,
 'precision_at_1': 0.8352840422495005}

In [None]:
import time
model.eval()

t0 = time.time()
with torch.no_grad():
    s = 0
    for img, label in dataloader_train:
        img = img.cuda()
        out = model(img)
        s += 1
        
        if time.time() - t0 > 5:
            t1 = time.time()
            break

model.train()

print(t1 - t0)
print(s * parameters['batch_size'] / (t1 - t0))