In [1]:

import pandas as pd
import matplotlib.pyplot as plt
import cv2
import pydicom
import numpy as np
import os
import glob
from tqdm import tqdm
import warnings
from dataclasses import dataclass
from enum import StrEnum
import random

from torch.optim import AdamW

from torch.utils.data import Dataset, DataLoader
import torch
import torch.nn as nn
import torch.nn.functional as F
import timm
from lib import *

from transformers import get_cosine_schedule_with_warmup

from sklearn.model_selection import KFold

import pickle

In [2]:

DEBUG = False
DATA_DIR = "./processed-data/sagittal_t2_stir_segmentation"
MODEL_NAME = "tf_efficientnet_b0.ns_jft_in1k" if DEBUG else "tf_efficientnet_b5.ns_jft_in1k"
DEVICE = "cuda:0"
MODEL_DIR = "./models/sagittial_t2_stir"

EPOCHS = 15

HEIGHT = 512
WIDTH = 512

# Network params
N_CLASSES = 5
HIDDEN_DIM = 768
LOCATION_DIM = 10


SEED = 8620
N_WORKERS=4

GRAD_ACC = 1
TGT_BATCH_SIZE = 16
BATCH_SIZE = TGT_BATCH_SIZE // GRAD_ACC
EARLY_STOPPING_EPOCH = 3
OUTPUT_DIR = "models/sagittial_t2_stir"


TEST_BATCH_SIZE = 1

N_FOLDS = 5

LR = 2e-4 * TGT_BATCH_SIZE / 32
AUG = True

In [3]:
df = pd.read_csv('./data/train.csv')

PATH = f"./processed-data/sagittal_t2_stir_segmentation/"
patient_ids = [*map(lambda p: int(os.path.basename(p).split(".")[0]), glob.glob(f"{PATH}/*.pkl"))]

df = df[df["study_id"].isin(patient_ids)]


In [4]:

def vertical_flip(img, coord):
    new_coord = coord.copy()
    img = cv2.flip(img, 0)  # 0 for vertical flip
    new_coord[:, 1] = img.shape[1] - new_coord[:, 1]  # Adjusting the y-coordinates for vertical flip
    return img, new_coord

def horizontal_flip(img, coord):
    new_coord = coord.copy()
    img = cv2.flip(img, 1)  # Corrected to 1 for horizontal flip
    new_coord[:, 0] = img.shape[0] - new_coord[:, 0]  # Adjusting the x-coordinates for horizontal flip
    return img, new_coord


In [5]:
class RSNA24Dataset(Dataset):
    def __init__(self, patient_ids, transformations=[], phase="train", positive_negative_ratio=0.5, positive_augment_prob=0.25, negative_augment_prob=0.15):
        self.patient_ids = patient_ids
        self.transformations = transformations
        self.positive_negative_ratio = positive_negative_ratio
        self.positive_augment_prob = positive_augment_prob
        self.negative_augment_prob = negative_augment_prob
        self.phase = phase
    
    def __len__(self):
        return len(self.patient_ids)

    def __getitem__(self, idx):
        
        patient_id = self.patient_ids[idx]

        patient_info_path = f"{DATA_DIR}/{patient_id}.pkl"

        with open(patient_info_path, "rb") as f:
            data = pickle.load(f)

        sagittal_t2_stir = [*data["series"].values()]

        if len(sagittal_t2_stir) == 0:
            return None
        else:
            sagittal_t2_stir = sagittal_t2_stir[0]


        if self.phase == "train":
            
            y_class = np.zeros(5)
            y_loc = np.zeros((5,2))
            
            if random.random() <= self.positive_negative_ratio:
                imgs = [img for img in sagittal_t2_stir["images"] if len(img["labels"]) != 0]
                has_sampled_postive_label = True
            else:
                imgs = [img for img in sagittal_t2_stir["images"] if len(img["labels"]) == 0]
                has_sampled_postive_label = False
                
            img =  random.choice(imgs) if len(imgs) != 0 else random.choice(sagittal_t2_stir["images"])
            x = img["img"].astype(np.float32)
    
            for label in img["labels"]:
                y_loc[label.level - 1] = np.array([label.x, label.y])
                y_class[label.level - 1] = 1
    
            aug_prob = self.positive_augment_prob if has_sampled_postive_label else self.negative_augment_prob
            x,y_loc = self.transform(x, y_class, y_loc,aug_prob)
    
            x = x / 255
            x = np.expand_dims(x, 0)
    
            return x, (y_class,y_loc)
            
        else:
            imgs = sagittal_t2_stir["images"]
            num_imgs = len(imgs)
            xs = np.zeros((num_imgs, HEIGHT, WIDTH))
            
            y_classes = np.zeros((num_imgs, 5))
            y_locs = np.zeros((num_imgs, 5, 2))

            for idx,img in enumerate(imgs):
                xs[idx] = img["img"].astype(np.float32)
                
                for label in img["labels"]:
                    y_locs[idx, label.level - 1] = np.array([label.x, label.y])
                    y_classes[idx, label.level - 1] = 1
            xs = xs / 255
            xs = np.expand_dims(xs, 1)
            return xs, (y_classes, y_locs)
            


    def transform(self, x, y_class, y_loc, aug_prob):
        for transformation in self.transformations:
            if random.random() <= aug_prob:
                x,y_loc = transformation(x,y_loc)
                y_loc = np.expand_dims(y_class, 1) * y_loc
                    
        return x, y_loc
            

In [6]:


class AvgPool(nn.Module):
    def __init__(self):
        super().__init__()
        
    def forward(self,x):

        r = list(x.shape)[:-2]
        r.append(-1)
        x = x.reshape(tuple(r)).mean(dim=-1)
        
        return x

class RSNA24Model(nn.Module):
    def __init__(self, model_name, n_classes=N_CLASSES, location_dim=LOCATION_DIM, hidden_dim=HIDDEN_DIM, pretrained=True, features_only=True):
        super().__init__()
        
        self.img_features  = 512
        self.img_features_dim = 2048
        self.hidden_dim = hidden_dim
        self.n_classes = n_classes
        self.location_dim = location_dim

        self.initial_conv = nn.Conv2d(1,3, (3,3), stride=(1,1), padding=(1,1))
        self.feature_extractor =  timm.create_model( model_name , pretrained=pretrained , features_only=features_only, out_indices=[-1] )

        self.predictors = nn.Sequential(
            nn.Conv2d(self.img_features, self.img_features, (3,3), stride=(1,1), padding=(1,1)),
            nn.SiLU(),
            nn.Conv2d(self.img_features, self.img_features_dim, (1,1), stride=(1,1), bias=False),
            nn.BatchNorm2d(self.img_features_dim),
            AvgPool(),
            nn.Linear(self.img_features_dim, self.hidden_dim),
            nn.ReLU(),
            nn.Linear(hidden_dim, self.n_classes)
        )

        self.location_predictor = nn.Sequential(
            nn.Conv2d(self.img_features, self.img_features, (3,3), stride=(1,1), padding=(1,1)),
            nn.SiLU(),
            nn.Conv2d(self.img_features, self.img_features, (3,3), stride=(1,1), padding=(1,1)),
            nn.SiLU(),
            nn.Conv2d(self.img_features, self.img_features_dim, (1,1), stride=(1,1), bias=False),
            nn.BatchNorm2d(self.img_features_dim),
            AvgPool(),
            nn.Linear(self.img_features_dim, self.hidden_dim),
            nn.ReLU(),
            nn.Linear(hidden_dim, self.location_dim)
        )

    
    def forward(self, x, freeze_conv=False):
        x = self.initial_conv(x)

        if freeze_conv:
            with torch.no_grad():
                x = self.feature_extractor(x)[0]
        else:
            x = self.feature_extractor(x)[0]
            
        class_preds = self.predictors(x)
        location_preds = self.location_predictor(x)
        return class_preds, location_preds

In [7]:

bce = nn.BCEWithLogitsLoss()
def criterion(y_class, y_loc, pred_class, pred_loc, alpha=0.01):
    
    class_loss = bce(pred_class, y_class)
    
    loc_loss = (((pred_loc - y_loc) ** 2).sum(-1).sqrt() * y_class).mean(-1).mean()

    # deviation_loss = ((pred_loc[:, :-1, :] - pred_loc[:, 1:, :]) ** 2).sum(dim=-1).sqrt()
    # deviation_loss = (-1 * deviation_loss).exp().sum(dim=-1).mean()
    
    return (class_loss + alpha * loc_loss), {"class_loss": class_loss, "loc_loss": loc_loss}


def train(model,dataloader, criterion, optimizer, scheduler=None, freeze_conv=False):
    
    model.train()
    optimizer.zero_grad()
    training_loss = []
    
    for idx, (x, y) in enumerate(pbar := tqdm(dataloader)):
        
        x, y_class, y_loc = x.to(DEVICE), y[0].to(DEVICE), y[1].to(DEVICE)
        
        with torch.autocast(device_type="cuda", dtype=torch.bfloat16):
            pred_class, pred_loc = model(x, freeze_conv=freeze_conv)
            pred_loc = pred_loc.reshape(-1,5,2)
            loss, _ = criterion(y_class, y_loc, pred_class, pred_loc)
            loss = loss / GRAD_ACC
            
        loss.backward()
        norm = nn.utils.clip_grad_norm(model.parameters(), 1.0)

        training_loss.append(loss.item() * GRAD_ACC)

        if (idx + 1) % GRAD_ACC == 0:
            optimizer.step()
            optimizer.zero_grad()
            if scheduler is not None:
                scheduler.step()


        pbar.set_description(f"loss: {loss.item() * GRAD_ACC:.6f}, | norm: {norm:.4f}| training_loss: {np.mean(training_loss):.6f}")
        
    
    return np.mean(training_loss)

def validation(model, data_loader, criterion):
    
        model.eval()
    
        val_loss = []
        loc_loss = []
        class_loss = []

        with torch.no_grad():
    
            for idx, (x, y) in enumerate(pbar := tqdm(data_loader)):
                
                x, y_class, y_loc = x.to(DEVICE).squeeze(0).float(), y[0].to(DEVICE).squeeze(0), y[1].to(DEVICE).squeeze(0)

                with torch.autocast(device_type="cuda", dtype=torch.bfloat16):
                    pred_class, pred_loc = model(x)
                    pred_loc = pred_loc.reshape(-1,5,2)
                    loss, per_cat_loss = criterion(y_class, y_loc, pred_class, pred_loc)

                val_loss.append(loss.item())
                loc_loss.append(per_cat_loss["loc_loss"].item())
                class_loss.append(per_cat_loss["class_loss"].item())
                
    
                pbar.set_description(f"current loss: {loss.item():.6f}, validation_loss: {np.mean(val_loss):.6f}, loc_loss: {np.mean(loc_loss)}, class_loss: {np.mean(class_loss)}")

        return np.mean(val_loss), np.mean(loc_loss), np.mean(class_loss)
    


In [8]:
skf = KFold(n_splits=N_FOLDS, shuffle=True, random_state=SEED)

In [9]:



for fold, (trn_idx, val_idx) in enumerate(skf.split(range(len(df)))):
    print('#'*30)
    print(f'start fold{fold}')
    print('#'*30)
    print(len(trn_idx), len(val_idx))
    
    df_train = df.iloc[trn_idx]
    df_valid = df.iloc[val_idx]
    
    train_ds = RSNA24Dataset(df_train["study_id"].unique(), phase='train', transformations=[vertical_flip, horizontal_flip])
    train_dl = DataLoader(
                train_ds,
                batch_size=BATCH_SIZE,
                shuffle=True,
                pin_memory=True,
                drop_last=True,
                num_workers=N_WORKERS
                )

    valid_ds = RSNA24Dataset(df_valid["study_id"].unique(), phase='valid', transformations=[])
    valid_dl = DataLoader(
                valid_ds,
                batch_size=1,
                shuffle=False,
                pin_memory=True,
                drop_last=False,
                num_workers=N_WORKERS
                )
    
    model = RSNA24Model(MODEL_NAME).to(DEVICE)
    optimizer = AdamW(model.parameters(), lr=LR)

    
    warmup_steps = EPOCHS/10 * len(train_dl) // GRAD_ACC
    num_total_steps = EPOCHS * len(train_dl) // GRAD_ACC
    num_cycles = 0.475
    scheduler = get_cosine_schedule_with_warmup(optimizer,
                                                num_warmup_steps=warmup_steps,
                                                num_training_steps=num_total_steps,
                                                num_cycles=num_cycles)

    best_val_loss   = 1.04
    best_loc_loss   = 23.73
    best_class_loss = 0.80
    early_stop_counter = 0

    for epoch in range(1, EPOCHS + 1):
        print(f"EPOCH: {epoch}")
        _ = train(model, train_dl, criterion, optimizer, scheduler, freeze_conv=False)
        val_loss, loc_loss, class_loss = validation(model, valid_dl, criterion)

        print(f"val_loss: {val_loss:.4f} | loc_loss: {loc_loss:.4f} | class_loss: {class_loss:.4f}")

        if loc_loss < best_loc_loss:
            early_stop_counter = 0
            print(f"updating best_loc_loss from {best_loc_loss} to {loc_loss}")
            
            best_val_loss = val_loss
            best_loc_loss = loc_loss
            best_class_loss = class_loss

            print(f"updated losses: {best_val_loss=}, {best_loc_loss=}, {best_class_loss=}")

            print("Saving model....")
            fname = f'{OUTPUT_DIR}/best_loc_model_fold-{fold}.pt'
            torch.save(model.state_dict(), fname)
            
        else:
            early_stop_counter += 1
            print(f"{EARLY_STOPPING_EPOCH - early_stop_counter} more epochs to train until early stopping")

        if early_stop_counter == EARLY_STOPPING_EPOCH:
            break
        

##############################
start fold0
##############################
1579 395


Unexpected keys (bn2.bias, bn2.num_batches_tracked, bn2.running_mean, bn2.running_var, bn2.weight, classifier.bias, classifier.weight, conv_head.weight) found while loading pretrained weights. This may be expected if model is being adapted.


EPOCH: 1


  norm = nn.utils.clip_grad_norm(model.parameters(), 1.0)
loss: 1.387324, | norm: 0.9872| training_loss: 2.145542: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.88it/s]
current loss: 0.353810, validation_loss: 0.355342, loc_loss: 21.4514547046671, class_loss: 0.14082731581196722: 100%|███████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.11it/s]


val_loss: 0.3553 | loc_loss: 21.4515 | class_loss: 0.1408
updating best_loc_loss from 23.73 to 21.4514547046671
updated losses: best_val_loss=0.35534186285863817, best_loc_loss=21.4514547046671, best_class_loss=0.14082731581196722
Saving model....
EPOCH: 2


loss: 0.635445, | norm: 3.0989| training_loss: 1.340469: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.97it/s]
current loss: 0.105650, validation_loss: 0.202759, loc_loss: 9.412917527264975, class_loss: 0.10862943601305679: 100%|██████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.75it/s]


val_loss: 0.2028 | loc_loss: 9.4129 | class_loss: 0.1086
updating best_loc_loss from 21.4514547046671 to 9.412917527264975
updated losses: best_val_loss=0.20275861128570652, best_loc_loss=9.412917527264975, best_class_loss=0.10862943601305679
Saving model....
EPOCH: 3


loss: 0.591357, | norm: 3.2954| training_loss: 0.772919: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.97it/s]
current loss: 0.204330, validation_loss: 0.166247, loc_loss: 5.048943918212257, class_loss: 0.11575759505910342: 100%|██████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.83it/s]


val_loss: 0.1662 | loc_loss: 5.0489 | class_loss: 0.1158
updating best_loc_loss from 9.412917527264975 to 5.048943918212257
updated losses: best_val_loss=0.16624703424122597, best_loc_loss=5.048943918212257, best_class_loss=0.11575759505910342
Saving model....
EPOCH: 4


loss: 0.521424, | norm: 1.9476| training_loss: 0.643112: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.96it/s]
current loss: 0.128305, validation_loss: 0.153775, loc_loss: 5.342581588767091, class_loss: 0.10034916021128214: 100%|██████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.80it/s]


val_loss: 0.1538 | loc_loss: 5.3426 | class_loss: 0.1003
2 more epochs to train until early stopping
EPOCH: 5


loss: 0.845688, | norm: 2.0131| training_loss: 0.595059: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.95it/s]
current loss: 0.122777, validation_loss: 0.177357, loc_loss: 2.564394206923018, class_loss: 0.15171258658556475: 100%|██████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.80it/s]


val_loss: 0.1774 | loc_loss: 2.5644 | class_loss: 0.1517
updating best_loc_loss from 5.048943918212257 to 2.564394206923018
updated losses: best_val_loss=0.1773565286547949, best_loc_loss=2.564394206923018, best_class_loss=0.15171258658556475
Saving model....
EPOCH: 6


loss: 0.320820, | norm: 0.7335| training_loss: 0.556414: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.97it/s]
current loss: 0.116682, validation_loss: 0.133097, loc_loss: 2.452357751670542, class_loss: 0.1085732844816102: 100%|███████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.90it/s]


val_loss: 0.1331 | loc_loss: 2.4524 | class_loss: 0.1086
updating best_loc_loss from 2.564394206923018 to 2.452357751670542
updated losses: best_val_loss=0.1330968619983156, best_loc_loss=2.452357751670542, best_class_loss=0.1085732844816102
Saving model....
EPOCH: 7


loss: 0.478092, | norm: 0.9823| training_loss: 0.517948: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.96it/s]
current loss: 0.118192, validation_loss: 0.136565, loc_loss: 2.869341364225574, class_loss: 0.10787161663431442: 100%|██████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.80it/s]


val_loss: 0.1366 | loc_loss: 2.8693 | class_loss: 0.1079
2 more epochs to train until early stopping
EPOCH: 8


loss: 0.532738, | norm: 0.9167| training_loss: 0.515242: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.95it/s]
current loss: 0.093693, validation_loss: 0.114436, loc_loss: 2.2872040105593996, class_loss: 0.0915641614900358: 100%|██████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 23.04it/s]


val_loss: 0.1144 | loc_loss: 2.2872 | class_loss: 0.0916
updating best_loc_loss from 2.452357751670542 to 2.2872040105593996
updated losses: best_val_loss=0.1144362015956298, best_loc_loss=2.2872040105593996, best_class_loss=0.0915641614900358
Saving model....
EPOCH: 9


loss: 0.366808, | norm: 1.6627| training_loss: 0.504227: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.97it/s]
current loss: 0.058913, validation_loss: 0.117860, loc_loss: 3.283518595992037, class_loss: 0.08502473178621427: 100%|██████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.83it/s]


val_loss: 0.1179 | loc_loss: 3.2835 | class_loss: 0.0850
2 more epochs to train until early stopping
EPOCH: 10


loss: 0.315224, | norm: 1.8625| training_loss: 0.499047: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.98it/s]
current loss: 0.044555, validation_loss: 0.107406, loc_loss: 2.273886434290267, class_loss: 0.08466739243361468: 100%|██████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.83it/s]


val_loss: 0.1074 | loc_loss: 2.2739 | class_loss: 0.0847
updating best_loc_loss from 2.2872040105593996 to 2.273886434290267
updated losses: best_val_loss=0.10740625677651736, best_loc_loss=2.273886434290267, best_class_loss=0.08466739243361468
Saving model....
EPOCH: 11


loss: 0.510382, | norm: 1.5626| training_loss: 0.458336: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.96it/s]
current loss: 0.042918, validation_loss: 0.115060, loc_loss: 2.095956577258987, class_loss: 0.09410079569048214: 100%|██████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.81it/s]


val_loss: 0.1151 | loc_loss: 2.0960 | class_loss: 0.0941
updating best_loc_loss from 2.273886434290267 to 2.095956577258987
updated losses: best_val_loss=0.11506036146307203, best_loc_loss=2.095956577258987, best_class_loss=0.09410079569048214
Saving model....
EPOCH: 12


loss: 0.598295, | norm: 1.7582| training_loss: 0.435402: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.95it/s]
current loss: 0.046234, validation_loss: 0.110409, loc_loss: 2.3258150296907303, class_loss: 0.08715067255792946: 100%|█████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.79it/s]


val_loss: 0.1104 | loc_loss: 2.3258 | class_loss: 0.0872
2 more epochs to train until early stopping
EPOCH: 13


loss: 0.483331, | norm: 1.2603| training_loss: 0.459344: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.96it/s]
current loss: 0.042663, validation_loss: 0.104709, loc_loss: 2.2788772699558653, class_loss: 0.0819197365962784: 100%|██████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.82it/s]


val_loss: 0.1047 | loc_loss: 2.2789 | class_loss: 0.0819
1 more epochs to train until early stopping
EPOCH: 14


loss: 0.453947, | norm: 1.6297| training_loss: 0.473196: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.96it/s]
current loss: 0.034294, validation_loss: 0.106067, loc_loss: 2.1701005231963064, class_loss: 0.08436586995606281: 100%|█████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.79it/s]


val_loss: 0.1061 | loc_loss: 2.1701 | class_loss: 0.0844
0 more epochs to train until early stopping
##############################
start fold1
##############################
1579 395


Unexpected keys (bn2.bias, bn2.num_batches_tracked, bn2.running_mean, bn2.running_var, bn2.weight, classifier.bias, classifier.weight, conv_head.weight) found while loading pretrained weights. This may be expected if model is being adapted.


EPOCH: 1


loss: 1.944486, | norm: 1.6336| training_loss: 2.150617: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.95it/s]
current loss: 0.355796, validation_loss: 0.341588, loc_loss: 22.297437794011977, class_loss: 0.11861378499879396: 100%|█████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.67it/s]


val_loss: 0.3416 | loc_loss: 22.2974 | class_loss: 0.1186
updating best_loc_loss from 23.73 to 22.297437794011977
updated losses: best_val_loss=0.34158816293891375, best_loc_loss=22.297437794011977, best_class_loss=0.11861378499879396
Saving model....
EPOCH: 2


loss: 0.691881, | norm: 1.4545| training_loss: 1.368517: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.97it/s]
current loss: 0.241109, validation_loss: 0.219915, loc_loss: 9.877090135831015, class_loss: 0.12114370719628367: 100%|██████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.87it/s]


val_loss: 0.2199 | loc_loss: 9.8771 | class_loss: 0.1211
updating best_loc_loss from 22.297437794011977 to 9.877090135831015
updated losses: best_val_loss=0.21991460855459383, best_loc_loss=9.877090135831015, best_class_loss=0.12114370719628367
Saving model....
EPOCH: 3


loss: 0.646685, | norm: 2.7839| training_loss: 0.671196: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.98it/s]
current loss: 0.176212, validation_loss: 0.181527, loc_loss: 7.834534646863507, class_loss: 0.10318116116772784: 100%|██████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.83it/s]


val_loss: 0.1815 | loc_loss: 7.8345 | class_loss: 0.1032
updating best_loc_loss from 9.877090135831015 to 7.834534646863507
updated losses: best_val_loss=0.18152650763636288, best_loc_loss=7.834534646863507, best_class_loss=0.10318116116772784
Saving model....
EPOCH: 4


loss: 0.588082, | norm: 1.7677| training_loss: 0.590630: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.98it/s]
current loss: 0.340816, validation_loss: 0.123427, loc_loss: 3.831232129216637, class_loss: 0.08511483431218707: 100%|██████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.82it/s]


val_loss: 0.1234 | loc_loss: 3.8312 | class_loss: 0.0851
updating best_loc_loss from 7.834534646863507 to 3.831232129216637
updated losses: best_val_loss=0.12342715560435345, best_loc_loss=3.831232129216637, best_class_loss=0.08511483431218707
Saving model....
EPOCH: 5


loss: 0.413472, | norm: 0.8413| training_loss: 0.609645: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.95it/s]
current loss: 0.183605, validation_loss: 0.109643, loc_loss: 2.7342797938788888, class_loss: 0.08229991296708677: 100%|█████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.83it/s]


val_loss: 0.1096 | loc_loss: 2.7343 | class_loss: 0.0823
updating best_loc_loss from 3.831232129216637 to 2.7342797938788888
updated losses: best_val_loss=0.10964271090587568, best_loc_loss=2.7342797938788888, best_class_loss=0.08229991296708677
Saving model....
EPOCH: 6


loss: 0.406147, | norm: 1.8902| training_loss: 0.531100: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.98it/s]
current loss: 0.155147, validation_loss: 0.114981, loc_loss: 2.8546319051324853, class_loss: 0.08643479059436757: 100%|█████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.87it/s]


val_loss: 0.1150 | loc_loss: 2.8546 | class_loss: 0.0864
2 more epochs to train until early stopping
EPOCH: 7


loss: 0.758090, | norm: 11.5623| training_loss: 0.529112: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.96it/s]
current loss: 0.162502, validation_loss: 0.112638, loc_loss: 2.7446408942355385, class_loss: 0.0851918568335952: 100%|██████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.89it/s]


val_loss: 0.1126 | loc_loss: 2.7446 | class_loss: 0.0852
1 more epochs to train until early stopping
EPOCH: 8


loss: 0.436277, | norm: 18.7677| training_loss: 0.492680: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.95it/s]
current loss: 0.145143, validation_loss: 0.108474, loc_loss: 2.4781810811023273, class_loss: 0.08369224743919924: 100%|█████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.72it/s]


val_loss: 0.1085 | loc_loss: 2.4782 | class_loss: 0.0837
updating best_loc_loss from 2.7342797938788888 to 2.4781810811023273
updated losses: best_val_loss=0.10847405825022252, best_loc_loss=2.4781810811023273, best_class_loss=0.08369224743919924
Saving model....
EPOCH: 9


loss: 0.510440, | norm: 1.4326| training_loss: 0.487366: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.96it/s]
current loss: 0.180905, validation_loss: 0.119986, loc_loss: 2.3334471069020792, class_loss: 0.0966511379586337: 100%|██████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.84it/s]


val_loss: 0.1200 | loc_loss: 2.3334 | class_loss: 0.0967
updating best_loc_loss from 2.4781810811023273 to 2.3334471069020792
updated losses: best_val_loss=0.11998560902765448, best_loc_loss=2.3334471069020792, best_class_loss=0.0966511379586337
Saving model....
EPOCH: 10


loss: 0.262648, | norm: 1.3993| training_loss: 0.478989: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  6.02it/s]
current loss: 0.229063, validation_loss: 0.121763, loc_loss: 2.5372246691179297, class_loss: 0.09639066893861757: 100%|█████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:16<00:00, 23.47it/s]


val_loss: 0.1218 | loc_loss: 2.5372 | class_loss: 0.0964
2 more epochs to train until early stopping
EPOCH: 11


loss: 0.413658, | norm: 0.9801| training_loss: 0.447556: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  6.03it/s]
current loss: 0.198070, validation_loss: 0.105824, loc_loss: 2.257636429255242, class_loss: 0.08324781994258745: 100%|██████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:16<00:00, 23.46it/s]


val_loss: 0.1058 | loc_loss: 2.2576 | class_loss: 0.0832
updating best_loc_loss from 2.3334471069020792 to 2.257636429255242
updated losses: best_val_loss=0.10582418423513988, best_loc_loss=2.257636429255242, best_class_loss=0.08324781994258745
Saving model....
EPOCH: 12


loss: 0.431733, | norm: 0.7106| training_loss: 0.449761: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  6.02it/s]
current loss: 0.278036, validation_loss: 0.119473, loc_loss: 2.2000340228236985, class_loss: 0.09747249733098795: 100%|█████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:16<00:00, 23.43it/s]


val_loss: 0.1195 | loc_loss: 2.2000 | class_loss: 0.0975
updating best_loc_loss from 2.257636429255242 to 2.2000340228236985
updated losses: best_val_loss=0.11947283755922493, best_loc_loss=2.2000340228236985, best_class_loss=0.09747249733098795
Saving model....
EPOCH: 13


loss: 0.721791, | norm: 6.8528| training_loss: 0.462586: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  6.02it/s]
current loss: 0.231584, validation_loss: 0.110060, loc_loss: 2.276949420268124, class_loss: 0.08729096845637208: 100%|██████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:16<00:00, 23.46it/s]


val_loss: 0.1101 | loc_loss: 2.2769 | class_loss: 0.0873
2 more epochs to train until early stopping
EPOCH: 14


loss: 0.760068, | norm: 2.2941| training_loss: 0.421293: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.97it/s]
current loss: 0.240540, validation_loss: 0.111460, loc_loss: 2.1282476730248274, class_loss: 0.09017778744723498: 100%|█████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.75it/s]


val_loss: 0.1115 | loc_loss: 2.1282 | class_loss: 0.0902
updating best_loc_loss from 2.2000340228236985 to 2.1282476730248274
updated losses: best_val_loss=0.11146026417748325, best_loc_loss=2.1282476730248274, best_class_loss=0.09017778744723498
Saving model....
EPOCH: 15


loss: 0.564474, | norm: 3.1651| training_loss: 0.435414: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 98/98 [00:16<00:00,  5.96it/s]
current loss: 0.282130, validation_loss: 0.115324, loc_loss: 2.1901327224135954, class_loss: 0.09342236881265933: 100%|█████████████████████████████████████████████████████████████████████████████████████| 395/395 [00:17<00:00, 22.73it/s]


val_loss: 0.1153 | loc_loss: 2.1901 | class_loss: 0.0934
2 more epochs to train until early stopping
##############################
start fold2
##############################
1579 395


Unexpected keys (bn2.bias, bn2.num_batches_tracked, bn2.running_mean, bn2.running_var, bn2.weight, classifier.bias, classifier.weight, conv_head.weight) found while loading pretrained weights. This may be expected if model is being adapted.


EPOCH: 1


loss: 2.316605, | norm: 0.5060| training_loss: 2.299715:  12%|█████████████████▋                                                                                                                              | 12/98 [00:02<00:16,  5.28it/s]


KeyboardInterrupt: 