In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

import time
import random # for torch seed
import os # for torch seed

from sklearn.model_selection import train_test_split

import torch
from torch import nn
from torch.utils.data import Dataset, DataLoader
from torch.optim import Adam, AdamW, RMSprop # optmizers
from torch.optim.lr_scheduler import CosineAnnealingLR, ReduceLROnPlateau # Learning rate schedulers

import albumentations as A
# from albumentations.pytorch import ToTensorV2

import timm
from timm.data.transforms_factory import create_transform 
from timm.data import create_dataset


In [2]:
import argparse
from pathlib import Path

import timm
import timm.data
import timm.loss
import timm.optim
import timm.utils
import torch
import torchmetrics
from timm.scheduler import CosineLRScheduler

from pytorch_accelerated.callbacks import SaveBestModelCallback
from pytorch_accelerated.trainer import Trainer, DEFAULT_CALLBACKS

In [3]:
class CFG:
  DEBUG = False # True False

  ### input: not configurable
  #IMG_HEIGHT = 224
  #IMG_WIDTH = 224
  #N_CLASS = 2


  random_seed = 42

In [4]:
# detect and define device 
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

print(device)

cuda


In [5]:
# for reproducibility
def seed_torch(seed):
    random.seed(seed)
    os.environ['PYTHONHASHSEED'] = str(seed)
    np.random.seed(seed)
    torch.manual_seed(seed)
    torch.cuda.manual_seed(seed)
    torch.backends.cudnn.deterministic = True

seed_torch(seed = CFG.random_seed)

In [6]:
losses=[]

In [7]:
def create_datasets(image_size, data_mean, data_std, train_path, val_path):
    train_transforms = timm.data.create_transform(
        input_size=image_size,
        is_training=True,
        mean=data_mean,
        std=data_std,
        auto_augment="rand-m3-mstd0.5-inc1",
    )

    eval_transforms = timm.data.create_transform(
        input_size=image_size, mean=data_mean, std=data_std
    )

    train_dataset = timm.data.dataset.ImageDataset(
        train_path, transform=train_transforms
    )
    eval_dataset = timm.data.dataset.ImageDataset(val_path, transform=eval_transforms)

    return train_dataset, eval_dataset


class TimmMixupTrainer(Trainer):
    def __init__(self, eval_loss_fn, mixup_args, num_classes, *args, **kwargs):
        super().__init__(*args, **kwargs)
        self.eval_loss_fn = eval_loss_fn
        self.num_updates = None
        self.mixup_fn = timm.data.Mixup(**mixup_args)

        self.accuracy = torchmetrics.Accuracy(num_classes=num_classes,task="binary")
        self.ema_accuracy = torchmetrics.Accuracy(num_classes=num_classes,task="binary")
        self.ema_model = None

    def create_scheduler(self):
        return timm.scheduler.CosineLRScheduler(
            self.optimizer,
            t_initial=self.run_config.num_epochs,
            cycle_decay=0.5,
            lr_min=1e-6,
            t_in_epochs=True,
            warmup_t=3,
            warmup_lr_init=1e-4,
            cycle_limit=1,
        )

    def training_run_start(self):
        # Model EMA requires the model without a DDP wrapper and before sync batchnorm conversion
        self.ema_model = timm.utils.ModelEmaV2(
            self._accelerator.unwrap_model(self.model), decay=0.9
        )
        if self.run_config.is_distributed:
            self.model = torch.nn.SyncBatchNorm.convert_sync_batchnorm(self.model)

    def train_epoch_start(self):
        super().train_epoch_start()
        self.num_updates = self.run_history.current_epoch * len(self._train_dataloader)

    def calculate_train_batch_loss(self, batch):
        xb, yb = batch
        mixup_xb, mixup_yb = self.mixup_fn(xb, yb)
        return super().calculate_train_batch_loss((mixup_xb, mixup_yb))

    def train_epoch_end(
        self,
    ):
        self.ema_model.update(self.model)
        self.ema_model.eval()

        if hasattr(self.optimizer, "sync_lookahead"):
            self.optimizer.sync_lookahead()

    def scheduler_step(self):
        self.num_updates += 1
        if self.scheduler is not None:
            self.scheduler.step_update(num_updates=self.num_updates)

    def calculate_eval_batch_loss(self, batch):
        with torch.no_grad():
            xb, yb = batch
            outputs = self.model(xb)
            val_loss = self.eval_loss_fn(outputs, yb)
            self.accuracy.update(outputs.argmax(-1), yb)
            losses.append(val_loss.cpu().numpy())
            #print(val_loss.cpu().numpy())
            
            ema_model_preds = self.ema_model.module(xb).argmax(-1)
            self.ema_accuracy.update(ema_model_preds, yb)

        return {"loss": val_loss, "model_outputs": outputs, "batch_size": xb.size(0)}

    def eval_epoch_end(self):
        super().eval_epoch_end()

        if self.scheduler is not None:
            self.scheduler.step(self.run_history.current_epoch + 1)

        self.run_history.update_metric("accuracy", self.accuracy.compute().cpu())
        self.run_history.update_metric(
            "ema_model_accuracy", self.ema_accuracy.compute().cpu()
        )
        self.accuracy.reset()
        self.ema_accuracy.reset()


def main(data_path):

    # Set training arguments, hardcoded here for clarity
    image_size = (224, 224)
    lr = 0.1
    smoothing = 0.1
    mixup = 0.1
    cutmix = 0.1
    prob=0
    batch_size = 8
    bce_target_thresh = 0.2
    num_epochs = 30

    data_path = Path(data_path)
    train_path = data_path / "train"
    val_path = data_path / "val"
    num_classes = len(list(train_path.iterdir()))

    mixup_args = dict(
        mixup_alpha=mixup,
        cutmix_alpha=cutmix,
        label_smoothing=smoothing,
        num_classes=num_classes,
        prob=0
    )

    # Create model using timm
    model = timm.create_model(
        "resnext101_32x8d.fb_swsl_ig1b_ft_in1k", pretrained=True, num_classes=num_classes, drop_path_rate=0.05,scriptable=True
    )

    # Load data config associated with the model to use in data augmentation pipeline
    data_config = timm.data.resolve_data_config({}, model=model, verbose=True)
    data_mean = data_config["mean"]
    data_std = data_config["std"]

    # Create training and validation datasets
    train_dataset, eval_dataset = create_datasets(
        train_path=train_path,
        val_path=val_path,
        image_size=image_size,
        data_mean=data_mean,
        data_std=data_std,
    )

    # Create optimizer
    optimizer = timm.optim.create_optimizer_v2(
        model, opt="lookahead_AdamW", lr=lr, weight_decay=0.01
    )

    # As we are using Mixup, we can use BCE during training and CE for evaluation
    train_loss_fn = timm.loss.BinaryCrossEntropy(
        target_threshold=bce_target_thresh, smoothing=smoothing
    )
    validate_loss_fn = timm.loss.BinaryCrossEntropy(
        target_threshold=bce_target_thresh, smoothing=smoothing
    )
    # Create trainer and start training
    trainer = TimmMixupTrainer(
        model=model,
        optimizer=optimizer,
        loss_func=train_loss_fn,
        eval_loss_fn=validate_loss_fn,
        mixup_args=mixup_args,
        num_classes=num_classes,
        callbacks=[
            *DEFAULT_CALLBACKS,
            SaveBestModelCallback(watch_metric="accuracy", greater_is_better=True),
        ],
    )

    trainer.train(
        per_device_batch_size=batch_size,
        train_dataset=train_dataset,
        eval_dataset=eval_dataset,
        num_epochs=num_epochs,
        create_scheduler_fn=trainer.create_scheduler,
    )
    model.eval()
    smodel=torch.jit.script(model)
    smodel.save("GI_Classifier2.pt")


In [8]:
main(r"C:\Users\ritvi\AWCEBC\data\classification")

Downloading model.safetensors:   0%|          | 0.00/356M [00:00<?, ?B/s]


Starting training run

Starting epoch 1


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:56<00:00,  3.12it/s]



train_loss_epoch: 0.44071677327156067


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:15<00:00,  4.02it/s]



eval_loss_epoch: 0.16060516238212585

accuracy: 0.9262295365333557

ema_model_accuracy: 0.5266393423080444

Starting epoch 2


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:53<00:00,  3.17it/s]



train_loss_epoch: 0.730019211769104


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:15<00:00,  3.83it/s]



eval_loss_epoch: 0.6710751056671143

accuracy: 0.5799180269241333

ema_model_accuracy: 0.49180328845977783

Starting epoch 3


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:54<00:00,  3.15it/s]



train_loss_epoch: 0.6926401853561401


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:15<00:00,  3.84it/s]



eval_loss_epoch: 0.6935425996780396

accuracy: 0.49180328845977783

ema_model_accuracy: 0.49180328845977783

Starting epoch 4


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:54<00:00,  3.16it/s]



train_loss_epoch: 0.6755160093307495


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:15<00:00,  3.85it/s]



eval_loss_epoch: 0.5840345621109009

accuracy: 0.7581967115402222

ema_model_accuracy: 0.49180328845977783

Starting epoch 5


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:54<00:00,  3.16it/s]



train_loss_epoch: 0.6409122347831726


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:17<00:00,  3.54it/s]



eval_loss_epoch: 0.6134874820709229

accuracy: 0.6372950673103333

ema_model_accuracy: 0.49180328845977783

Starting epoch 6


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:54<00:00,  3.15it/s]



train_loss_epoch: 0.6689632534980774


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:16<00:00,  3.78it/s]



eval_loss_epoch: 0.7444537878036499

accuracy: 0.49180328845977783

ema_model_accuracy: 0.49180328845977783

Starting epoch 7


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:55<00:00,  3.14it/s]



train_loss_epoch: 0.6520615816116333


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:16<00:00,  3.72it/s]



eval_loss_epoch: 0.6292809247970581

accuracy: 0.6577869057655334

ema_model_accuracy: 0.5081967115402222

Starting epoch 8


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:56<00:00,  3.13it/s]



train_loss_epoch: 0.6423094272613525


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:15<00:00,  3.96it/s]



eval_loss_epoch: 0.637430727481842

accuracy: 0.6393442749977112

ema_model_accuracy: 0.5081967115402222

Starting epoch 9


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:52<00:00,  3.18it/s]



train_loss_epoch: 0.6328200697898865


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:17<00:00,  3.53it/s]



eval_loss_epoch: 0.5543548464775085

accuracy: 0.7377049326896667

ema_model_accuracy: 0.5081967115402222

Starting epoch 10


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:56<00:00,  3.12it/s]



train_loss_epoch: 0.6362481713294983


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:15<00:00,  3.82it/s]



eval_loss_epoch: 0.6034665703773499

accuracy: 0.7295082211494446

ema_model_accuracy: 0.5081967115402222

Starting epoch 11


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:52<00:00,  3.19it/s]



train_loss_epoch: 0.6571624279022217


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:16<00:00,  3.77it/s]



eval_loss_epoch: 0.5722270011901855

accuracy: 0.7356557250022888

ema_model_accuracy: 0.5081967115402222

Starting epoch 12


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:51<00:00,  3.19it/s]



train_loss_epoch: 0.6247556209564209


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:16<00:00,  3.71it/s]



eval_loss_epoch: 0.558828592300415

accuracy: 0.7479507923126221

ema_model_accuracy: 0.5081967115402222

Starting epoch 13


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:51<00:00,  3.19it/s]



train_loss_epoch: 0.6224226355552673


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:16<00:00,  3.72it/s]



eval_loss_epoch: 0.5361688137054443

accuracy: 0.7274590134620667

ema_model_accuracy: 0.5081967115402222

Starting epoch 14


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:51<00:00,  3.19it/s]



train_loss_epoch: 0.6224064826965332


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:16<00:00,  3.75it/s]



eval_loss_epoch: 0.6109155416488647

accuracy: 0.6598360538482666

ema_model_accuracy: 0.5081967115402222

Starting epoch 15


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:51<00:00,  3.20it/s]



train_loss_epoch: 0.625328779220581


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:16<00:00,  3.80it/s]



eval_loss_epoch: 0.5510848164558411

accuracy: 0.7520492076873779

ema_model_accuracy: 0.5081967115402222

Starting epoch 16


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:51<00:00,  3.20it/s]



train_loss_epoch: 0.6238117814064026


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:15<00:00,  3.82it/s]



eval_loss_epoch: 0.5372461080551147

accuracy: 0.7377049326896667

ema_model_accuracy: 0.5081967115402222

Starting epoch 17


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:53<00:00,  3.17it/s]



train_loss_epoch: 0.6123557090759277


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:15<00:00,  3.84it/s]



eval_loss_epoch: 0.5767430663108826

accuracy: 0.7315573692321777

ema_model_accuracy: 0.5081967115402222

Starting epoch 18


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:51<00:00,  3.20it/s]



train_loss_epoch: 0.6113397479057312


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:16<00:00,  3.72it/s]



eval_loss_epoch: 0.5436181426048279

accuracy: 0.743852436542511

ema_model_accuracy: 0.5081967115402222

Starting epoch 19


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:51<00:00,  3.20it/s]



train_loss_epoch: 0.6089586019515991


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:15<00:00,  3.83it/s]



eval_loss_epoch: 0.497656911611557

accuracy: 0.7745901346206665

ema_model_accuracy: 0.5081967115402222

Starting epoch 20


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:51<00:00,  3.20it/s]



train_loss_epoch: 0.5998456478118896


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:16<00:00,  3.79it/s]



eval_loss_epoch: 0.6710155010223389

accuracy: 0.6229507923126221

ema_model_accuracy: 0.5081967115402222

Starting epoch 21


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:51<00:00,  3.19it/s]



train_loss_epoch: 0.5823428630828857


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:16<00:00,  3.75it/s]



eval_loss_epoch: 0.44803258776664734

accuracy: 0.8299180269241333

ema_model_accuracy: 0.5081967115402222

Starting epoch 22


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:51<00:00,  3.20it/s]



train_loss_epoch: 0.5584056377410889


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:16<00:00,  3.75it/s]



eval_loss_epoch: 0.4320775270462036

accuracy: 0.8299180269241333

ema_model_accuracy: 0.5081967115402222

Starting epoch 23


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:51<00:00,  3.20it/s]



train_loss_epoch: 0.5453824996948242


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:16<00:00,  3.74it/s]



eval_loss_epoch: 0.420859694480896

accuracy: 0.8340163826942444

ema_model_accuracy: 0.5081967115402222

Starting epoch 24


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:51<00:00,  3.20it/s]



train_loss_epoch: 0.5303586721420288


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:17<00:00,  3.43it/s]



eval_loss_epoch: 0.38633063435554504

accuracy: 0.8463114500045776

ema_model_accuracy: 0.5081967115402222

Starting epoch 25


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:51<00:00,  3.20it/s]



train_loss_epoch: 0.5153558850288391


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:15<00:00,  3.82it/s]



eval_loss_epoch: 0.42878904938697815

accuracy: 0.8176229596138

ema_model_accuracy: 0.5081967115402222

Starting epoch 26


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:50<00:00,  3.20it/s]



train_loss_epoch: 0.5055222511291504


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:15<00:00,  3.84it/s]



eval_loss_epoch: 0.36913058161735535

accuracy: 0.8647540807723999

ema_model_accuracy: 0.5081967115402222

Starting epoch 27


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:51<00:00,  3.20it/s]



train_loss_epoch: 0.4971264898777008


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:16<00:00,  3.69it/s]



eval_loss_epoch: 0.3704712390899658

accuracy: 0.8586065769195557

ema_model_accuracy: 0.5081967115402222

Starting epoch 28


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:51<00:00,  3.20it/s]



train_loss_epoch: 0.5037083029747009


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:15<00:00,  3.86it/s]



eval_loss_epoch: 0.36493849754333496

accuracy: 0.8647540807723999

ema_model_accuracy: 0.5081967115402222

Starting epoch 29


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:51<00:00,  3.20it/s]



train_loss_epoch: 0.5038933157920837


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:18<00:00,  3.26it/s]



eval_loss_epoch: 0.35796988010406494

accuracy: 0.8586065769195557

ema_model_accuracy: 0.5081967115402222

Starting epoch 30


100%|████████████████████████████████████████████████████████████████████████████████| 740/740 [03:51<00:00,  3.20it/s]



train_loss_epoch: 0.5039025545120239


100%|██████████████████████████████████████████████████████████████████████████████████| 61/61 [00:15<00:00,  3.83it/s]



eval_loss_epoch: 0.36204928159713745

accuracy: 0.8586065769195557

ema_model_accuracy: 0.5081967115402222
Finishing training run
Loading checkpoint with accuracy: 0.9262295365333557 from epoch 1
