In [1]:
import numpy as np
import torch
import matplotlib.pyplot as plt
import model_lite as eq_model

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
import numpy as np
import torch.nn as nn
import torch
from torchvision import datasets, models, transforms

from tqdm.auto import tqdm
import matplotlib.pyplot as plt
import numpy as np
from torchvision.utils import make_grid
from torch.utils.data import DataLoader
import matplotlib.pyplot as plt
from sklearn.metrics import accuracy_score
from sklearn.metrics import roc_curve
from sklearn import metrics
import gc

import torch
import torch.nn as nn

from einops import rearrange
from einops.layers.torch import Rearrange


    
def metric(y_true, y_pred):
    fpr, tpr, thresholds = roc_curve(y_true, y_pred)
    auc = metrics.auc(fpr, tpr)
    return auc

def straightner(a):
    A = np.zeros((a[0].shape[0]*len(a)))
    start_index = 0
    end_index = 0
    for i in range(len(a)):
        start_index = i*a[0].shape[0]
        end_index = start_index+a[0].shape[0]
        A[start_index:end_index] = a[i]
    return A

def predictor(outputs):
    return np.argmax(outputs, axis = 1)

def trainer():
    model = eq_model.model(channels=3,N=8, group = "cyclic")
    
    train_transform = transforms.Compose([transforms.ToTensor()])
    test_transform = transforms.Compose([transforms.ToTensor()])
    
    
    dataset_Train = datasets.ImageFolder('./Data/Train/', transform=train_transform)
    dataset_Test = datasets.ImageFolder('./Data/Test/', transform =test_transform)
    dataloader_train = torch.utils.data.DataLoader(dataset_Train, batch_size=64, shuffle=True, drop_last = True, num_workers=4, pin_memory = True)
    dataloader_test = torch.utils.data.DataLoader(dataset_Test, batch_size=64, shuffle=True, drop_last = True, num_workers=4, pin_memory = True)    
    
    
    optimizer = torch.optim.Adam(model.parameters(), lr = 0.001)
    criterion = nn.BCEWithLogitsLoss()
    scheduler = torch.optim.lr_scheduler.ReduceLROnPlateau(optimizer, 'max', verbose = True,threshold = 0.0001,patience = 3, factor = 0.5)
    
    model = model.to("cuda:1")
    


    import wandb
    wandb.login(key="cb53927c12bd57a0d943d2dedf7881cfcdcc8f09")
    wandb.init(
        project = "Equivariant",
        name = "C8_lite"
    )

    scaler = torch.cuda.amp.GradScaler()
    #--------------------------
    wandb.watch(model, log_freq=50)
    #---------------------------
    w_intr = 50

    for epoch in range(20):
        train_loss = 0
        val_loss = 0
        train_steps = 0
        test_steps = 0
        label_list = []
        outputs_list = []
        train_auc = 0
        test_auc = 0
        model.train()
        for image, label in tqdm(dataloader_train):
            image = image.to("cuda:1")
            label = label.to("cuda:1")
            with torch.no_grad():
                image = nn.functional.pad(image, (2,1,2,1))
            #optimizer.zero_grad()
            for param in model.parameters():
                param.grad = None

            with torch.cuda.amp.autocast():
              outputs = model(image)
              loss = criterion(outputs, label.float())
            label_list.append(label.detach().cpu().numpy())
            outputs_list.append(outputs.detach().cpu().numpy())
            scaler.scale(loss).backward()
            scaler.step(optimizer)
            scaler.update()
            train_loss += loss.item()
            train_steps += 1
            if train_steps%w_intr == 0:
                 wandb.log({"loss": loss.item()})
        with torch.no_grad():
            label_list = straightner(label_list)
            outputs_list = straightner(outputs_list)
            train_auc = metric(label_list, outputs_list) 




        #-------------------------------------------------------------------
        model.eval()
        label_list = []
        outputs_list = []
        with torch.no_grad():
            for image, label in tqdm(dataloader_test):
                image = image.to("cuda:1")
                label = label.to("cuda:1")
                image = nn.functional.pad(image, (2,1,2,1))
                outputs = model(image)
                loss = criterion(outputs, label.float())
                label_list.append(label.detach().cpu().numpy())
                outputs_list.append(outputs.detach().cpu().numpy())
                val_loss += loss.item()
                test_steps +=1
                if test_steps%w_intr == 0:
                 wandb.log({"val_loss": loss.item()})
            label_list = straightner(label_list)
            outputs_list = straightner(outputs_list)
            test_auc = metric(label_list, outputs_list)

        train_loss = train_loss/train_steps
        val_loss = val_loss/ test_steps
        
        print("----------------------------------------------------")
        print("Epoch No" , epoch)
        print("The Training loss of the epoch, ",train_loss)
        print("The Training AUC of the epoch,  %.5f"%train_auc)
        print("The validation loss of the epoch, ",val_loss)
        print("The validation AUC of the epoch, %.5f"%test_auc)
        print("----------------------------------------------------")
        PATH = f"model_Epoch_{epoch}.pt"
#         torch.save({
#                 'epoch': epoch,
#                 'model_state_dict': model.state_dict(),
#                 'optimizer_state_dict': optimizer.state_dict(),
#                 'scheduler': scheduler.state_dict()
#                 }, PATH)
        scheduler.step(test_auc)
        curr_lr = scheduler._last_lr[0]
        wandb.log({"Train_auc_epoch": train_auc,
                  "Epoch": epoch,
                  "Val_auc_epoch": test_auc,
                  "Train_loss_epoch": train_loss,
                  "Val_loss_epoch": val_loss,
                  "Lr": curr_lr}
                 )
        gc.collect()
    
    wandb.finish()


In [3]:
trainer()

  full_mask[mask] = norms.to(torch.uint8)
[34m[1mwandb[0m: Currently logged in as: [33mdc250601[0m. Use [1m`wandb login --relogin`[0m to force relogin
[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /home/diptarko/.netrc


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1740/1740 [05:30<00:00,  5.27it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 435/435 [00:23<00:00, 18.85it/s]


----------------------------------------------------
Epoch No 0
The Training loss of the epoch,  0.574597485243589
The Training AUC of the epoch,  0.77124
The validation loss of the epoch,  0.6079063375790914
The validation AUC of the epoch, 0.77798
----------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1740/1740 [05:34<00:00,  5.20it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 435/435 [00:23<00:00, 18.25it/s]


----------------------------------------------------
Epoch No 1
The Training loss of the epoch,  0.5608040063888177
The Training AUC of the epoch,  0.78475
The validation loss of the epoch,  0.5697790914568408
The validation AUC of the epoch, 0.78267
----------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1740/1740 [06:00<00:00,  4.83it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 435/435 [00:23<00:00, 18.67it/s]


----------------------------------------------------
Epoch No 2
The Training loss of the epoch,  0.5558070185026903
The Training AUC of the epoch,  0.78973
The validation loss of the epoch,  0.5615996046312924
The validation AUC of the epoch, 0.79065
----------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1740/1740 [06:10<00:00,  4.69it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 435/435 [00:23<00:00, 18.67it/s]


----------------------------------------------------
Epoch No 3
The Training loss of the epoch,  0.5517388461821381
The Training AUC of the epoch,  0.79351
The validation loss of the epoch,  0.5534215516057508
The validation AUC of the epoch, 0.79338
----------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1740/1740 [05:32<00:00,  5.24it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 435/435 [00:23<00:00, 18.72it/s]


----------------------------------------------------
Epoch No 4
The Training loss of the epoch,  0.5480377817462231
The Training AUC of the epoch,  0.79692
The validation loss of the epoch,  0.5572427139200014
The validation AUC of the epoch, 0.79129
----------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1740/1740 [05:28<00:00,  5.30it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 435/435 [00:23<00:00, 18.74it/s]


----------------------------------------------------
Epoch No 5
The Training loss of the epoch,  0.5449528686445335
The Training AUC of the epoch,  0.79984
The validation loss of the epoch,  0.5553168248171094
The validation AUC of the epoch, 0.79194
----------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1740/1740 [05:27<00:00,  5.31it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 435/435 [00:23<00:00, 18.72it/s]


----------------------------------------------------
Epoch No 6
The Training loss of the epoch,  0.5416725000944631
The Training AUC of the epoch,  0.80269
The validation loss of the epoch,  0.5549091447358844
The validation AUC of the epoch, 0.79243
----------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1740/1740 [05:36<00:00,  5.17it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 435/435 [00:23<00:00, 18.63it/s]


----------------------------------------------------
Epoch No 7
The Training loss of the epoch,  0.5367602587431327
The Training AUC of the epoch,  0.80717
The validation loss of the epoch,  0.5694132658941993
The validation AUC of the epoch, 0.78947
----------------------------------------------------
Epoch 00008: reducing learning rate of group 0 to 5.0000e-04.


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1740/1740 [05:32<00:00,  5.23it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 435/435 [00:23<00:00, 18.63it/s]


----------------------------------------------------
Epoch No 8
The Training loss of the epoch,  0.5212322801522825
The Training AUC of the epoch,  0.82029
The validation loss of the epoch,  0.5557578142347007
The validation AUC of the epoch, 0.79265
----------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1740/1740 [05:27<00:00,  5.31it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 435/435 [00:23<00:00, 18.75it/s]


----------------------------------------------------
Epoch No 9
The Training loss of the epoch,  0.5075365569570969
The Training AUC of the epoch,  0.83117
The validation loss of the epoch,  0.5612331467798386
The validation AUC of the epoch, 0.79046
----------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1740/1740 [05:28<00:00,  5.30it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 435/435 [00:23<00:00, 18.79it/s]


----------------------------------------------------
Epoch No 10
The Training loss of the epoch,  0.4919046182913342
The Training AUC of the epoch,  0.84287
The validation loss of the epoch,  0.5815542217643782
The validation AUC of the epoch, 0.78041
----------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1740/1740 [05:24<00:00,  5.35it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 435/435 [00:23<00:00, 18.77it/s]


----------------------------------------------------
Epoch No 11
The Training loss of the epoch,  0.4706075056359686
The Training AUC of the epoch,  0.85792
The validation loss of the epoch,  0.620543313643028
The validation AUC of the epoch, 0.77419
----------------------------------------------------
Epoch 00012: reducing learning rate of group 0 to 2.5000e-04.


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1740/1740 [05:23<00:00,  5.38it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 435/435 [00:23<00:00, 18.69it/s]


----------------------------------------------------
Epoch No 12
The Training loss of the epoch,  0.4198787061219243
The Training AUC of the epoch,  0.88924
The validation loss of the epoch,  0.6524970308117483
The validation AUC of the epoch, 0.75609
----------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1740/1740 [05:29<00:00,  5.28it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 435/435 [00:23<00:00, 18.72it/s]


----------------------------------------------------
Epoch No 13
The Training loss of the epoch,  0.3840777038928421
The Training AUC of the epoch,  0.90835
The validation loss of the epoch,  0.7069487521703216
The validation AUC of the epoch, 0.74679
----------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1740/1740 [05:33<00:00,  5.22it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 435/435 [00:23<00:00, 18.67it/s]


----------------------------------------------------
Epoch No 14
The Training loss of the epoch,  0.3497298115628889
The Training AUC of the epoch,  0.92459
The validation loss of the epoch,  0.7830076306715779
The validation AUC of the epoch, 0.73928
----------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1740/1740 [05:32<00:00,  5.24it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 435/435 [00:23<00:00, 18.78it/s]


----------------------------------------------------
Epoch No 15
The Training loss of the epoch,  0.31170043821136156
The Training AUC of the epoch,  0.94039
The validation loss of the epoch,  0.8142693829262394
The validation AUC of the epoch, 0.72229
----------------------------------------------------
Epoch 00016: reducing learning rate of group 0 to 1.2500e-04.


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1740/1740 [05:35<00:00,  5.19it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 435/435 [00:23<00:00, 18.50it/s]


----------------------------------------------------
Epoch No 16
The Training loss of the epoch,  0.24512716721871802
The Training AUC of the epoch,  0.96356
The validation loss of the epoch,  1.0272450915013236
The validation AUC of the epoch, 0.72474
----------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1740/1740 [05:35<00:00,  5.19it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 435/435 [00:23<00:00, 18.74it/s]


----------------------------------------------------
Epoch No 17
The Training loss of the epoch,  0.2117018027980437
The Training AUC of the epoch,  0.97262
The validation loss of the epoch,  1.1095666838788438
The validation AUC of the epoch, 0.71210
----------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1740/1740 [05:32<00:00,  5.23it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 435/435 [00:23<00:00, 18.64it/s]


----------------------------------------------------
Epoch No 18
The Training loss of the epoch,  0.18144881202271956
The Training AUC of the epoch,  0.97983
The validation loss of the epoch,  1.3150215026976049
The validation AUC of the epoch, 0.71122
----------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1740/1740 [05:34<00:00,  5.20it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 435/435 [00:23<00:00, 18.69it/s]


----------------------------------------------------
Epoch No 19
The Training loss of the epoch,  0.15452249626703987
The Training AUC of the epoch,  0.98532
The validation loss of the epoch,  1.4291720979515163
The validation AUC of the epoch, 0.71050
----------------------------------------------------
Epoch 00020: reducing learning rate of group 0 to 6.2500e-05.


0,1
Epoch,▁▁▂▂▂▃▃▄▄▄▅▅▅▆▆▇▇▇██
Lr,███████▄▄▄▄▂▂▂▂▁▁▁▁▁
Train_auc_epoch,▁▁▂▂▂▂▂▂▃▃▃▄▅▅▆▇▇███
Train_loss_epoch,██████▇▇▇▇▇▆▅▅▄▄▃▂▁▁
Val_auc_epoch,▇▇████████▇▆▅▄▃▂▂▁▁▁
Val_loss_epoch,▁▁▁▁▁▁▁▁▁▁▁▂▂▂▃▃▅▅▇█
loss,█▆█▇▆██▆▇█▆▇▇▇▇▇▇▇▇▇▅█▅▅▆▅▄▇▆▆▃▃▃▄▃▂▃▂▂▁
val_loss,▂▁▁▁▁▁▁▁▂▁▁▁▂▂▁▂▂▂▁▁▂▂▁▁▂▃▂▂▃▁▃▂▅▆▂█▅▅▆▆

0,1
Epoch,19.0
Lr,6e-05
Train_auc_epoch,0.98532
Train_loss_epoch,0.15452
Val_auc_epoch,0.7105
Val_loss_epoch,1.42917
loss,0.06503
val_loss,1.42088
