In [1]:
import torch
from torch.utils.data import Dataset, DataLoader
import numpy as np
from PIL import Image
import os
from torchvision import transforms
import pandas as pd
import matplotlib.pyplot as plt
import torch.optim as optim
from tqdm import tqdm
import random

from dataset import Thyroid_Dataset
from model import Eff_Unet
from loss_metric import DiceLoss, IOU_score



In [2]:
def set_seed(seed):
    random.seed(seed)
    np.random.seed(seed)
    os.environ['PYTHONHASHSEED'] = str(seed)
    torch.manual_seed(seed)
    torch.cuda.manual_seed(seed)
    torch.cuda.manual_seed_all(seed)
    torch.backends.cudnn.deterministic = True
    torch.backends.cudnn.benchmark = False

set_seed(42)

In [3]:
import wandb
wandb.login()

wandb: ERROR Failed to detect the name of this notebook. You can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.
wandb: Currently logged in as: s960068sss (s960068sss-ucl) to https://api.wandb.ai. Use `wandb login --relogin` to force relogin


True

In [4]:
image_size = 128
transform = transforms.Compose([
    transforms.Resize((image_size, image_size)),
    transforms.ToTensor()
])
train_dataset = Thyroid_Dataset("train.csv", transform = transform, augmentation = True)
train_dataloader = DataLoader(train_dataset, batch_size = 8, shuffle = True)

val_dataset = Thyroid_Dataset("val.csv", transform = transform)
val_dataloader = DataLoader(val_dataset, batch_size = 8)
# image, mask = next(iter(train_dataloader))
# image = image.cuda()
# mask = mask.cuda()

In [5]:
# model = Eff_Unet(
#         layers=[5, 5, 15, 10],
#         embed_dims=[40, 80, 192, 384],
#         downsamples=[True, True, True, True],
#         vit_num=6,
#         drop_path_rate=0.1,
#         num_classes=1,
#         resolution = image_size).cuda()


In [6]:
# loss_fn = DiceLoss()

In [7]:
# optimizer = optim.Adam(model.parameters(), lr=0.001)

In [8]:
# for epoch in range(1000):
#     outputs = model(image)
#     # outputs = torch.sigmoid(logits)
#     loss = loss_fn(outputs, mask)
#     IOU = IOU_score(outputs, mask)

#     # Backward and optimize
#     optimizer.zero_grad()   # clear previous gradients
#     loss.backward()         # compute gradients
#     optimizer.step()        # update weights

#     print(f"Epoch {epoch+1}, Loss: {loss.item():.4f}, IOU: {IOU.item():.4f}")

In [9]:
def train(dataloader, model, optimizer, loss_fn, device):
    total_loss = 0
    total_IOU = 0
    
    model.train()
    model.to(device)
    for image, mask in tqdm(dataloader):
        image, mask = image.to(device), mask.to(device)
        outputs = model(image)
        
        loss = loss_fn(outputs, mask)
        IOU = IOU_score(outputs, mask)
    
        # Backward and optimize
        optimizer.zero_grad()   # clear previous gradients
        loss.backward()         # compute gradients
        optimizer.step()        # update weights

        total_loss += loss.item()
        total_IOU += IOU.item()
    return total_loss/len(dataloader), total_IOU/len(dataloader)
        
def val(dataloader, model, loss_fn, device):
    total_loss = 0
    total_IOU = 0

    model.eval()
    model.to(device)
    for image, mask in tqdm(dataloader):
        image, mask = image.to(device), mask.to(device)
        outputs = model(image)
        
        loss = loss_fn(outputs, mask)
        IOU = IOU_score(outputs, mask)
    

        total_loss += loss.item()
        total_IOU += IOU.item()
    return total_loss/len(dataloader), total_IOU/len(dataloader)

In [32]:
epochs = 40
wandb.init(
    project="thyroid",  # Project name in W&B
    name="small model v1",       # (optional) specific run name
    config={                     # (optional) hyperparameters
        "image_size": 128,
        "learning_rate": 0.001,
        "epochs": epochs,
        "batch_size": 8,
        # "weight_decay":1e-4
    }
)

In [33]:
model = Eff_Unet(
        layers=[5, 5, 15, 10],
        embed_dims=[10, 20, 48, 96],
        # embed_dims=[40, 80, 192, 384],
        downsamples=[True, True, True, True],
        vit_num=6,
        drop_path_rate=0.1,
        num_classes=1,
        resolution = image_size).cuda()


In [34]:
loss_fn = DiceLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)
scheduler = optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=epochs)

In [None]:
for epoch in range(epochs):
    print(f"epoch : {epoch}")
    total_loss_train, total_IOU_train = train(train_dataloader, model, optimizer, loss_fn, "cuda")
    print(f"train loss : {total_loss_train}, train IOU : {total_IOU_train}")
    total_loss_val, total_IOU_val = val(val_dataloader, model, loss_fn, "cuda")
    print(f"val loss : {total_loss_val}, val IOU : {total_IOU_val}")
    
    scheduler.step()
    current_lr = scheduler.get_last_lr()[0]
    
    wandb.log({
        "epoch": epoch,
        "Learning Rate":current_lr,
        "train_loss": total_loss_train,
        "train_IOU": total_IOU_train,
        "val_loss": total_loss_val,
        "val_IOU": total_IOU_val
    })
wandb.finish()

epoch : 0


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [02:59<00:00,  4.17it/s]


train loss : 0.469952803379401, train IOU : 0.4189247778520846


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.60it/s]


val loss : 0.3382506188699755, val IOU : 0.4333858108621533
epoch : 1


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [02:59<00:00,  4.15it/s]


train loss : 0.2837940021212321, train IOU : 0.538693095705755


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.34it/s]


val loss : 0.30332066143973396, val IOU : 0.4631929014951496
epoch : 2


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [02:59<00:00,  4.16it/s]


train loss : 0.24951667527118362, train IOU : 0.5695116301297822


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.57it/s]


val loss : 0.3987680784726547, val IOU : 0.32832760224908086
epoch : 3


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [02:59<00:00,  4.17it/s]


train loss : 0.22881783658720883, train IOU : 0.59158616396318


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.12it/s]


val loss : 0.2594849214715473, val IOU : 0.5039120851936987
epoch : 4


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [03:03<00:00,  4.07it/s]


train loss : 0.22117036493268197, train IOU : 0.608381742653917


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.01it/s]


val loss : 0.25394555774785704, val IOU : 0.5416452538664058
epoch : 5


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [03:04<00:00,  4.06it/s]


train loss : 0.2156441163825223, train IOU : 0.6183444216468408


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.04it/s]


val loss : 0.2587850305993678, val IOU : 0.5375883665125248
epoch : 6


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [02:59<00:00,  4.16it/s]


train loss : 0.1971399213575136, train IOU : 0.6391419355409691


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.27it/s]


val loss : 0.2312941596669666, val IOU : 0.5734936198440649
epoch : 7


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [02:59<00:00,  4.15it/s]


train loss : 0.1900196046714323, train IOU : 0.6490729997355935


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.47it/s]


val loss : 0.21773418632604308, val IOU : 0.5825264292248225
epoch : 8


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [03:02<00:00,  4.10it/s]


train loss : 0.18538090111899727, train IOU : 0.656536249152149


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.03it/s]


val loss : 0.20842158188254145, val IOU : 0.5890152838270543
epoch : 9


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [03:03<00:00,  4.08it/s]


train loss : 0.1797157237967015, train IOU : 0.6643263658925073


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.18it/s]


val loss : 0.20885317204362255, val IOU : 0.576598234474659
epoch : 10


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [02:59<00:00,  4.17it/s]


train loss : 0.1696819024711568, train IOU : 0.6739893979735803


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 11.87it/s]


val loss : 0.21822379251657906, val IOU : 0.5986030235634012
epoch : 11


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [02:59<00:00,  4.16it/s]


train loss : 0.1726458584927172, train IOU : 0.6727150689805528


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.26it/s]


val loss : 0.2062880730224868, val IOU : 0.6003653982938346
epoch : 12


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [03:03<00:00,  4.07it/s]


train loss : 0.1686064498012803, train IOU : 0.6807531121983585


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.09it/s]


val loss : 0.1964903847645905, val IOU : 0.6053376374608379
epoch : 13


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [02:58<00:00,  4.18it/s]


train loss : 0.1594296783168951, train IOU : 0.6941822353934987


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.03it/s]


val loss : 0.19471197764752274, val IOU : 0.6237476586790408
epoch : 14


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [02:58<00:00,  4.18it/s]


train loss : 0.15793395680755656, train IOU : 0.6945569724682344


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.58it/s]


val loss : 0.18906064255762908, val IOU : 0.6247537153757224
epoch : 15


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [03:04<00:00,  4.06it/s]


train loss : 0.14931149926370726, train IOU : 0.7096511617482427


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.34it/s]


val loss : 0.18446662062305516, val IOU : 0.6352639478647103
epoch : 17


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [02:59<00:00,  4.16it/s]


train loss : 0.15161291407134478, train IOU : 0.7092365293378332


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.22it/s]


val loss : 0.18175133103031224, val IOU : 0.6336501685239501
epoch : 18


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [03:03<00:00,  4.07it/s]


train loss : 0.14605518956101404, train IOU : 0.7150646875022725


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.16it/s]


val loss : 0.18759912504988202, val IOU : 0.6224526485144082
epoch : 19


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [03:00<00:00,  4.14it/s]


train loss : 0.1427203566833353, train IOU : 0.7202230607729201


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.47it/s]


val loss : 0.1780257098755594, val IOU : 0.6455742843070272
epoch : 20


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [03:02<00:00,  4.09it/s]


train loss : 0.13986363516275183, train IOU : 0.720633322056358


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.02it/s]


val loss : 0.1749543668860096, val IOU : 0.6515483088412527
epoch : 21


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [03:03<00:00,  4.07it/s]


train loss : 0.13663186478008388, train IOU : 0.7258600745813913


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.13it/s]


val loss : 0.16713697526414514, val IOU : 0.6528023100000316
epoch : 22


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [03:03<00:00,  4.06it/s]


train loss : 0.13667468142158376, train IOU : 0.7291402634846638


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.27it/s]


val loss : 0.17662286253298742, val IOU : 0.6413574249057447
epoch : 23


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [02:57<00:00,  4.21it/s]


train loss : 0.13538092877491412, train IOU : 0.7303015790789961


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.26it/s]


val loss : 0.17572717242321725, val IOU : 0.6368467143531573
epoch : 24


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [03:03<00:00,  4.07it/s]


train loss : 0.13054744897278117, train IOU : 0.7351287421851432


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 11.96it/s]


val loss : 0.17631768271074458, val IOU : 0.6359454332771948
epoch : 25


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [03:03<00:00,  4.07it/s]


train loss : 0.13247133554065402, train IOU : 0.7379126495705391


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.20it/s]


val loss : 0.17120323393304468, val IOU : 0.6535287532260863
epoch : 26


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [03:03<00:00,  4.07it/s]


train loss : 0.12621031524027526, train IOU : 0.7441828258066292


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 11.81it/s]


val loss : 0.17108550465713113, val IOU : 0.6467195170915733
epoch : 28


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [03:02<00:00,  4.08it/s]


train loss : 0.12444266537266722, train IOU : 0.7463317562936939


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.22it/s]


val loss : 0.16711391937934747, val IOU : 0.6590549521527048
epoch : 29


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [03:02<00:00,  4.08it/s]


train loss : 0.12231154414704207, train IOU : 0.7503252706055341


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 11.96it/s]


val loss : 0.17080845368110528, val IOU : 0.645506566611387
epoch : 30


100%|████████████████████████████████████████████████████████████████████████████████| 747/747 [03:01<00:00,  4.11it/s]


train loss : 0.11972298759373635, train IOU : 0.7506469263928323


100%|████████████████████████████████████████████████████████████████████████████████| 118/118 [00:09<00:00, 12.50it/s]


val loss : 0.1710991111852355, val IOU : 0.6466137680966976
epoch : 31


 58%|██████████████████████████████████████████████▌                                 | 435/747 [01:44<01:15,  4.15it/s]

In [18]:
# wandb.init(
#     project="thyroid",  # Project name in W&B
#     name="augmentation_scheduler v1",       # (optional) specific run name
#     config={                     # (optional) hyperparameters
#         "image_size": 128,
#         "learning_rate": 0.001,
#         "epochs": 20,
#         "batch_size": 8
#     }
# )

In [19]:
# scheduler = optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=10)

In [20]:
# for epoch in range(10):
#     print(f"epoch : {epoch}")
#     total_loss_train, total_IOU_train = train(train_dataloader, model, optimizer, loss_fn, "cuda")
#     print(f"train loss : {total_loss_train}, train IOU : {total_IOU_train}")
#     total_loss_val, total_IOU_val = val(val_dataloader, model, loss_fn, "cuda")
#     print(f"val loss : {total_loss_val}, val IOU : {total_IOU_val}")

#     scheduler.step()
#     current_lr = scheduler.get_last_lr()[0]
    
#     wandb.log({
#         "epoch": epoch,
#         "Learning Rate":current_lr,
#         "train_loss": total_loss_train,
#         "train_IOU": total_IOU_train,
#         "val_loss": total_loss_val,
#         "val_IOU": total_IOU_val
#     })
# wandb.finish()

In [None]:
# total_loss_val, total_IOU_val = val(val_dataloader, model, loss_fn, "cuda")

In [17]:
print("ll")

ll
