<center>
    <h1>[Training] - FastAI Baseline</h1>
<center>

<center>
<img src="https://hubmapconsortium.org/wp-content/uploads/2019/01/HuBMAP-Retina-Logo-Color.png">
</center>

# Description 

Welcome to Human BioMolecular Atlas Program (HuBMAP) + Human Protein Atlas (HPA) competition. 
The objective of this challenge is segmentation of functional tissue units (FTU. e.g., glomeruli in kidney or alveoli in the lung) in biopsy slides from several different organs. 
The underlying data includes imagery from different sources prepared with different protocols at a variety of resolutions, reflecting typical challenges for working with medical data.

This notebook provides a fast.ai starter Pytorch code based on a U-shape network (UneXt50) that was used on multiple competitions in the past and includes several tricks from the previous segmentation competitions.
It is [dividing the images into tiles](https://www.kaggle.com/code/thedevastator/converting-to-256x256), selection of tiles with tissue, evaluation of the predictions of multiple models with TTA, combining the tile masks back into image level masks, and conversion into RLE. The [inference](https://www.kaggle.com/code/thedevastator/inference-fastai-baseline) is performed based on models trained in the [fast.ai training notebook](https://www.kaggle.com/code/thedevastator/training-fastai-baseline).

**Inference & Dataset Creation**

- #### Inference Notebook [here](https://www.kaggle.com/code/thedevastator/inference-fastai-baseline). 
- #### Dataset Creation [here](https://www.kaggle.com/code/thedevastator/converting-to-256x256). 

**Precomputed Datasets**

- ##### [Dataset (512 x 512)](https://www.kaggle.com/datasets/thedevastator/hubmap-2022-512x512/)

- ##### [Dataset (256 x 256)](https://www.kaggle.com/datasets/thedevastator/hubmap-2022-256x256/)

- ##### [Dataset (128 x 128)](https://www.kaggle.com/datasets/thedevastator/hubmap-2022-128x128/settings)

____

#### Everything is based on the excellent [notebooks](https://www.kaggle.com/code/iafoss/hubmap-pytorch-fast-ai-starter) by [iafoss](https://www.kaggle.com/iafoss) 
All credit to belongs to the original author!
____

In [1]:
"""
Lovasz-Softmax and Jaccard hinge loss in PyTorch
Maxim Berman 2018 ESAT-PSI KU Leuven (MIT License)
"""

import torch
from torch.autograd import Variable
import torch.nn.functional as F
import numpy as np
try:
    from itertools import  ifilterfalse
except ImportError: # py3k
    from itertools import  filterfalse


def lovasz_grad(gt_sorted):
    """
    Computes gradient of the Lovasz extension w.r.t sorted errors
    See Alg. 1 in paper
    """
    p = len(gt_sorted)
    gts = gt_sorted.sum()
    intersection = gts - gt_sorted.float().cumsum(0)
    union = gts + (1 - gt_sorted).float().cumsum(0)
    jaccard = 1. - intersection / union
    if p > 1: # cover 1-pixel case
        jaccard[1:p] = jaccard[1:p] - jaccard[0:-1]
    return jaccard


def iou_binary(preds, labels, EMPTY=1., ignore=None, per_image=True):
    """
    IoU for foreground class
    binary: 1 foreground, 0 background
    """
    if not per_image:
        preds, labels = (preds,), (labels,)
    ious = []
    for pred, label in zip(preds, labels):
        intersection = ((label == 1) & (pred == 1)).sum()
        union = ((label == 1) | ((pred == 1) & (label != ignore))).sum()
        if not union:
            iou = EMPTY
        else:
            iou = float(intersection) / union
        ious.append(iou)
    iou = f_mean(ious)    # mean accross images if per_image
    return 100 * iou


def iou(preds, labels, C, EMPTY=1., ignore=None, per_image=False):
    """
    Array of IoU for each (non ignored) class
    """
    if not per_image:
        preds, labels = (preds,), (labels,)
    ious = []
    for pred, label in zip(preds, labels):
        iou = []    
        for i in range(C):
            if i != ignore: # The ignored label is sometimes among predicted classes (ENet - CityScapes)
                intersection = ((label == i) & (pred == i)).sum()
                union = ((label == i) | ((pred == i) & (label != ignore))).sum()
                if not union:
                    iou.append(EMPTY)
                else:
                    iou.append(float(intersection) / union)
        ious.append(iou)
    ious = map(f_mean, zip(*ious)) # mean accross images if per_image
    return 100 * np.array(ious)


# --------------------------- BINARY LOSSES ---------------------------


def lovasz_hinge(logits, labels, per_image=True, ignore=None):
    """
    Binary Lovasz hinge loss
      logits: [B, H, W] Variable, logits at each pixel (between -\infty and +\infty)
      labels: [B, H, W] Tensor, binary ground truth masks (0 or 1)
      per_image: compute the loss per image instead of per batch
      ignore: void class id
    """
    if per_image:
        loss = f_mean(lovasz_hinge_flat(*flatten_binary_scores(log.unsqueeze(0), lab.unsqueeze(0), ignore))
                          for log, lab in zip(logits, labels))
    else:
        loss = lovasz_hinge_flat(*flatten_binary_scores(logits, labels, ignore))
    return loss


def lovasz_hinge_flat(logits, labels):
    """
    Binary Lovasz hinge loss
      logits: [P] Variable, logits at each prediction (between -\infty and +\infty)
      labels: [P] Tensor, binary ground truth labels (0 or 1)
      ignore: label to ignore
    """
    if len(labels) == 0:
        # only void pixels, the gradients should be 0
        return logits.sum() * 0.
    signs = 2. * labels.float() - 1.
    errors = (1. - logits * Variable(signs))
    errors_sorted, perm = torch.sort(errors, dim=0, descending=True)
    perm = perm.data
    gt_sorted = labels[perm]
    grad = lovasz_grad(gt_sorted)
    #loss = torch.dot(F.relu(errors_sorted), Variable(grad))
    loss = torch.dot(F.elu(errors_sorted)+1, Variable(grad))
    return loss


def flatten_binary_scores(scores, labels, ignore=None):
    """
    Flattens predictions in the batch (binary case)
    Remove labels equal to 'ignore'
    """
    scores = scores.view(-1)
    labels = labels.view(-1)
    if ignore is None:
        return scores, labels
    valid = (labels != ignore)
    vscores = scores[valid]
    vlabels = labels[valid]
    return vscores, vlabels


class StableBCELoss(torch.nn.modules.Module):
    def __init__(self):
         super(StableBCELoss, self).__init__()
    def forward(self, input, target):
         neg_abs = - input.abs()
         loss = input.clamp(min=0) - input * target + (1 + neg_abs.exp()).log()
         return loss.mean()


def binary_xloss(logits, labels, ignore=None):
    """
    Binary Cross entropy loss
      logits: [B, H, W] Variable, logits at each pixel (between -\infty and +\infty)
      labels: [B, H, W] Tensor, binary ground truth masks (0 or 1)
      ignore: void class id
    """
    logits, labels = flatten_binary_scores(logits, labels, ignore)
    loss = StableBCELoss()(logits, Variable(labels.float()))
    return loss


# --------------------------- MULTICLASS LOSSES ---------------------------


def lovasz_softmax(probas, labels, only_present=False, per_image=False, ignore=None):
    """
    Multi-class Lovasz-Softmax loss
      probas: [B, C, H, W] Variable, class probabilities at each prediction (between 0 and 1)
      labels: [B, H, W] Tensor, ground truth labels (between 0 and C - 1)
      only_present: average only on classes present in ground truth
      per_image: compute the loss per image instead of per batch
      ignore: void class labels
    """
    if per_image:
        loss = f_mean(lovasz_softmax_flat(*flatten_probas(prob.unsqueeze(0), lab.unsqueeze(0), ignore), only_present=only_present)
                          for prob, lab in zip(probas, labels))
    else:
        loss = lovasz_softmax_flat(*flatten_probas(probas, labels, ignore), only_present=only_present)
    return loss


def lovasz_softmax_flat(probas, labels, only_present=False):
    """
    Multi-class Lovasz-Softmax loss
      probas: [P, C] Variable, class probabilities at each prediction (between 0 and 1)
      labels: [P] Tensor, ground truth labels (between 0 and C - 1)
      only_present: average only on classes present in ground truth
    """
    C = probas.size(1)
    losses = []
    for c in range(C):
        fg = (labels == c).float() # foreground for class c
        if only_present and fg.sum() == 0:
            continue
        errors = (Variable(fg) - probas[:, c]).abs()
        errors_sorted, perm = torch.sort(errors, 0, descending=True)
        perm = perm.data
        fg_sorted = fg[perm]
        losses.append(torch.dot(errors_sorted, Variable(lovasz_grad(fg_sorted))))
    return f_mean(losses)


def flatten_probas(probas, labels, ignore=None):
    """
    Flattens predictions in the batch
    """
    B, C, H, W = probas.size()
    probas = probas.permute(0, 2, 3, 1).contiguous().view(-1, C)  # B * H * W, C = P, C
    labels = labels.view(-1)
    if ignore is None:
        return probas, labels
    valid = (labels != ignore)
    vprobas = probas[valid.nonzero().squeeze()]
    vlabels = labels[valid]
    return vprobas, vlabels

def xloss(logits, labels, ignore=None):
    """
    Cross entropy loss
    """
    return F.cross_entropy(logits, Variable(labels), ignore_index=255)


# --------------------------- HELPER FUNCTIONS ---------------------------

def f_mean(l, ignore_nan=False, empty=0):
    """
    nanmean compatible with generators.
    """
    l = iter(l)
    if ignore_nan:
        l = ifilterfalse(np.isnan, l)
    try:
        n = 1
        acc = next(l)
    except StopIteration:
        if empty == 'raise':
            raise ValueError('Empty mean')
        return empty
    for n, v in enumerate(l, 2):
        acc += v
    if n == 1:
        return acc
    return acc / n

In [2]:
%reload_ext autoreload
%autoreload 2
%matplotlib inline

import torch.nn as nn
from fastai.vision.all import PixelShuffle_ICNR, ConvLayer, Tensor, Metric, flatten_check
from torch.utils.data import Dataset, DataLoader
import pandas as pd
import numpy as np
import os
import cv2
import gc
import random
from albumentations import *
from sklearn.model_selection import KFold
import matplotlib.pyplot as plt
from os.path import isdir, isfile, join

from tqdm import tqdm
import warnings
warnings.filterwarnings("ignore")

In [3]:

SEED = 2021
TRAIN = '../input/hubmap-2022-256x256/train/'
MASKS = '../input/hubmap-2022-256x256/masks/'
LABELS = '../input/hubmap-organ-segmentation/train.csv'
SAVE_FILE = "../working/best_model"
if not isdir(TRAIN):
    TRAIN = '../../hubmap-organ-segmentation/hubmap-2022-256x256/image/'
    MASKS = '../../hubmap-organ-segmentation/hubmap-2022-256x256/mask/'
    LABELS = '../../hubmap-organ-segmentation/train.csv'
    SAVE_FILE = "best_model"
    BATCH_SIZE=4
    train_ids = [10044, 10274, 10666, 10912, 10971, 1184, 12233, 12244, 1229, 13483, 13942, 14396, 14407, 1500, 15706, 15732, 16149, 16609, 16659, 1690, 17143, 17187, 17455, 17828, 18422, 19084, 1955, 19569, 20247, 20428, 20955, 21086, 21155, 2174, 22016, 22059, 22995, 23009, 23640, 23828, 23959, 23961, 24194, 24269, 24961, 25430, 26982, 27471, 28318, 28622, 29213, 29223, 29296, 29307, 29809, 30080, 30294, 30355, 30414, 30424, 30765, 31898, 31958, 32009, 32126, 32412, 32741, 3409, 435, 4639, 4658, 4802, 4944, 5287, 5317, 5785, 5932, 5995, 6120, 10392, 10610, 10703, 10992, 1123, 11448, 11645, 12026, 12466, 12483, 144, 15551, 18792, 19179, 19360, 19377, 19507, 19997, 2079, 20831, 21358, 22236, 2279, 22953, 24833, 25472, 26664, 27781, 27803, 28126, 28657, 28748, 28963, 29143, 29690, 30201, 3054, 3057, 30581, 31290, 31675, 31733, 32231, 3959, 4404, 10488, 11064, 11629, 1220, 12452, 12476, 127, 12827, 13189, 14388, 15067, 15124, 15329, 16564, 1731, 1878, 20563, 23252, 24782, 25516, 25945, 26480, 27232, 2793, 28052, 28189, 28429, 29610, 30084, 30394, 30500, 31139, 31571, 31800, 32151, 4301, 4412, 4776, 5086, 5552, 10611, 11497, 1157, 12784, 13034, 13260, 14756, 15005, 15192, 15787, 15860, 16163, 16214, 16216, 16362, 164, 16711, 17422, 18121, 18401, 18426, 18449, 18777, 19048, 19533, 20302, 20440, 20478, 20520, 20794, 21021, 21112, 21129, 21195, 21321, 22035, 22133, 22544, 22718, 22741, 23051, 23243, 2344, 23665, 23760, 23880, 24097, 24100, 24222, 2424, 24241, 2447, 24522, 2500, 25620, 26101, 26174, 2668, 27298, 27350, 27468, 27616, 27879, 28262, 28436, 2874, 28823, 28940, 29238, 2943, 30194, 30224, 30250, 30474, 3083, 30876, 31698, 31709, 32325, 32527, 4066, 4265, 4777, 5099, 10651, 10892, 11662, 1168, 11890, 12174, 12471, 13396, 13507, 14183, 14674, 15499, 15842, 16728, 16890, 17126, 18445, 1850, 18900, 203, 21039, 21501, 21812, 22310, 23094, 25298, 25641, 25689, 26319, 26780, 26886, 2696, 27128, 27340, 27587, 27861, 28045, 28791, 29180, 29424, 29820, 31406, 31727, 31799, 3303, 351, 4062, 4561, 5832]
    val_ids = [6390, 6730, 6794, 737, 7397, 7706, 7902, 8227, 8388, 8638, 8842, 9231, 928, 9358, 5583, 6722, 7169, 8116, 8876, 8894, 9407, 9453, 5777, 686, 7359, 8151, 8231, 8343, 9387, 9450, 5102, 6021, 62, 6318, 660, 6807, 7569, 7970, 8502, 9437, 9445, 9470, 9517, 9769, 9791, 6121, 6611, 676, 8222, 8402, 8450, 8752, 9777, 9904]     
else:
    BATCH_SIZE=32
    train_ids = [10044, 10274, 10666, 10912, 10971, 1184, 12233, 12244, 1229, 13483, 13942, 14396, 14407, 1500, 15706, 15732, 16149, 16609, 16659, 1690, 17143, 17187, 17455, 17828, 18422, 19084, 1955, 19569, 20247, 20428, 20955, 21086, 21155, 2174, 22016, 22059, 22995, 23009, 23640, 23828, 23959, 23961, 24194, 24269, 24961, 25430, 26982, 27471, 28318, 28622, 29213, 29223, 29296, 29307, 29809, 30080, 30294, 30355, 30414, 30424, 30765, 31898, 31958, 32009, 32126, 32412, 32741, 3409, 435, 4639, 4658, 4802, 4944, 5287, 5317, 5785, 5932, 5995, 6120, 10392, 10610, 10703, 10992, 1123, 11448, 11645, 12026, 12466, 12483, 144, 15551, 18792, 19179, 19360, 19377, 19507, 19997, 2079, 20831, 21358, 22236, 2279, 22953, 24833, 25472, 26664, 27781, 27803, 28126, 28657, 28748, 28963, 29143, 29690, 30201, 3054, 3057, 30581, 31290, 31675, 31733, 32231, 3959, 4404, 10488, 11064, 11629, 1220, 12452, 12476, 127, 12827, 13189, 14388, 15067, 15124, 15329, 16564, 1731, 1878, 20563, 23252, 24782, 25516, 25945, 26480, 27232, 2793, 28052, 28189, 28429, 29610, 30084, 30394, 30500, 31139, 31571, 31800, 32151, 4301, 4412, 4776, 5086, 5552, 10611, 11497, 1157, 12784, 13034, 13260, 14756, 15005, 15192, 15787, 15860, 16163, 16214, 16216, 16362, 164, 16711, 17422, 18121, 18401, 18426, 18449, 18777, 19048, 19533, 20302, 20440, 20478, 20520, 20794, 21021, 21112, 21129, 21195, 21321, 22035, 22133, 22544, 22718, 22741, 23051, 23243, 2344, 23665, 23760, 23880, 24097, 24100, 24222, 2424, 24241, 2447, 24522, 2500, 25620, 26101, 26174, 2668, 27298, 27350, 27468, 27616, 27879, 28262, 28436, 2874, 28823, 28940, 29238, 2943, 30194, 30224, 30250, 30474, 3083, 30876, 31698, 31709, 32325, 32527, 4066, 4265, 4777, 5099, 10651, 10892, 11662, 1168, 11890, 12174, 12471, 13396, 13507, 14183, 14674, 15499, 15842, 16728, 16890, 17126, 18445, 1850, 18900, 203, 21039, 21501, 21812, 22310, 23094, 25298, 25641, 25689, 26319, 26780, 26886, 2696, 27128, 27340, 27587, 27861, 28045, 28791, 29180, 29424, 29820, 31406, 31727, 31799, 3303, 351, 4062, 4561, 5832]
    val_ids = [6390, 6730, 6794, 737, 7397, 7706, 7902, 8227, 8388, 8638, 8842, 9231, 928, 9358, 5583, 6722, 7169, 8116, 8876, 8894, 9407, 9453, 5777, 686, 7359, 8151, 8231, 8343, 9387, 9450, 5102, 6021, 62, 6318, 660, 6807, 7569, 7970, 8502, 9437, 9445, 9470, 9517, 9769, 9791, 6121, 6611, 676, 8222, 8402, 8450, 8752, 9777, 9904]     
    train_ids = train_ids + val_ids
NUM_WORKERS = 0

print(TRAIN, isdir(TRAIN))

../../hubmap-organ-segmentation/hubmap-2022-256x256/image/ True


In [4]:
def seed_everything(seed):
    random.seed(seed)
    os.environ['PYTHONHASHSEED'] = str(seed)
    np.random.seed(seed)
    torch.manual_seed(seed)
    torch.cuda.manual_seed(seed)
    torch.backends.cudnn.deterministic = True
    #the following line gives ~10% speedup
    #but may lead to some stochasticity in the results 
    torch.backends.cudnn.benchmark = True
    
seed_everything(SEED)

# Data
One important thing here is the train/val split. To avoid possible leaks resulted by a similarity of tiles from the same images, it is better to keep tiles from each image together in train or in test.

In [5]:
# https://www.kaggle.com/datasets/thedevastator/hubmap-2022-256x256
mean = np.array([0.7720342, 0.74582646, 0.76392896])
std = np.array([0.24745085, 0.26182273, 0.25782376])

def img2tensor(img,dtype:np.dtype=np.float32):
    if img.ndim==2 : img = np.expand_dims(img,2)
    img = np.transpose(img,(2,0,1))
    return torch.from_numpy(img.astype(dtype, copy=False))

class HuBMAPDataset(Dataset):
    def __init__(self, train=True, tfms=None):
        ids = pd.read_csv(LABELS).id.astype(str).values
        if train:
            ids = train_ids
        else:
            ids = val_ids

        self.fnames = [fname for fname in os.listdir(TRAIN) if fname.split('_')[0] in ids or int(fname.split('_')[0]) in ids]
        self.train = train
        self.tfms = tfms
        print("number of files", len(self.fnames))
        
    def __len__(self):
        return len(self.fnames)
    
    def __getitem__(self, idx):
        fname = self.fnames[idx]
        img = cv2.cvtColor(cv2.imread(os.path.join(TRAIN,fname)), cv2.COLOR_BGR2RGB)
        mask = cv2.imread(os.path.join(MASKS,fname),cv2.IMREAD_GRAYSCALE)
        if self.tfms is not None:
            augmented = self.tfms(image=img,mask=mask)
            img,mask = augmented['image'],augmented['mask']
        return img2tensor((img/255.0 - mean)/std),img2tensor(mask)
    
def get_aug(p=1.0):
    return Compose([
        HorizontalFlip(),
        VerticalFlip(),
        RandomRotate90(),
        ShiftScaleRotate(shift_limit=0.0625, scale_limit=0.2, rotate_limit=15, p=0.9, 
                         border_mode=cv2.BORDER_REFLECT),
        OneOf([
            OpticalDistortion(p=0.3),
            GridDistortion(p=.1),
            IAAPiecewiseAffine(p=0.3),
        ], p=0.3),
        OneOf([
            HueSaturationValue(10,15,10),
            CLAHE(clip_limit=2),
            RandomBrightnessContrast(),            
        ], p=0.3),
    ], p=p)

In [6]:
# #example of train images with masks
# ds = HuBMAPDataset(tfms=get_aug())
# dl = DataLoader(ds,batch_size=BATCH_SIZE,shuffle=False,num_workers=NUM_WORKERS)
# print(len(dl))
# imgs,masks = next(iter(dl))

# plt.figure(figsize=(16,16))
# for i,(img,mask) in enumerate(zip(imgs,masks)):
#     img = ((img.permute(1,2,0)*std + mean)*255.0).numpy().astype(np.uint8)
#     plt.subplot(8,8,i+1)
#     plt.imshow(img,vmin=0,vmax=255)
#     plt.imshow(mask.squeeze().numpy(), alpha=0.2)
#     plt.axis('off')
#     plt.subplots_adjust(wspace=None, hspace=None)
    
# del ds,dl,imgs,masks

# Model
The model used in this kernel is based on a U-shape network (UneXt50, see image below), which I used in Severstal and Understanding Clouds competitions. The idea of a U-shape network is coming from a [Unet](https://arxiv.org/pdf/1505.04597.pdf) architecture proposed in 2015 for medical images: the encoder part creates a representation of features at different levels, while the decoder combines the features and generates a prediction as a segmentation mask. The skip connections between encoder and decoder allow us to utilize features from the intermediate conv layers of the encoder effectively, without a need for the information to go the full way through entire encoder and decoder. The latter is especially important to link the predicted mask to the specific pixels of the detected object. Later people realized that ImageNet pretrained computer vision models could drastically improve the quality of a segmentation model because of optimized architecture of the encoder, high encoder capacity (in contrast to one used in the original Unet), and the power of the transfer learning.

There are several important things that must be added to a Unet network, however, to make it able to reach competitive results with current state of the art approaches. First, it is **Feature Pyramid Network (FPN)**: additional skip connection between different upscaling blocks of the decoder and the output layer. So, the final prediction is produced based on the concatenation of U-net output with resized outputs of the intermediate layers. These skip-connections provide a shortcut for gradient flow improving model performance and convergence speed. Since intermediate layers have many channels, their upscaling and use as an input for the final layer would introduce a significant overhead in terms of the computational time and memory. Therefore, 3x3+3x3 convolutions are applied (factorization) before the resize to reduce the number of channels.

Another very important thing is the **Atrous Spatial Pyramid Pooling (ASPP) block** added between encoder and decoder. The flaw of the traditional U-shape networks is resulted by a small receptive field. Therefore, if a model needs to make a decision about a segmentation of a large object, especially for a large image resolution, it can get confused being able to look only into parts of the object. A way to increase the receptive field and enable interactions between different parts of the image is use of a block combining convolutions with different dilatations ([Atrous convolutions](https://arxiv.org/pdf/1606.00915.pdf) with various rates in ASPP block). While the original paper uses 6,12,18 rates, they may be customized for a particular task and a particular image resolution to maximize the performance. One more thing I added is using group convolutions in ASPP block to reduce the number of model parameters.

Finally, the decoder upscaling blocks are based on [pixel shuffle](https://arxiv.org/pdf/1609.05158.pdf) rather than transposed convolution used in the first Unet models. It allows to avoid artifacts in the produced masks. And I use [semisupervised Imagenet pretrained ResNeXt50](https://github.com/facebookresearch/semi-supervised-ImageNet1K-models) model as a backbone. In Pytorch it provides the performance of EfficientNet B2-B3 with much faster convergence for the computational cost and GPU RAM requirements of EfficientNet B0 (though, in TF EfficientNet is highly optimized and may be a good thing to use).

![](https://i.ibb.co/z5KxDzm/Une-Xt50-1.png)

In [7]:
class FPN(nn.Module):
    def __init__(self, input_channels:list, output_channels:list):
        super().__init__()
        self.convs = nn.ModuleList(
            [nn.Sequential(nn.Conv2d(in_ch, out_ch*2, kernel_size=3, padding=1),
             nn.ReLU(inplace=True), nn.BatchNorm2d(out_ch*2),
             nn.Conv2d(out_ch*2, out_ch, kernel_size=3, padding=1))
            for in_ch, out_ch in zip(input_channels, output_channels)])
        
    def forward(self, xs:list, last_layer):
        hcs = [F.interpolate(c(x),scale_factor=2**(len(self.convs)-i),mode='bilinear') 
               for i,(c,x) in enumerate(zip(self.convs, xs))]
        hcs.append(last_layer)
        return torch.cat(hcs, dim=1)

class UnetBlock(nn.Module):
    def __init__(self, up_in_c:int, x_in_c:int, nf:int=None, blur:bool=False,
                 self_attention:bool=False, **kwargs):
        super().__init__()
        self.shuf = PixelShuffle_ICNR(up_in_c, up_in_c//2, blur=blur, **kwargs)
        self.bn = nn.BatchNorm2d(x_in_c)
        ni = up_in_c//2 + x_in_c
        nf = nf if nf is not None else max(up_in_c//2,32)
        self.conv1 = ConvLayer(ni, nf, norm_type=None, **kwargs)
        self.conv2 = ConvLayer(nf, nf, norm_type=None,
            xtra=SelfAttention(nf) if self_attention else None, **kwargs)
        self.relu = nn.ReLU(inplace=True)

    def forward(self, up_in:Tensor, left_in:Tensor) -> Tensor:
        s = left_in
        up_out = self.shuf(up_in)
        cat_x = self.relu(torch.cat([up_out, self.bn(s)], dim=1))
        return self.conv2(self.conv1(cat_x))
        
class _ASPPModule(nn.Module):
    def __init__(self, inplanes, planes, kernel_size, padding, dilation, groups=1):
        super().__init__()
        self.atrous_conv = nn.Conv2d(inplanes, planes, kernel_size=kernel_size,
                stride=1, padding=padding, dilation=dilation, bias=False, groups=groups)
        self.bn = nn.BatchNorm2d(planes)
        self.relu = nn.ReLU()

        self._init_weight()

    def forward(self, x):
        x = self.atrous_conv(x)
        x = self.bn(x)

        return self.relu(x)

    def _init_weight(self):
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                torch.nn.init.kaiming_normal_(m.weight)
            elif isinstance(m, nn.BatchNorm2d):
                m.weight.data.fill_(1)
                m.bias.data.zero_()

class ASPP(nn.Module):
    def __init__(self, inplanes=512, mid_c=256, dilations=[6, 12, 18, 24], out_c=None):
        super().__init__()
        self.aspps = [_ASPPModule(inplanes, mid_c, 1, padding=0, dilation=1)] + \
            [_ASPPModule(inplanes, mid_c, 3, padding=d, dilation=d,groups=4) for d in dilations]
        self.aspps = nn.ModuleList(self.aspps)
        self.global_pool = nn.Sequential(nn.AdaptiveMaxPool2d((1, 1)),
                        nn.Conv2d(inplanes, mid_c, 1, stride=1, bias=False),
                        nn.BatchNorm2d(mid_c), nn.ReLU())
        out_c = out_c if out_c is not None else mid_c
        self.out_conv = nn.Sequential(nn.Conv2d(mid_c*(2+len(dilations)), out_c, 1, bias=False),
                                    nn.BatchNorm2d(out_c), nn.ReLU(inplace=True))
        self.conv1 = nn.Conv2d(mid_c*(2+len(dilations)), out_c, 1, bias=False)
        self._init_weight()

    def forward(self, x):
        x0 = self.global_pool(x)
        xs = [aspp(x) for aspp in self.aspps]
        x0 = F.interpolate(x0, size=xs[0].size()[2:], mode='bilinear', align_corners=True)
        x = torch.cat([x0] + xs, dim=1)
        return self.out_conv(x)
    
    def _init_weight(self):
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                torch.nn.init.kaiming_normal_(m.weight)
            elif isinstance(m, nn.BatchNorm2d):
                m.weight.data.fill_(1)
                m.bias.data.zero_()

In [8]:
class UneXt50(nn.Module):
    def __init__(self, stride=1, **kwargs):
        super().__init__()
        #encoder
        m = torch.hub.load('facebookresearch/semi-supervised-ImageNet1K-models',
                           'resnext50_32x4d_ssl')
        self.enc0 = nn.Sequential(m.conv1, m.bn1, nn.ReLU(inplace=True))
        self.enc1 = nn.Sequential(nn.MaxPool2d(kernel_size=3, stride=2, padding=1, dilation=1),
                            m.layer1) #256
        self.enc2 = m.layer2 #512
        self.enc3 = m.layer3 #1024
        self.enc4 = m.layer4 #2048
        #aspp with customized dilatations
        self.aspp = ASPP(2048,256,out_c=512,dilations=[stride*1,stride*2,stride*3,stride*4])
        self.drop_aspp = nn.Dropout2d(0.5)
        #decoder
        self.dec4 = UnetBlock(512,1024,256)
        self.dec3 = UnetBlock(256,512,128)
        self.dec2 = UnetBlock(128,256,64)
        self.dec1 = UnetBlock(64,64,32)
        self.fpn = FPN([512,256,128,64],[16]*4)
        self.drop = nn.Dropout2d(0.1)
        self.final_conv = ConvLayer(32+16*4, 1, ks=1, norm_type=None, act_cls=None)
        
    def forward(self, x):
        enc0 = self.enc0(x)
        enc1 = self.enc1(enc0)
        enc2 = self.enc2(enc1)
        enc3 = self.enc3(enc2)
        enc4 = self.enc4(enc3)
        enc5 = self.aspp(enc4)
        dec3 = self.dec4(self.drop_aspp(enc5),enc3)
        dec2 = self.dec3(dec3,enc2)
        dec1 = self.dec2(dec2,enc1)
        dec0 = self.dec1(dec1,enc0)
        x = self.fpn([enc5, dec3, dec2, dec1], dec0)
        x = self.final_conv(self.drop(x))
        x = F.interpolate(x,scale_factor=2,mode='bilinear')
        return x

#split the model to encoder and decoder for fast.ai
split_layers = lambda m: [list(m.enc0.parameters())+list(m.enc1.parameters())+
                list(m.enc2.parameters())+list(m.enc3.parameters())+
                list(m.enc4.parameters()),
                list(m.aspp.parameters())+list(m.dec4.parameters())+
                list(m.dec3.parameters())+list(m.dec2.parameters())+
                list(m.dec1.parameters())+list(m.fpn.parameters())+
                list(m.final_conv.parameters())]

# Loss and metric
A famous loss for image segmentation is the [Lovász loss](https://arxiv.org/pdf/1705.08790.pdf), a surrogate of IoU. Following [iafoss](https://www.kaggle.com/iafoss)'s [work](https://www.kaggle.com/code/iafoss/hubmap-pytorch-fast-ai-starter):
- **ReLU in it must be replaced by (ELU + 1)**(, like he did [here](https://www.kaggle.com/iafoss/lovasz).
- **Symmetric Lovász loss:** consider not only a predicted segmentation and a provided mask but also the inverse prediction and the inverse mask (predict mask for negative case).

In [9]:
def symmetric_lovasz(outputs, targets):
    return 0.5*(lovasz_hinge(outputs, targets) + lovasz_hinge(-outputs, 1.0 - targets))

In [10]:
class Dice_soft(Metric):
    def __name__(self, ):
        return "Dice soft"
    
    def __init__(self, axis=1): 
        self.axis = axis 
        self.inter = 0.0
        self.union = 0
        
    def reset(self): self.inter,self.union = 0,0
    def accumulate(self, preds, gts):
        pred,targ = flatten_check(torch.sigmoid(preds), gts)
        self.inter += (pred*targ).float().sum().item()
        self.union += (pred+targ).float().sum().item()
    
    @property
    def value(self): return 2.0 * self.inter/self.union if self.union > 0 else None
    
# dice with automatic threshold selection
class Dice_th(Metric):
    def __name__(self, ):
        return "Dice th"
    
    def __init__(self, ths=np.arange(0.1,0.9,0.05), axis=1): 
        self.axis = axis
        self.ths = ths
        self.inter = torch.zeros(len(self.ths))
        self.union = torch.zeros(len(self.ths))
    
    def reset(self): 
        self.inter = torch.zeros(len(self.ths))
        self.union = torch.zeros(len(self.ths))
        
    def accumulate(self, preds, gts):
        pred,targ = flatten_check(torch.sigmoid(preds), gts)
        for i,th in enumerate(self.ths):
            p = (pred > th).float()
            self.inter[i] += (p*targ).float().sum().item()
            self.union[i] += (p+targ).float().sum().item()

    @property
    def value(self):
        dices = torch.where(self.union > 0.0, 
                2.0*self.inter/self.union, torch.zeros_like(self.union))
        return dices.max()

# Model evaluation

In [11]:
#iterator like wrapper that returns predicted and gt masks
class Model_pred:
    def __init__(self, model, dl, tta:bool=True, half:bool=False):
        self.model = model
        self.dl = dl
        self.tta = tta
        self.half = half
        
    def __iter__(self):
        self.model.eval()
        name_list = self.dl.dataset.fnames
        count=0
        with torch.no_grad():
            for x,y in iter(self.dl):
                x = x.cuda()
                if self.half: x = x.half()
                p = self.model(x)
                py = torch.sigmoid(p).detach()
                if self.tta:
                    #x,y,xy flips as TTA
                    flips = [[-1],[-2],[-2,-1]]
                    for f in flips:
                        p = self.model(torch.flip(x,f))
                        p = torch.flip(p,f)
                        py += torch.sigmoid(p).detach()
                    py /= (1+len(flips))
                if y is not None and len(y.shape)==4 and py.shape != y.shape:
                    py = F.upsample(py, size=(y.shape[-2],y.shape[-1]), mode="bilinear")
                py = py.permute(0,2,3,1).float().cpu()
                batch_size = len(py)
                for i in range(batch_size):
                    taget = y[i].detach().cpu() if y is not None else None
                    yield py[i],taget,name_list[count]
                    count += 1
                    
    def __len__(self):
        return len(self.dl.dataset)
    
class Dice_th_pred(Metric):
    def __init__(self, ths=np.arange(0.1,0.9,0.01), axis=1): 
        self.axis = axis
        self.ths = ths
        self.inter = torch.zeros(len(self.ths))
        self.union = torch.zeros(len(self.ths))
        
    def reset(self): 
        self.inter = torch.zeros(len(self.ths))
        self.union = torch.zeros(len(self.ths))
        
    def accumulate(self,p,t):
        pred,targ = flatten_check(p, t)
        for i,th in enumerate(self.ths):
            p = (pred > th).float()
            self.inter[i] += (p*targ).float().sum().item()
            self.union[i] += (p+targ).float().sum().item()

    @property
    def value(self):
        dices = torch.where(self.union > 0.0, 2.0*self.inter/self.union, 
                            torch.zeros_like(self.union))
        return dices
    
def save_img(data,name,out):
    data = data.float().cpu().numpy()
    img = cv2.imencode('.png',(data*255).astype(np.uint8))[1]
    out.writestr(name, img)

# Train

In [12]:
try:
    import segmentation_models_pytorch as smp
    from segmentation_models_pytorch import utils as smp_utils
except Exception as e:
    !pip install segmentation_models_pytorch
    import segmentation_models_pytorch as smp
    from segmentation_models_pytorch import utils as smp_utils
    

In [13]:
class AverageValueMeter():
    def __init__(self):
        super(AverageValueMeter, self).__init__()
        self.reset()
        self.val = 0

    def add(self, value, n=1):
        self.val = value
        self.sum += value
        self.var += value * value
        self.n += n

        if self.n == 0:
            self.mean, self.std = np.nan, np.nan
        elif self.n == 1:
            self.mean = 0.0 + self.sum  # This is to force a copy in torch/numpy
            self.std = np.inf
            self.mean_old = self.mean
            self.m_s = 0.0
        else:
            self.mean = self.mean_old + (value - n * self.mean_old) / float(self.n)
            self.m_s += (value - self.mean_old) * (value - self.mean)
            self.mean_old = self.mean
            self.std = np.sqrt(self.m_s / (self.n - 1.0))

    def value(self):
        return self.mean, self.std

    def reset(self):
        self.n = 0
        self.sum = 0.0
        self.var = 0.0
        self.val = 0.0
        self.mean = np.nan
        self.mean_old = 0.0
        self.m_s = 0.0
        self.std = np.nan

In [14]:
def train_one_epoch(model, dataloader, optimizer, loss_fn, metrics):
    logs = {}
    loss_meter = AverageValueMeter()
    metrics_meters = {metric.__name__(): AverageValueMeter() for metric in metrics}

    for idx, (imgs, masks) in enumerate(tqdm(dataloader)):
        optimizer.zero_grad()
        imgs, masks = imgs.cuda(), masks.cuda()
        preds = model(imgs)
        loss = loss_fn(preds, masks)
        loss.backward()
        optimizer.step()
        
        # update loss logs
        loss_value = loss.cpu().detach().numpy()
        loss_meter.add(loss_value)
        loss_logs = {"loss": loss_meter.mean}
        logs.update(loss_logs)

                
        # update metrics logs
        for metric_fn in metrics:
            metric_fn.accumulate(preds, masks)
            metric_value = metric_fn.value
            metrics_meters[metric_fn.__name__()].add(metric_value)
        metrics_logs = {k: v.mean for k, v in metrics_meters.items()}
        logs.update(metrics_logs)
    return logs


In [15]:
def val_one_epoch(model, dataloader, optimizer, loss_fn, metrics):
    
    logs = {}
    loss_meter = AverageValueMeter()
    metrics_meters = {metric.__name__(): AverageValueMeter() for metric in metrics}
    model.eval()

    
    for idx, (imgs, masks) in enumerate(tqdm(dataloader)):
        imgs, masks = imgs.cuda(), masks.cuda()
        preds = model(imgs)
        loss = loss_fn(preds, masks)
        
        loss_value = loss.cpu().detach().numpy()

        # update loss logs
        loss_value = loss.cpu().detach().numpy()
        loss_meter.add(loss_value)
        loss_logs = {"loss": loss_meter.mean}

        logs.update(loss_logs)

                
        # update metrics logs
        for metric_fn in metrics:
            metric_fn.accumulate(preds, masks)
            metric_value = metric_fn.value
            metrics_meters[metric_fn.__name__()].add(metric_value)
        metrics_logs = {k: v.mean for k, v in metrics_meters.items()}
        logs.update(metrics_logs)
    return logs

In [16]:
model = UneXt50().cuda() 

Using cache found in C:\Users\TAI NGUYEN TRONG/.cache\torch\hub\facebookresearch_semi-supervised-ImageNet1K-models_master


In [17]:
metrics=[Dice_soft(),Dice_th()]
optimizer = torch.optim.SGD([ 
    dict(params=model.parameters(), lr=0.00001),
])

DEVICE = 'cuda'

In [18]:
dice = Dice_th(np.arange(0.2,0.7,0.1))

train_dataset = HuBMAPDataset(train=True, tfms=get_aug())
val_dataset = HuBMAPDataset(train=False)

train_dataloader = DataLoader(train_dataset, batch_size=BATCH_SIZE,
            num_workers=NUM_WORKERS, drop_last=False, pin_memory=True, shuffle=True)

val_dataloader = DataLoader(val_dataset, batch_size=BATCH_SIZE,
            num_workers=NUM_WORKERS, drop_last=False, pin_memory=True, shuffle=False)
max_score = 0.0

num_plataue_epoch = 0

for epoch in range(0, 250):
    print('\nEpoch: {}'.format(epoch))
    train_logs = train_one_epoch(model, train_dataloader, optimizer, symmetric_lovasz, metrics)
    valid_logs = val_one_epoch(model, val_dataloader, optimizer, symmetric_lovasz, metrics)
    # do something (save model, change lr, etc.)
    if max_score < valid_logs['Dice soft']:
        max_score = valid_logs['Dice soft']
        model_info = "_{}_{}_{}.pth".format(epoch,BATCH_SIZE, round(max_score, 4))
        save_model = SAVE_FILE+model_info
        torch.save(model, save_model)
        print('Model saved at', save_model)
    else:
        num_plataue_epoch += 1
    if epoch == 25:
        optimizer.param_groups[0]['lr'] = 1e-5
        print('Decrease decoder learning rate to 1e-5!')
    if num_plataue_epoch == 5:
        break

number of files 2367
number of files 424

Epoch: 133


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:54<00:00,  3.40it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:09<00:00, 10.70it/s]


Model saved! 0.5851234646639065 133

Epoch: 134


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:34<00:00,  3.84it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 14.00it/s]


Model saved! 0.5853279679226614 134

Epoch: 135


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:26<00:00,  4.05it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.28it/s]


Model saved! 0.5859865464579768 135

Epoch: 136


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:26<00:00,  4.04it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 14.38it/s]


Model saved! 0.587518582640736 136

Epoch: 137


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:29<00:00,  3.95it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.57it/s]


Model saved! 0.5879052828153788 137

Epoch: 138


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:24<00:00,  4.09it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.91it/s]



Epoch: 139


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:33<00:00,  3.86it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 13.24it/s]



Epoch: 140


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:24<00:00,  4.10it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.98it/s]


Model saved! 0.5886873921677428 140

Epoch: 141


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:32<00:00,  3.89it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.66it/s]


Model saved! 0.5891072532838548 141

Epoch: 142


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:24<00:00,  4.09it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.78it/s]


Model saved! 0.5895839640334362 142

Epoch: 143


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:25<00:00,  4.07it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.81it/s]


Model saved! 0.5900991864444268 143

Epoch: 144


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:31<00:00,  3.91it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.77it/s]


Model saved! 0.5909471657052777 144

Epoch: 145


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:28<00:00,  3.98it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.64it/s]


Model saved! 0.5915164442270809 145

Epoch: 146


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:27<00:00,  4.01it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 14.16it/s]


Model saved! 0.5918056653715336 146

Epoch: 147


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:27<00:00,  4.01it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 13.15it/s]


Model saved! 0.5922987917561363 147

Epoch: 148


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:27<00:00,  4.01it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 14.01it/s]


Model saved! 0.5928499385638123 148

Epoch: 149


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:30<00:00,  3.92it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 13.01it/s]


Model saved! 0.5932337412746437 149

Epoch: 150


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:32<00:00,  3.89it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.47it/s]


Model saved! 0.5938269212036732 150

Epoch: 151


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:29<00:00,  3.97it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.50it/s]


Model saved! 0.5944013492324891 151

Epoch: 152


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:31<00:00,  3.90it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 13.07it/s]


Model saved! 0.5950234386259915 152

Epoch: 153


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:27<00:00,  4.02it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.56it/s]


Model saved! 0.595335745574243 153

Epoch: 154


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:26<00:00,  4.05it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.28it/s]


Model saved! 0.5959048104336817 154

Epoch: 155


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:29<00:00,  3.97it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.58it/s]


Model saved! 0.5965524639249509 155

Epoch: 156


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:25<00:00,  4.06it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.81it/s]


Model saved! 0.5970452221198703 156

Epoch: 157


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:27<00:00,  4.01it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.79it/s]


Model saved! 0.597627869985054 157

Epoch: 158


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:27<00:00,  4.00it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.31it/s]


Model saved! 0.5981844305560936 158

Epoch: 159


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:32<00:00,  3.89it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 14.00it/s]


Model saved! 0.5985805635696003 159

Epoch: 160


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:29<00:00,  3.95it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 13.23it/s]


Model saved! 0.5990382990795342 160

Epoch: 161


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:29<00:00,  3.95it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.64it/s]


Model saved! 0.5995913315027482 161

Epoch: 162


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:27<00:00,  4.01it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.71it/s]


Model saved! 0.6000091746391141 162

Epoch: 163


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:28<00:00,  3.98it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 14.23it/s]


Model saved! 0.6005760194786108 163

Epoch: 164


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:24<00:00,  4.10it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.80it/s]


Model saved! 0.601130006158964 164

Epoch: 165


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:25<00:00,  4.06it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 14.23it/s]


Model saved! 0.6015450334801528 165

Epoch: 166


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:26<00:00,  4.03it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.73it/s]


Model saved! 0.6020968694163813 166

Epoch: 167


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:43<00:00,  3.61it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:09<00:00, 10.89it/s]


Model saved! 0.6026046234071876 167

Epoch: 168


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:48<00:00,  3.52it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:10<00:00, 10.26it/s]


Model saved! 0.6031292811525762 168

Epoch: 169


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:43<00:00,  3.61it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:11<00:00,  8.89it/s]


Model saved! 0.6036215610111599 169

Epoch: 170


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:45<00:00,  3.57it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:09<00:00, 11.06it/s]


Model saved! 0.6042229151988014 170

Epoch: 171


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:49<00:00,  3.49it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:10<00:00, 10.44it/s]


Model saved! 0.6047666906544111 171

Epoch: 172


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [03:00<00:00,  3.28it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:12<00:00,  8.45it/s]


Model saved! 0.6053537068423575 172

Epoch: 173


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [03:12<00:00,  3.08it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:12<00:00,  8.65it/s]


Model saved! 0.6059506562761734 173

Epoch: 174


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:48<00:00,  3.52it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:09<00:00, 10.87it/s]


Model saved! 0.6063882087198151 174

Epoch: 175


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:49<00:00,  3.50it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:10<00:00, 10.23it/s]


Model saved! 0.606872136870081 175

Epoch: 176


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:49<00:00,  3.50it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:09<00:00, 10.82it/s]


Model saved! 0.6074831294030668 176

Epoch: 177


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:43<00:00,  3.61it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:09<00:00, 11.54it/s]


Model saved! 0.6079310933324716 177

Epoch: 178


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:46<00:00,  3.56it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:09<00:00, 11.50it/s]


Model saved! 0.6083873705600645 178

Epoch: 179


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:43<00:00,  3.63it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:09<00:00, 10.72it/s]


Model saved! 0.6088377827652781 179

Epoch: 180


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:57<00:00,  3.34it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:09<00:00, 11.31it/s]


Model saved! 0.6093404488658124 180

Epoch: 181


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:48<00:00,  3.52it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:09<00:00, 10.94it/s]


Model saved! 0.6098302746820349 181

Epoch: 182


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:47<00:00,  3.54it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:10<00:00, 10.33it/s]


Model saved! 0.6102871548175353 182

Epoch: 183


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:55<00:00,  3.37it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:09<00:00, 10.70it/s]


Model saved! 0.6107655499074902 183

Epoch: 184


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:48<00:00,  3.52it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:10<00:00, 10.44it/s]


Model saved! 0.6113174314289445 184

Epoch: 185


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:37<00:00,  3.76it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.69it/s]


Model saved! 0.6118286974479549 185

Epoch: 186


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:28<00:00,  4.00it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 13.25it/s]


Model saved! 0.6122904739955803 186

Epoch: 187


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:28<00:00,  3.98it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.43it/s]


Model saved! 0.6127583386039342 187

Epoch: 188


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:42<00:00,  3.64it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:16<00:00,  6.25it/s]


Model saved! 0.6131956331394512 188

Epoch: 189


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [03:49<00:00,  2.58it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:09<00:00, 10.62it/s]


Model saved! 0.6136408118302767 189

Epoch: 190


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [03:15<00:00,  3.03it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:11<00:00,  9.20it/s]


Model saved! 0.6139676544314883 190

Epoch: 191


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:48<00:00,  3.51it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 12.53it/s]


Model saved! 0.6144550855251426 191

Epoch: 192


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:34<00:00,  3.83it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 12.46it/s]


Model saved! 0.6149265321283878 192

Epoch: 193


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:38<00:00,  3.73it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 12.70it/s]


Model saved! 0.6153896605103719 193

Epoch: 194


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:34<00:00,  3.83it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 13.14it/s]


Model saved! 0.61578090911764 194

Epoch: 195


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:32<00:00,  3.89it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 13.14it/s]


Model saved! 0.6163469440603909 195

Epoch: 196


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:31<00:00,  3.91it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 13.05it/s]


Model saved! 0.6168935802441176 196

Epoch: 197


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:28<00:00,  3.98it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 13.19it/s]


Model saved! 0.6173605169036076 197

Epoch: 198


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:29<00:00,  3.96it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.48it/s]


Model saved! 0.6178043486863648 198

Epoch: 199


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:30<00:00,  3.92it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 12.78it/s]


Model saved! 0.6182411734952907 199

Epoch: 200


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:36<00:00,  3.79it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 12.62it/s]


Model saved! 0.6187148171975033 200

Epoch: 201


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:35<00:00,  3.81it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 12.88it/s]


Model saved! 0.6191480058723337 201

Epoch: 202


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:31<00:00,  3.92it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 13.09it/s]


Model saved! 0.6195876827131095 202

Epoch: 203


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:27<00:00,  4.03it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 13.22it/s]


Model saved! 0.6200536520849319 203

Epoch: 204


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:27<00:00,  4.00it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.48it/s]


Model saved! 0.6205340884576417 204

Epoch: 205


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:30<00:00,  3.94it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 13.10it/s]


Model saved! 0.6210369721197759 205

Epoch: 206


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:28<00:00,  3.98it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.50it/s]


Model saved! 0.6214640129559377 206

Epoch: 207


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:27<00:00,  4.01it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 13.21it/s]


Model saved! 0.6219326692120296 207

Epoch: 208


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:30<00:00,  3.94it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 13.21it/s]


Model saved! 0.62239152319587 208

Epoch: 209


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:28<00:00,  4.00it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:07<00:00, 13.32it/s]


Model saved! 0.6228429792740767 209

Epoch: 210


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:35<00:00,  3.80it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 12.89it/s]


Model saved! 0.623294743276949 210

Epoch: 211


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:38<00:00,  3.75it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:09<00:00, 11.69it/s]


Model saved! 0.6237225098411688 211

Epoch: 212


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:44<00:00,  3.59it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:11<00:00,  9.13it/s]


Model saved! 0.6241325081129743 212

Epoch: 213


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:49<00:00,  3.49it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:10<00:00, 10.28it/s]


Model saved! 0.6245684720970345 213

Epoch: 214


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:56<00:00,  3.35it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:12<00:00,  8.65it/s]


Model saved! 0.6249815954880626 214

Epoch: 215


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:55<00:00,  3.37it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:11<00:00,  9.53it/s]


Model saved! 0.625440380206259 215

Epoch: 216


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [03:03<00:00,  3.23it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:10<00:00, 10.22it/s]


Model saved! 0.6259487973870874 216

Epoch: 217


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [03:03<00:00,  3.22it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:10<00:00, 10.32it/s]


Model saved! 0.6264095046335768 217

Epoch: 218


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [03:12<00:00,  3.08it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:10<00:00, 10.40it/s]


Model saved! 0.6268488391439794 218

Epoch: 219


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:49<00:00,  3.49it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:09<00:00, 11.06it/s]


Model saved! 0.6272440099756343 219

Epoch: 220


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:52<00:00,  3.44it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:11<00:00,  8.97it/s]


Model saved! 0.6276370579801239 220

Epoch: 221


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:58<00:00,  3.31it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:09<00:00, 10.85it/s]


Model saved! 0.6280570629900258 221

Epoch: 222


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:57<00:00,  3.34it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:09<00:00, 11.57it/s]


Model saved! 0.6284493965334055 222

Epoch: 223


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:43<00:00,  3.62it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:09<00:00, 11.49it/s]


Model saved! 0.628869317662131 223

Epoch: 224


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:46<00:00,  3.56it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:09<00:00, 11.10it/s]


Model saved! 0.6292870288665429 224

Epoch: 225


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:59<00:00,  3.30it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:09<00:00, 11.03it/s]


Model saved! 0.6296503734501772 225

Epoch: 226


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:57<00:00,  3.34it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:14<00:00,  7.25it/s]


Model saved! 0.6300793039222278 226

Epoch: 227


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:51<00:00,  3.45it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:09<00:00, 11.24it/s]


Model saved! 0.6304922409564823 227

Epoch: 228


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:56<00:00,  3.35it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:10<00:00, 10.14it/s]


Model saved! 0.6309063415603108 228

Epoch: 229


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:49<00:00,  3.49it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:09<00:00, 11.41it/s]


Model saved! 0.6313214183639295 229

Epoch: 230


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:46<00:00,  3.55it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 12.03it/s]


Model saved! 0.6317136716464844 230

Epoch: 231


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:51<00:00,  3.45it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:10<00:00,  9.82it/s]


Model saved! 0.6320931221134023 231

Epoch: 232


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [03:01<00:00,  3.26it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:10<00:00, 10.45it/s]


Model saved! 0.6324999830082475 232

Epoch: 233


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:53<00:00,  3.42it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:10<00:00, 10.17it/s]


Model saved! 0.6329082864824608 233

Epoch: 234


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [02:43<00:00,  3.62it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:08<00:00, 12.25it/s]


Model saved! 0.6332844838411178 234

Epoch: 235


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [03:09<00:00,  3.13it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:17<00:00,  6.19it/s]


Model saved! 0.6337199537317996 235

Epoch: 236


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [03:54<00:00,  2.52it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:13<00:00,  8.15it/s]


Model saved! 0.6341148453247223 236

Epoch: 237


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [03:55<00:00,  2.52it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:16<00:00,  6.40it/s]


Model saved! 0.6345109451221012 237

Epoch: 238


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [03:56<00:00,  2.51it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:15<00:00,  6.73it/s]


Model saved! 0.6349003477948834 238

Epoch: 239


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [03:51<00:00,  2.55it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:16<00:00,  6.25it/s]


Model saved! 0.6352773215199016 239

Epoch: 240


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [03:15<00:00,  3.03it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:10<00:00, 10.27it/s]


Model saved! 0.6355985718748591 240

Epoch: 241


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [03:24<00:00,  2.89it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:12<00:00,  8.46it/s]


Model saved! 0.6359585539214978 241

Epoch: 242


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [03:28<00:00,  2.84it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:13<00:00,  7.70it/s]


Model saved! 0.6362951412898468 242

Epoch: 243


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [03:50<00:00,  2.57it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:14<00:00,  7.20it/s]


Model saved! 0.6366704592867132 243

Epoch: 244


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [03:50<00:00,  2.57it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:13<00:00,  7.96it/s]


Model saved! 0.637029699725543 244

Epoch: 245


100%|████████████████████████████████████████████████████████████████████████████████| 592/592 [03:29<00:00,  2.83it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 106/106 [00:13<00:00,  7.97it/s]


Model saved! 0.6373816755353007 245

Epoch: 246


 68%|██████████████████████████████████████████████████████                          | 400/592 [02:33<01:13,  2.61it/s]


MemoryError: Unable to allocate 1.50 MiB for an array with shape (256, 256, 3) and data type float64