Add project root to path

In [1]:
import os
import sys
module_path = os.path.abspath(os.path.join('..'))
if module_path not in sys.path:
    sys.path.append(module_path)

Load raw data

Create dataset objects

In [2]:
import torch
from utils import filename
from utils import filehandling

size = 'dev_s'
cube_side = 32
transform = 'power'
prob = 50

directory = filename.processed.dataset(size, cube_side, transform, prob)
dataset = filehandling.read_splitted_dataset(directory)

  0%|          | 0/39 [00:00<?, ?it/s]

Create dataloader, split to train & test

In [3]:
from utils.data import splitting

train, test = splitting.train_val_split(dataset, .8)

Load pretrained 2D model

In [4]:
import segmentation_models_pytorch as smp

model = smp.Unet(encoder_name='resnet101', in_channels=1, classes=1)

Convert pretrained 2D model to 3D

In [5]:
import torch
from models.convert2Dto3D import Conv3dConverter

Conv3dConverter(model, -1, torch.ones(1, 1, 32, 32, 32))

Conv3dConverter(
Unet(
  (encoder): ResNetEncoder(
    (conv1): Conv3d(1, 64, kernel_size=(7, 7, 7), stride=(2, 2, 2), padding=(3, 3, 3), bias=False)
    (bn1): BatchNorm3d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (relu): ReLU(inplace=True)
    (maxpool): MaxPool3d(kernel_size=3, stride=2, padding=1, dilation=1, ceil_mode=False)
    (layer1): Sequential(
      (0): Bottleneck(
        (conv1): Conv3d(64, 64, kernel_size=(1, 1, 1), stride=(1, 1, 1), bias=False)
        (bn1): BatchNorm3d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (conv2): Conv3d(64, 64, kernel_size=(3, 3, 3), stride=(1, 1, 1), padding=(1, 1, 1), bias=False)
        (bn2): BatchNorm3d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (conv3): Conv3d(64, 256, kernel_size=(1, 1, 1), stride=(1, 1, 1), bias=False)
        (bn3): BatchNorm3d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (relu): ReLU(inplace

In [6]:
from torch import nn
def bce_loss(y_hat, y):
    yf = y.flatten()
    y_hatf = y_hat.flatten()
    return nn.BCEWithLogitsLoss()(y_hatf, yf)

In [7]:
import numpy as np
seg = train.get_attribute('segmentmap')
threshold = 0.5#sum(map(torch.sum, seg)) / sum(map(lambda t: torch.prod(torch.tensor(t.shape)),seg))

In [8]:
from utils.data.generating import get_hi_shape
hi_shape = get_hi_shape(filename.data.sky(size))

Create Lightning objects

In [9]:
import pytorch_lightning as pl
from pytorch_lightning.loggers.tensorboard import TensorBoardLogger
from pytorch_lightning.loggers import TensorBoardLogger
from datetime import datetime
from pytorch_toolbelt import losses

from models.segmentation import Segmenter, get_vis_id

vis_id = get_vis_id(test, hi_shape, 50)

def loss(yh, y):
    return bce_loss(yh, y) + losses.JaccardLoss(mode='binary', log_loss=True)(yh, y)

version = datetime.now().strftime("%Y/%m/%d %H:%M:%S")
logger = TensorBoardLogger("tb_logs", name="segmenter", version=version)
segmenter = Segmenter(model, loss, train, test, logger, vis_id=vis_id, threshold=threshold)

trainer = pl.Trainer(max_epochs=500, gpus=1, logger=logger)

GPU available: True, used: True
TPU available: None, using: 0 TPU cores
LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0]


Train!

In [None]:
trainer.fit(segmenter)

Set SLURM handle signals.

  | Name  | Type | Params
-------------------------------
0 | model | Unet | 112 M 
-------------------------------
112 M     Trainable params
0         Non-trainable params
112 M     Total params


Validation sanity check: 0it [00:00, ?it/s]

  value = torch.tensor(value, device=device, dtype=torch.float)


tensor(72., device='cuda:0') tensor(165033, device='cuda:0') tensor(10170., device='cuda:0')
tensor(5., device='cuda:0') tensor(166221, device='cuda:0') tensor(6802., device='cuda:0')




Training: 0it [00:00, ?it/s]

Validating: 0it [00:00, ?it/s]

tensor(0., device='cuda:0') tensor(0, device='cuda:0') tensor(9322., device='cuda:0')
tensor(0., device='cuda:0') tensor(0, device='cuda:0') tensor(8081., device='cuda:0')
tensor(0., device='cuda:0') tensor(0, device='cuda:0') tensor(5503., device='cuda:0')
tensor(0., device='cuda:0') tensor(0, device='cuda:0') tensor(7391., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(3397., device='cuda:0') tensor(1158682, device='cuda:0') tensor(9132., device='cuda:0')
tensor(2230., device='cuda:0') tensor(1159066, device='cuda:0') tensor(7243., device='cuda:0')
tensor(1569., device='cuda:0') tensor(1159098, device='cuda:0') tensor(7130., device='cuda:0')
tensor(1826., device='cuda:0') tensor(860409, device='cuda:0') tensor(6792., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(1113., device='cuda:0') tensor(5657, device='cuda:0') tensor(7421., device='cuda:0')
tensor(973., device='cuda:0') tensor(4934, device='cuda:0') tensor(7517., device='cuda:0')
tensor(1724., device='cuda:0') tensor(8388, device='cuda:0') tensor(9374., device='cuda:0')
tensor(318., device='cuda:0') tensor(2641, device='cuda:0') tensor(5985., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(2473., device='cuda:0') tensor(8326, device='cuda:0') tensor(10228., device='cuda:0')
tensor(1060., device='cuda:0') tensor(8479, device='cuda:0') tensor(8766., device='cuda:0')
tensor(1488., device='cuda:0') tensor(6758, device='cuda:0') tensor(7180., device='cuda:0')
tensor(538., device='cuda:0') tensor(3618, device='cuda:0') tensor(4123., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(2001., device='cuda:0') tensor(9042, device='cuda:0') tensor(8448., device='cuda:0')
tensor(1597., device='cuda:0') tensor(9635, device='cuda:0') tensor(7265., device='cuda:0')
tensor(1636., device='cuda:0') tensor(11021, device='cuda:0') tensor(7479., device='cuda:0')
tensor(1354., device='cuda:0') tensor(8306, device='cuda:0') tensor(7105., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(943., device='cuda:0') tensor(2024, device='cuda:0') tensor(4875., device='cuda:0')
tensor(757., device='cuda:0') tensor(2820, device='cuda:0') tensor(10717., device='cuda:0')
tensor(818., device='cuda:0') tensor(2449, device='cuda:0') tensor(7699., device='cuda:0')
tensor(1112., device='cuda:0') tensor(2478, device='cuda:0') tensor(7006., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(2558., device='cuda:0') tensor(93203, device='cuda:0') tensor(8446., device='cuda:0')
tensor(1659., device='cuda:0') tensor(95828, device='cuda:0') tensor(6270., device='cuda:0')
tensor(3096., device='cuda:0') tensor(99849, device='cuda:0') tensor(8256., device='cuda:0')
tensor(3184., device='cuda:0') tensor(67893, device='cuda:0') tensor(7325., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(1808., device='cuda:0') tensor(219478, device='cuda:0') tensor(9777., device='cuda:0')
tensor(843., device='cuda:0') tensor(230834, device='cuda:0') tensor(6507., device='cuda:0')
tensor(1628., device='cuda:0') tensor(214754, device='cuda:0') tensor(6187., device='cuda:0')
tensor(1100., device='cuda:0') tensor(169930, device='cuda:0') tensor(7826., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(1617., device='cuda:0') tensor(5857, device='cuda:0') tensor(6653., device='cuda:0')
tensor(1307., device='cuda:0') tensor(5118, device='cuda:0') tensor(6603., device='cuda:0')
tensor(4149., device='cuda:0') tensor(9669, device='cuda:0') tensor(11404., device='cuda:0')
tensor(1058., device='cuda:0') tensor(3121, device='cuda:0') tensor(5637., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(1727., device='cuda:0') tensor(11643, device='cuda:0') tensor(4816., device='cuda:0')
tensor(1654., device='cuda:0') tensor(11916, device='cuda:0') tensor(7554., device='cuda:0')
tensor(2067., device='cuda:0') tensor(10624, device='cuda:0') tensor(10679., device='cuda:0')
tensor(2469., device='cuda:0') tensor(10514, device='cuda:0') tensor(7248., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(3711., device='cuda:0') tensor(21628, device='cuda:0') tensor(9527., device='cuda:0')
tensor(3134., device='cuda:0') tensor(20817, device='cuda:0') tensor(9530., device='cuda:0')
tensor(2234., device='cuda:0') tensor(13637, device='cuda:0') tensor(7487., device='cuda:0')
tensor(774., device='cuda:0') tensor(9004, device='cuda:0') tensor(3753., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(1872., device='cuda:0') tensor(7711, device='cuda:0') tensor(7294., device='cuda:0')
tensor(3020., device='cuda:0') tensor(6526, device='cuda:0') tensor(7816., device='cuda:0')
tensor(1094., device='cuda:0') tensor(3891, device='cuda:0') tensor(9041., device='cuda:0')
tensor(3032., device='cuda:0') tensor(8612, device='cuda:0') tensor(6146., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(4211., device='cuda:0') tensor(9506, device='cuda:0') tensor(11442., device='cuda:0')
tensor(870., device='cuda:0') tensor(1841, device='cuda:0') tensor(6331., device='cuda:0')
tensor(820., device='cuda:0') tensor(2892, device='cuda:0') tensor(7026., device='cuda:0')
tensor(874., device='cuda:0') tensor(1878, device='cuda:0') tensor(5498., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(2760., device='cuda:0') tensor(6321, device='cuda:0') tensor(8153., device='cuda:0')
tensor(1803., device='cuda:0') tensor(5044, device='cuda:0') tensor(6693., device='cuda:0')
tensor(1419., device='cuda:0') tensor(4111, device='cuda:0') tensor(8029., device='cuda:0')
tensor(2249., device='cuda:0') tensor(5839, device='cuda:0') tensor(7422., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(3310., device='cuda:0') tensor(7197, device='cuda:0') tensor(10107., device='cuda:0')
tensor(1156., device='cuda:0') tensor(4898, device='cuda:0') tensor(6633., device='cuda:0')
tensor(3078., device='cuda:0') tensor(9308, device='cuda:0') tensor(10250., device='cuda:0')
tensor(557., device='cuda:0') tensor(2648, device='cuda:0') tensor(3307., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(2935., device='cuda:0') tensor(68245, device='cuda:0') tensor(8878., device='cuda:0')
tensor(2215., device='cuda:0') tensor(65133, device='cuda:0') tensor(6507., device='cuda:0')
tensor(3950., device='cuda:0') tensor(74564, device='cuda:0') tensor(8956., device='cuda:0')
tensor(2898., device='cuda:0') tensor(60187, device='cuda:0') tensor(5956., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(2338., device='cuda:0') tensor(6215, device='cuda:0') tensor(7849., device='cuda:0')
tensor(666., device='cuda:0') tensor(3351, device='cuda:0') tensor(6009., device='cuda:0')
tensor(3232., device='cuda:0') tensor(7649, device='cuda:0') tensor(8971., device='cuda:0')
tensor(2015., device='cuda:0') tensor(3888, device='cuda:0') tensor(7468., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(1117., device='cuda:0') tensor(5179, device='cuda:0') tensor(6101., device='cuda:0')
tensor(2333., device='cuda:0') tensor(5816, device='cuda:0') tensor(8438., device='cuda:0')
tensor(3759., device='cuda:0') tensor(9849, device='cuda:0') tensor(9777., device='cuda:0')
tensor(1537., device='cuda:0') tensor(3691, device='cuda:0') tensor(5981., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(2446., device='cuda:0') tensor(5563, device='cuda:0') tensor(9602., device='cuda:0')
tensor(1361., device='cuda:0') tensor(4552, device='cuda:0') tensor(7524., device='cuda:0')
tensor(1354., device='cuda:0') tensor(4170, device='cuda:0') tensor(5819., device='cuda:0')
tensor(2688., device='cuda:0') tensor(5273, device='cuda:0') tensor(7352., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(1341., device='cuda:0') tensor(3703, device='cuda:0') tensor(6490., device='cuda:0')
tensor(2015., device='cuda:0') tensor(5322, device='cuda:0') tensor(7870., device='cuda:0')
tensor(2471., device='cuda:0') tensor(4429, device='cuda:0') tensor(9690., device='cuda:0')
tensor(1659., device='cuda:0') tensor(4416, device='cuda:0') tensor(6247., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(1819., device='cuda:0') tensor(8513, device='cuda:0') tensor(7238., device='cuda:0')
tensor(1360., device='cuda:0') tensor(7147, device='cuda:0') tensor(6528., device='cuda:0')
tensor(4602., device='cuda:0') tensor(12431, device='cuda:0') tensor(11079., device='cuda:0')
tensor(1978., device='cuda:0') tensor(8092, device='cuda:0') tensor(5452., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(2631., device='cuda:0') tensor(6362, device='cuda:0') tensor(10380., device='cuda:0')
tensor(2404., device='cuda:0') tensor(4708, device='cuda:0') tensor(7176., device='cuda:0')
tensor(1195., device='cuda:0') tensor(3650, device='cuda:0') tensor(6387., device='cuda:0')
tensor(2046., device='cuda:0') tensor(5625, device='cuda:0') tensor(6354., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(2764., device='cuda:0') tensor(12720, device='cuda:0') tensor(8637., device='cuda:0')
tensor(3504., device='cuda:0') tensor(14095, device='cuda:0') tensor(9250., device='cuda:0')
tensor(2785., device='cuda:0') tensor(11319, device='cuda:0') tensor(6820., device='cuda:0')
tensor(2276., device='cuda:0') tensor(10439, device='cuda:0') tensor(5590., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(1890., device='cuda:0') tensor(2987, device='cuda:0') tensor(9468., device='cuda:0')
tensor(1557., device='cuda:0') tensor(3445, device='cuda:0') tensor(8712., device='cuda:0')
tensor(1400., device='cuda:0') tensor(2946, device='cuda:0') tensor(7772., device='cuda:0')
tensor(420., device='cuda:0') tensor(1308, device='cuda:0') tensor(4345., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(3485., device='cuda:0') tensor(29335, device='cuda:0') tensor(7888., device='cuda:0')
tensor(5177., device='cuda:0') tensor(32617, device='cuda:0') tensor(9973., device='cuda:0')
tensor(3244., device='cuda:0') tensor(33041, device='cuda:0') tensor(6953., device='cuda:0')
tensor(1953., device='cuda:0') tensor(17952, device='cuda:0') tensor(5483., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(2549., device='cuda:0') tensor(54562, device='cuda:0') tensor(7594., device='cuda:0')
tensor(4261., device='cuda:0') tensor(52703, device='cuda:0') tensor(8385., device='cuda:0')
tensor(3518., device='cuda:0') tensor(50442, device='cuda:0') tensor(8119., device='cuda:0')
tensor(3163., device='cuda:0') tensor(33751, device='cuda:0') tensor(6199., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(2452., device='cuda:0') tensor(7175, device='cuda:0') tensor(8784., device='cuda:0')
tensor(2677., device='cuda:0') tensor(6311, device='cuda:0') tensor(9309., device='cuda:0')
tensor(1127., device='cuda:0') tensor(2713, device='cuda:0') tensor(5048., device='cuda:0')
tensor(2146., device='cuda:0') tensor(5077, device='cuda:0') tensor(7156., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(2194., device='cuda:0') tensor(4445, device='cuda:0') tensor(8586., device='cuda:0')
tensor(1940., device='cuda:0') tensor(4572, device='cuda:0') tensor(7384., device='cuda:0')
tensor(2403., device='cuda:0') tensor(5021, device='cuda:0') tensor(9633., device='cuda:0')
tensor(878., device='cuda:0') tensor(2879, device='cuda:0') tensor(4694., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(516., device='cuda:0') tensor(2069, device='cuda:0') tensor(5570., device='cuda:0')
tensor(2191., device='cuda:0') tensor(3856, device='cuda:0') tensor(8640., device='cuda:0')
tensor(1271., device='cuda:0') tensor(4249, device='cuda:0') tensor(7137., device='cuda:0')
tensor(3263., device='cuda:0') tensor(5996, device='cuda:0') tensor(8950., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(1115., device='cuda:0') tensor(1988, device='cuda:0') tensor(7440., device='cuda:0')
tensor(1793., device='cuda:0') tensor(3706, device='cuda:0') tensor(8862., device='cuda:0')
tensor(2257., device='cuda:0') tensor(4551, device='cuda:0') tensor(8585., device='cuda:0')
tensor(221., device='cuda:0') tensor(599, device='cuda:0') tensor(5410., device='cuda:0')


Validating: 0it [00:00, ?it/s]

tensor(4414., device='cuda:0') tensor(15821, device='cuda:0') tensor(10147., device='cuda:0')
tensor(3615., device='cuda:0') tensor(14929, device='cuda:0') tensor(8669., device='cuda:0')
tensor(2136., device='cuda:0') tensor(13296, device='cuda:0') tensor(5561., device='cuda:0')
tensor(1956., device='cuda:0') tensor(7995, device='cuda:0') tensor(5920., device='cuda:0')
