In [1]:
import os
import numpy as np
import matplotlib.pyplot as plt
import random
from glob import glob
import tifffile
import torch
from torch.utils.data import Dataset
from torch.utils.data import DataLoader
import datetime
from torch.utils.tensorboard import SummaryWriter
from torchsummary import summary
from tqdm import tqdm
torch.backends.cudnn.benchmark = True

### Creating a Dataset class

In [2]:
class EmbryoNucleiDataset(Dataset):
    def __init__(self,
                 root_dir,
                ):
        
        # using root_dir, split and mask create a path to files and sort it 
        self.mask_files = sorted(glob(os.path.join(root_dir, 'cropped_masks', '*.tif'))) # load mask files into sorted list
        self.raw_files = sorted(glob(os.path.join(root_dir, 'cropped_rawfiles', '*.tif'))) # load image files into sorted list
        
    
    def __len__(self):
        #return len(self.raw_files)
        return 5000

    def __getitem__(self, idx):   
        raw_file = self.raw_files[idx] 
        mask_file = self.mask_files[idx] 
        crops_raw = tifffile.imread(raw_file) # load raw to numpy array
        crops_mask = tifffile.imread(mask_file) # load mask to numpy array
        crops_mask = (crops_mask !=0).astype(np.float32)
        crops_raw = ((crops_raw.astype(np.float32))/65535) * crops_mask
        
        # add channel dimensions to comply with pytorch standard (B, C, H, W) 
        crops_raw = np.expand_dims(crops_raw, axis=0)
        crops_mask = np.expand_dims(crops_mask, axis=0)
        
        return crops_raw, crops_mask

### Creating Autoencoder

In [3]:
class Autoencoder(torch.nn.Module):
    def __init__(
            self,
            in_channels,
            downsampling_factors,
            fmaps,
            fmul,
            kernel_size=3):

        super(Autoencoder, self).__init__()

        out_channels = in_channels

        encoder = []

        for downsampling_factor in downsampling_factors:

            encoder.append(
                    torch.nn.Conv2d(
                        in_channels,
                        fmaps,
                        kernel_size))
            encoder.append(
                    torch.nn.ReLU(inplace=True))
            encoder.append(
                    torch.nn.Conv2d(
                        fmaps,
                        fmaps,
                        kernel_size))
            encoder.append(
                    torch.nn.ReLU(inplace=True))
            encoder.append(
                    torch.nn.MaxPool2d(downsampling_factor))

            in_channels = fmaps

            fmaps = fmaps * fmul

        fmaps_bottle = fmaps

        encoder.append(
            torch.nn.Conv2d(
                in_channels,
                fmaps_bottle,
                kernel_size))
        encoder.append(
            torch.nn.ReLU(inplace=True))

        self.encoder = torch.nn.Sequential(*encoder)

        decoder = []

        fmaps = in_channels

        decoder.append(
            torch.nn.Conv2d(
                fmaps_bottle,
                fmaps,
                kernel_size))
        decoder.append(
            torch.nn.ReLU(inplace=True))

        for downsampling_factor in downsampling_factors[::-1]:

            fmaps = in_channels // fmul

            decoder.append(
                torch.nn.Upsample(
                    scale_factor=downsampling_factor,
                    mode='bilinear'))
            decoder.append(
                torch.nn.Conv2d(
                    in_channels,
                    fmaps,
                    kernel_size))
            decoder.append(
                torch.nn.ReLU(inplace=True))
            decoder.append(
                torch.nn.Conv2d(
                    fmaps,
                    fmaps,
                    kernel_size))
            decoder.append(
                torch.nn.ReLU(inplace=True))

            in_channels = fmaps

        decoder.append(
            torch.nn.Conv2d(
                in_channels,
                out_channels,
                kernel_size))

        self.decoder = torch.nn.Sequential(*decoder)

    def forward(self, x):

        enc = self.encoder(x)

        dec = self.decoder(enc)

        return enc, dec
        


### Training Time ! 

In [4]:
# identifying params for training
batch_size = 64
crop_size = 156
num_epochs = 50
model_depth = 1
downsampling_factor = 2
root_dir = '/mnt/efs/shared_data/instance_no_gt/20230830_TIF_cellpose_test/'
assert torch.cuda.is_available()
device = torch.device("cuda")

In [5]:
model = Autoencoder(in_channels=1, downsampling_factors=[downsampling_factor]*model_depth, fmaps=32, fmul=2, kernel_size = 3).to(device)
summary(model, (1, 156, 156))

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
            Conv2d-1         [-1, 32, 154, 154]             320
              ReLU-2         [-1, 32, 154, 154]               0
            Conv2d-3         [-1, 32, 152, 152]           9,248
              ReLU-4         [-1, 32, 152, 152]               0
         MaxPool2d-5           [-1, 32, 76, 76]               0
            Conv2d-6           [-1, 64, 74, 74]          18,496
              ReLU-7           [-1, 64, 74, 74]               0
            Conv2d-8           [-1, 32, 72, 72]          18,464
              ReLU-9           [-1, 32, 72, 72]               0
         Upsample-10         [-1, 32, 144, 144]               0
           Conv2d-11         [-1, 16, 142, 142]           4,624
             ReLU-12         [-1, 16, 142, 142]               0
           Conv2d-13         [-1, 16, 140, 140]           2,320
             ReLU-14         [-1, 16, 1

In [6]:
# create a logdir for each run and a corresponding summary writer
logdir = os.path.join("logs", datetime.datetime.now().strftime("%Y%m%d-%H%M%S"))
writer = SummaryWriter(logdir)

In [11]:
def train():
    # create train dataset
    dataset = EmbryoNucleiDataset(root_dir)

    # create train dataloader
    dataloader = DataLoader(dataset, batch_size=batch_size, shuffle=True, pin_memory=True)

    # create model
    model = Autoencoder(in_channels=1, downsampling_factors=[downsampling_factor]*model_depth,
        fmaps=32, fmul=2, kernel_size = 3)

    # create loss object
    loss_function = torch.nn.MSELoss()

    # create optimizer
    optimizer = torch.optim.Adam(model.parameters())
    
    for epoch in tqdm(range(num_epochs), position=0, leave=True):
        train_epoch(dataloader, model, epoch, optimizer, loss_function)

def train_epoch(dataloader, model, epoch, optimizer, loss_function, log_image_interval = 20):
    model.train()
    model = model.to(device)
    loss_list = []  
    
    for batch_id, (raw, mask) in enumerate(tqdm(dataloader, position=0, leave=True)):
        raw = raw.to(device) # move to GPU
        optimizer.zero_grad()
        _, prediction = model(raw)
        reduction = raw.shape[2] - prediction.shape[2]
        raw = raw[:, :, reduction//2:-reduction//2, reduction//2:-reduction//2]
        loss = loss_function(prediction, raw)
        step = epoch * len(dataloader) + batch_id
        writer.add_scalar('train loss',loss.item(), step)
        loss_list.append(loss.item())
        loss.backward()
        optimizer.step()
        
        if step % log_image_interval == 0:
            writer.add_images(
                tag="input", img_tensor=raw.to("cpu"), global_step=step
            )
            writer.add_images(
                tag="prediction",
                img_tensor=prediction.to("cpu").detach(),
                global_step=step,
            )
    loss_list = np.array(loss_list)
    print(f"Loss at Epoch {epoch} is {loss_list.mean()}")

In [12]:
train() # tensorboard? train for longer

  0%|                                                                                                         | 0/50 [00:00<?, ?it/s]

0


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:30<00:00,  2.58it/s]
  2%|█▉                                                                                               | 1/50 [00:30<25:03, 30.68s/it]

Loss at Epoch 0 is 0.0005759414837288941
1


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:28<00:00,  2.81it/s]
  4%|███▉                                                                                             | 2/50 [00:58<23:19, 29.16s/it]

Loss at Epoch 1 is 5.953174935067308e-05
2


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:25<00:00,  3.11it/s]
  6%|█████▊                                                                                           | 3/50 [01:24<21:29, 27.44s/it]

Loss at Epoch 2 is 3.543709264497149e-05
3


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:23<00:00,  3.43it/s]
  8%|███████▊                                                                                         | 4/50 [01:47<19:42, 25.71s/it]

Loss at Epoch 3 is 2.6513763271085033e-05
4


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:22<00:00,  3.45it/s]
 10%|█████████▋                                                                                       | 5/50 [02:10<18:31, 24.69s/it]

Loss at Epoch 4 is 2.478059468558058e-05
5


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:22<00:00,  3.55it/s]
 12%|███████████▋                                                                                     | 6/50 [02:32<17:29, 23.86s/it]

Loss at Epoch 5 is 1.9240308471194977e-05
6


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:22<00:00,  3.54it/s]
 14%|█████████████▌                                                                                   | 7/50 [02:54<16:44, 23.35s/it]

Loss at Epoch 6 is 1.6860245995292046e-05
7


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:22<00:00,  3.49it/s]
 16%|███████████████▌                                                                                 | 8/50 [03:17<16:11, 23.13s/it]

Loss at Epoch 7 is 1.5272544962637675e-05
8


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:22<00:00,  3.49it/s]
 18%|█████████████████▍                                                                               | 9/50 [03:39<15:42, 22.98s/it]

Loss at Epoch 8 is 1.3624777958411179e-05
9


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:22<00:00,  3.57it/s]
 20%|███████████████████▏                                                                            | 10/50 [04:02<15:09, 22.73s/it]

Loss at Epoch 9 is 1.1851925240920583e-05
10


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:21<00:00,  3.63it/s]
 22%|█████████████████████                                                                           | 11/50 [04:23<14:34, 22.43s/it]

Loss at Epoch 10 is 1.069536498521935e-05
11


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:22<00:00,  3.49it/s]
 24%|███████████████████████                                                                         | 12/50 [04:46<14:14, 22.49s/it]

Loss at Epoch 11 is 9.030271790327823e-06
12


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:21<00:00,  3.65it/s]
 26%|████████████████████████▉                                                                       | 13/50 [05:08<13:42, 22.23s/it]

Loss at Epoch 12 is 8.57039296096434e-06
13


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:21<00:00,  3.64it/s]
 28%|██████████████████████████▉                                                                     | 14/50 [05:29<13:14, 22.07s/it]

Loss at Epoch 13 is 7.113708445011738e-06
14


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:22<00:00,  3.51it/s]
 30%|████████████████████████████▊                                                                   | 15/50 [05:52<12:57, 22.20s/it]

Loss at Epoch 14 is 6.820176121770681e-06
15


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:21<00:00,  3.63it/s]
 32%|██████████████████████████████▋                                                                 | 16/50 [06:14<12:30, 22.07s/it]

Loss at Epoch 15 is 7.995270175630554e-06
16


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:21<00:00,  3.61it/s]
 34%|████████████████████████████████▋                                                               | 17/50 [06:35<12:06, 22.01s/it]

Loss at Epoch 16 is 6.058377470875298e-06
17


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:21<00:00,  3.64it/s]
 36%|██████████████████████████████████▌                                                             | 18/50 [06:57<11:41, 21.91s/it]

Loss at Epoch 17 is 5.641387504718157e-06
18


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:21<00:00,  3.71it/s]
 38%|████████████████████████████████████▍                                                           | 19/50 [07:18<11:13, 21.72s/it]

Loss at Epoch 18 is 5.798946783872015e-06
19


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:22<00:00,  3.57it/s]
 40%|██████████████████████████████████████▍                                                         | 20/50 [07:41<10:55, 21.85s/it]

Loss at Epoch 19 is 5.299215922892886e-06
20


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:21<00:00,  3.61it/s]
 42%|████████████████████████████████████████▎                                                       | 21/50 [08:03<10:34, 21.87s/it]

Loss at Epoch 20 is 5.1705220541891e-06
21


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:22<00:00,  3.46it/s]
 44%|██████████████████████████████████████████▏                                                     | 22/50 [08:25<10:20, 22.16s/it]

Loss at Epoch 21 is 4.6248192998236735e-06
22


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:22<00:00,  3.59it/s]
 46%|████████████████████████████████████████████▏                                                   | 23/50 [08:47<09:57, 22.12s/it]

Loss at Epoch 22 is 4.62854646523542e-06
23


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:23<00:00,  3.36it/s]
 48%|██████████████████████████████████████████████                                                  | 24/50 [09:11<09:45, 22.53s/it]

Loss at Epoch 23 is 4.452135404398742e-06
24


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:22<00:00,  3.46it/s]
 50%|████████████████████████████████████████████████                                                | 25/50 [09:34<09:25, 22.62s/it]

Loss at Epoch 24 is 4.072229995483811e-06
25


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:22<00:00,  3.48it/s]
 52%|█████████████████████████████████████████████████▉                                              | 26/50 [09:56<09:03, 22.64s/it]

Loss at Epoch 25 is 1.759526992517047e-05
26


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:22<00:00,  3.53it/s]
 54%|███████████████████████████████████████████████████▊                                            | 27/50 [10:19<08:39, 22.57s/it]

Loss at Epoch 26 is 5.656104450062679e-06
27


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:21<00:00,  3.67it/s]
 56%|█████████████████████████████████████████████████████▊                                          | 28/50 [10:40<08:09, 22.26s/it]

Loss at Epoch 27 is 4.245485109705338e-06
28


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:20<00:00,  3.84it/s]
 58%|███████████████████████████████████████████████████████▋                                        | 29/50 [11:01<07:36, 21.76s/it]

Loss at Epoch 28 is 3.8940399975482375e-06
29


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:19<00:00,  3.99it/s]
 60%|█████████████████████████████████████████████████████████▌                                      | 30/50 [11:21<07:03, 21.17s/it]

Loss at Epoch 29 is 3.6950379229823786e-06
30


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:19<00:00,  4.03it/s]
 62%|███████████████████████████████████████████████████████████▌                                    | 31/50 [11:40<06:33, 20.70s/it]

Loss at Epoch 30 is 3.6019498882616306e-06
31


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:20<00:00,  3.85it/s]
 64%|█████████████████████████████████████████████████████████████▍                                  | 32/50 [12:01<06:11, 20.66s/it]

Loss at Epoch 31 is 3.4285886999032877e-06
32


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:20<00:00,  3.94it/s]
 66%|███████████████████████████████████████████████████████████████▎                                | 33/50 [12:21<05:48, 20.47s/it]

Loss at Epoch 32 is 3.292379685113195e-06
33


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:19<00:00,  4.01it/s]
 68%|█████████████████████████████████████████████████████████████████▎                              | 34/50 [12:41<05:23, 20.24s/it]

Loss at Epoch 33 is 3.2095431436838354e-06
34


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:19<00:00,  4.09it/s]
 70%|███████████████████████████████████████████████████████████████████▏                            | 35/50 [13:00<04:59, 19.97s/it]

Loss at Epoch 34 is 3.168618086765261e-06
35


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:19<00:00,  3.98it/s]
 72%|█████████████████████████████████████████████████████████████████████                           | 36/50 [13:20<04:38, 19.93s/it]

Loss at Epoch 35 is 8.333434774198671e-06
36


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:20<00:00,  3.88it/s]
 74%|███████████████████████████████████████████████████████████████████████                         | 37/50 [13:40<04:20, 20.05s/it]

Loss at Epoch 36 is 3.3926846898091617e-06
37


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:20<00:00,  3.80it/s]
 76%|████████████████████████████████████████████████████████████████████████▉                       | 38/50 [14:01<04:03, 20.28s/it]

Loss at Epoch 37 is 3.39230642347951e-06
38


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:21<00:00,  3.72it/s]
 78%|██████████████████████████████████████████████████████████████████████████▉                     | 39/50 [14:22<03:46, 20.56s/it]

Loss at Epoch 38 is 2.916753903517457e-06
39


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:19<00:00,  4.08it/s]
 80%|████████████████████████████████████████████████████████████████████████████▊                   | 40/50 [14:42<03:22, 20.21s/it]

Loss at Epoch 39 is 2.901803606584531e-06
40


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:19<00:00,  4.11it/s]
 82%|██████████████████████████████████████████████████████████████████████████████▋                 | 41/50 [15:01<02:59, 19.92s/it]

Loss at Epoch 40 is 4.182074019498239e-06
41


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:20<00:00,  3.82it/s]
 84%|████████████████████████████████████████████████████████████████████████████████▋               | 42/50 [15:21<02:41, 20.15s/it]

Loss at Epoch 41 is 3.045308291423024e-06
42


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:20<00:00,  3.92it/s]
 86%|██████████████████████████████████████████████████████████████████████████████████▌             | 43/50 [15:42<02:21, 20.15s/it]

Loss at Epoch 42 is 2.685852165731249e-06
43


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:20<00:00,  3.94it/s]
 88%|████████████████████████████████████████████████████████████████████████████████████▍           | 44/50 [16:02<02:00, 20.12s/it]

Loss at Epoch 43 is 2.5858972589325093e-06
44


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:19<00:00,  4.00it/s]
 90%|██████████████████████████████████████████████████████████████████████████████████████▍         | 45/50 [16:21<01:40, 20.02s/it]

Loss at Epoch 44 is 3.338356173462441e-06
45


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:19<00:00,  3.96it/s]
 92%|████████████████████████████████████████████████████████████████████████████████████████▎       | 46/50 [16:41<01:19, 19.99s/it]

Loss at Epoch 45 is 2.774286688783164e-06
46


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:20<00:00,  3.90it/s]
 94%|██████████████████████████████████████████████████████████████████████████████████████████▏     | 47/50 [17:02<01:00, 20.08s/it]

Loss at Epoch 46 is 2.287043862106887e-06
47


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:20<00:00,  3.85it/s]
 96%|████████████████████████████████████████████████████████████████████████████████████████████▏   | 48/50 [17:22<00:40, 20.20s/it]

Loss at Epoch 47 is 2.251011105266726e-06
48


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:19<00:00,  4.00it/s]
 98%|██████████████████████████████████████████████████████████████████████████████████████████████  | 49/50 [17:42<00:20, 20.07s/it]

Loss at Epoch 48 is 2.3481307961665613e-06
49


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 79/79 [00:20<00:00,  3.86it/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████| 50/50 [18:02<00:00, 21.66s/it]

Loss at Epoch 49 is 3.394654050922166e-06





In [13]:
# To view runs in tensorboard you can call either (uncommented):
%reload_ext tensorboard
!tensorboard --logdir logs --port 6009

TensorFlow installation not found - running with reduced feature set.
/home/evan/conda/envs/06_instance_segmentation/lib/python3.8/site-packages/tensorboard_data_server/bin/server: /lib/x86_64-linux-gnu/libc.so.6: version `GLIBC_2.29' not found (required by /home/evan/conda/envs/06_instance_segmentation/lib/python3.8/site-packages/tensorboard_data_server/bin/server)
/home/evan/conda/envs/06_instance_segmentation/lib/python3.8/site-packages/tensorboard_data_server/bin/server: /lib/x86_64-linux-gnu/libc.so.6: version `GLIBC_2.33' not found (required by /home/evan/conda/envs/06_instance_segmentation/lib/python3.8/site-packages/tensorboard_data_server/bin/server)
/home/evan/conda/envs/06_instance_segmentation/lib/python3.8/site-packages/tensorboard_data_server/bin/server: /lib/x86_64-linux-gnu/libc.so.6: version `GLIBC_2.28' not found (required by /home/evan/conda/envs/06_instance_segmentation/lib/python3.8/site-packages/tensorboard_data_server/bin/server)
/home/evan/conda/envs/06_instance

In [23]:
# Saving the model weights
state = model.state_dict()
filename = root_dir+'models/'+datetime.datetime.now().strftime("%Y%m%d-%H%M%S")+'.pt'
torch.save(state, filename)



In [None]:
# Saving the latent space

In [15]:
# To test: 
# Model depth, L1 loss

In [None]:
# To calculate: 
# IOU (segmentation performance), Pearson (reconstruction)

In [None]:
# UMAP 

In [None]:
# MOBIE 