# ДЗ №5 Сегментация
Реализация сети для сегметации объектов.

__Задача__ сделать работоспособную сеть для сегментирования изображений авто на основе предложенного шаблона


![Segmentation](../img/Segment04.png)

### Что делаем
Реализуем сверточную сеть для семантической сегментации, downsample->upsample -> Классификация каждого пикселя выходного изображения: 0 - не авто, 1 - авто. Выход картинка с x каналами, для классификации.
1. В файле model.py   - имплементировать модель вместо заглушки
2. В файле train.py - поставить правильный loss

### Данные
[Carvana](https://cloud.mail.ru/public/3tdq/AvtaHkDAb)

### Зависимости
 - tensorflow  - поддержка tensorboard
 - tensorboardx - тензор боард для pytorch
 - tqdm         - пакет для отрисовки прогресс баров

### Запуск пакета
_ По умолчанию все данные лежат в папке ./data/. Если вы положили их в другую папку, то поправте в скрипте train.py пути _
<br/>
Запускаем обучение сети
python train.py

Результаты обучение можно наблюдать в tensorboard

Запуск tensorboard --log ./od_log

## Результаты
1. Код model.py, train.py
2. Модель state_dicts()

### Тут нужно сделать загрузку состояния вашей модели, код модели в ноутбук тащить не нужно, достаточно сделать import model


In [1]:
import torch.utils.data as dt
import torch
import os
from PIL import Image
import torchvision.transforms as transforms
from torchvision.transforms import ToPILImage
to_img = ToPILImage()


class CarvanaDataset(dt.Dataset):
    """ 
        Carvana features dataset.  Override torch Dataset class to implements reading from h5 files

    """

    def __init__(self, data_path, mask_path, input_size=224):
        """
        Args:
            data_path (string): Path to the images data files.
            mask_path (string): Path were images masks are placed
        """
        self.files = os.listdir(data_path)
        self.files.sort()
        self.mask_files = os.listdir(mask_path)
        self.mask_files.sort()
        self.data_path = data_path
        self.mask_path = mask_path
        assert (len(self.files) == len(self.mask_files))
        self.input_size = input_size

        self.preprocess = transforms.Compose([
            transforms.Scale((input_size, input_size)),
            transforms.ToTensor()
        ])

    def __len__(self):
        return len(self.files)

    def pil_load(self, path, is_input=True):
        # open path as file to avoid ResourceWarning (https://github.com/python-pillow/Pillow/issues/835)
        with open(path, 'rb') as f:
            with Image.open(f) as img:
                return img.convert('RGB')

    def pil_save(self, t, img_path):
        a = to_img(t)
        a.save(img_path, 'PNG')

    def __getitem__(self, idx):
        f_name = os.path.join(self.data_path, self.files[idx])
        m_name = os.path.join(self.mask_path, self.mask_files[idx])

        if os.path.exists(f_name) == False:
            raise Exception('Missing file with name ' + f_name + ' in dataset')

        input = self.pil_load(f_name)
        target = self.pil_load(m_name, False)

        input = self.preprocess(input)
        target = self.preprocess(target)
        target = torch.sum(target, dim=0).unsqueeze(0)
        target[ torch.gt(target, 0) ] = 1

        return input, target


In [2]:
import torch.nn as nn


def conv_bn_relu(in_planes, out_planes, kernel=3, stride=1):
    net = nn.Sequential(nn.Conv2d(in_planes, out_planes, kernel_size=kernel, stride=stride, padding=1),
                        nn.BatchNorm2d(num_features=out_planes),
                        nn.ReLU(True))
    return net;

def transpose_conv_bn_relu(in_planes, out_planes, kernel=3, stride=1):
    net = nn.Sequential(nn.ConvTranspose2d(in_planes, out_planes, kernel_size=kernel, stride=stride, padding=1),
                        nn.BatchNorm2d(num_features=out_planes),
                        nn.ReLU(True))
    return net;

# input size Bx3x224x224
class SegmenterModel(nn.Module):
    def __init__(self, in_size=3):
        super(SegmenterModel, self).__init__()
        
        # implement your model here
        D1 = 128
        D2 = 256
        D3 = 512
        x = 2
        
        # in_size*224*224
        
        self.conv_bn_relu1 = nn.Sequential()                    
        self.conv_bn_relu1.add_module('conv_bn_relu1_1', conv_bn_relu(in_size, D1))
        self.conv_bn_relu1.add_module('conv_bn_relu1_2', conv_bn_relu(D1, D1))
        self.pool1 = nn.MaxPool2d(kernel_size=2, stride=2, return_indices=True)

        # D1*112*112
        
        self.conv_bn_relu2 = nn.Sequential()
        self.conv_bn_relu2.add_module('conv_bn_relu2_1', conv_bn_relu(D1, D2))
        self.conv_bn_relu2.add_module('conv_bn_relu2_2', conv_bn_relu(D2, D2))
        self.pool2 = nn.MaxPool2d(kernel_size=2, stride=2, return_indices=True)
        
        # D2*56*56
        
        self.conv_bn_relu3 = nn.Sequential()
        self.conv_bn_relu3.add_module('conv_bn_relu3_1', conv_bn_relu(D2, D3))
        self.conv_bn_relu3.add_module('conv_bn_relu3_2', conv_bn_relu(D3, D3))
        
        # D3*56*56
        
        self.transpose_conv_bn_relu3 = nn.Sequential()
        self.transpose_conv_bn_relu3.add_module('transpose_conv_bn_relu3_1', transpose_conv_bn_relu(D3, D3))
        self.transpose_conv_bn_relu3.add_module('transpose_conv_bn_relu3_2', transpose_conv_bn_relu(D3, D2))
        
        # D2*56*56
        
        self.unpool2 = nn.MaxUnpool2d(kernel_size=2, stride=2)
        self.transpose_conv_bn_relu2 = nn.Sequential()
        self.transpose_conv_bn_relu2.add_module('transpose_conv_bn_relu2_1', transpose_conv_bn_relu(D2, D2))
        self.transpose_conv_bn_relu2.add_module('transpose_conv_bn_relu2_2', transpose_conv_bn_relu(D2, D1))
        
        # D2*112*112
        
        self.unpool1 = nn.MaxUnpool2d(kernel_size=2, stride=2)
        self.transpose_conv_bn_relu1 = nn.Sequential()
        self.transpose_conv_bn_relu1.add_module('transpose_conv_bn_relu1_1', transpose_conv_bn_relu(D1, D1)) 
        self.transpose_conv_bn_relu1.add_module('transpose_conv_bn_relu1_2', transpose_conv_bn_relu(D1, D1))
        
        self.out = nn.Conv2d(D1, 2, kernel_size=3, padding=1, stride=1)
        # x*224*224
        
    def forward(self, x):
        
        output = self.conv_bn_relu1(x)
        output, indices1 = self.pool1(output)
        
        output = self.conv_bn_relu2(output)
        output, indices2 = self.pool2(output)
        
        output = self.conv_bn_relu3(output)
        output = self.transpose_conv_bn_relu3(output)
        
        output = self.unpool2(output, indices2)
        output = self.transpose_conv_bn_relu2(output)
        
        output = self.unpool1(output, indices1)
        output = self.transpose_conv_bn_relu1(output)

        return output

In [None]:
import torch
import torch.nn as nn
import torch.utils.data as dt
from torch.autograd import Variable
import torch.optim as optim
from tensorboardX import SummaryWriter
import os
from tqdm import *
import numpy as np

useCuda =True
n_epoch = 50
log = './log_1/'
train = './data/train/'
train_masks = './data/train_masks/'
test = './data/test/'
test_masks = './data/test_masks'

if os.path.exists(log) == False:
    os.mkdir(log)
tb_writer = SummaryWriter(log_dir='log_1')

if __name__ == '__main__':
    """
     Тут модель, которую мы реализовали в файле model.py
    """
    m = SegmenterModel()
    """
    Делаем критерий, который будем оптимайзить
    """
    criterion = nn.CrossEntropyLoss()
    optimizer = optim.Adam(m.parameters(), lr=0.001)

    if useCuda == True:
        m = m.cuda()
        criterion= criterion.cuda()

    ds = CarvanaDataset(train, train_masks)
    ds_test = CarvanaDataset(test, test_masks)

    dl      = dt.DataLoader(ds, shuffle=True, num_workers=4, batch_size=5)
    dl_test = dt.DataLoader(ds_test, shuffle=False, num_workers=4, batch_size=5)

    global_iter = 0
    for epoch in range(0, n_epoch):
        print ("Current epoch: ", epoch)
        epoch_loss = 0
        m.train(True)
        for iter, (i, t) in enumerate(tqdm( dl) ):
            i = Variable(i)
            t = Variable(t).long()
            if useCuda :
                i = i.cuda()
                t = t.cuda()
            o = m(i)
            t = t.view((t.shape[0], t.shape[2], t.shape[3]))
            loss = criterion(o, t)
            loss.backward()
            optimizer.step()

            global_iter += 1
            epoch_loss += loss.data

        epoch_loss = epoch_loss / float(len(ds))
        print ("Epoch loss", epoch_loss)
        tb_writer.add_scalar('Loss/Train', epoch_loss, epoch)

        print ("Make test")
        test_loss = 0
        m.train(False)

        tb_out = np.random.choice(range(0, len(dl_test)), 3 )
        for iter, (i, t) in enumerate(tqdm(dl_test)):
            i = Variable(i, volatile = True)
            t = Variable(t, volatile = True).long()
            if useCuda :
                i = i.cuda()
                t = t.cuda()
            o = m(i)
            t = t.view((t.shape[0], t.shape[2], t.shape[3]))
            loss = criterion(o, t)
            o = torch.argmax(o, dim=1)
            test_loss += loss.data

            for k, c in enumerate(tb_out):
                if c == iter:
                    tb_writer.add_image('Image/Test_input_%d'%k,  i[0].cpu(), epoch)  # Tensor
                    tb_writer.add_image('Image/Test_target_%d'%k, t[0].cpu(), epoch)  # Tensor
                    tb_writer.add_image('Image/Test_output_%d'%k, o[0].cpu(), epoch)  # Tensor

        test_loss = test_loss / float(len(ds_test))
        print ("Test loss", test_loss)
        tb_writer.add_scalar('Loss/Test', test_loss, epoch)


  0%|          | 0/916 [00:00<?, ?it/s]

Current epoch:  0


 12%|█▏        | 113/916 [00:42<05:02,  2.65it/s]

### Тут нужно нарисовать картинки, с результатими сегментации из тестового сета

In [2]:
# TODO
# Для рандомного изображения рисуем его маску сгенерированную сеткой, само изображение и результат сегментации