## 이 노드의 루브릭              
---           

1. U-NET을 통한 세그멘테이션 작업이 정상적으로 진행되었는가?             
    : KITTI 데이터셋 구성, U-NET 모델 훈련, 결과물 시각화의 사이클이 정상 수행되어 세그멘테이션 결과 이미지를 제출하였다.       
  
  
2. U-NET++ 모델이 성공적으로 구현되었는가?          
    : U-NET++ 모델을 스스로 구현하여 학습 진행 후 세그멘테이션 결과까지 정상 진행되었다.           
  
  
3. U-NET과 U-NET++ 두 모델의 성능이 정량적/정성적으로 잘 비교되었는가?                
    : U-NET++의 세그멘테이션 결과 사진과 IoU 계산치를 U-NET과 비교하여 우월함을 확인하였다.

## 목차            
---      

1. 데이터셋 준비와 U-NET 모델의 구성            
    -1. 데이터셋 준비          
    -2. U-NET 모델 구성                
    
    
2. U-NET++ 모델의 구성         
    -1. U-NET++ 모델 논문 요약               
    -2. U-NET++ 모델 구성          
    -3. U-NET++ 모델 훈련               
    
    
3. 훈련 성과 비교            
    -1. U-NET의 IoU           
    -2. U-NET++의 IoU             
    -3. 비교 및 결과 요약                  

## 1. 데이터셋 준비와 U-NET 모델의 구성          
---

### 1. 데이터셋 준비(KITTI 데이터셋의 세그멘테이션 데이터 로드)

![키티데이터셋](./PostingPic/8_kitti.png)

- KITTI 데이터셋을 로드한다.

### 필요한 라이브러리 로드

In [1]:
import os
import math
import numpy as np
import tensorflow as tf

from PIL import Image
import matplotlib.pyplot as plt

from skimage.io import imread
from skimage.transform import resize
from glob import glob

# import *: 해당 모듈의 모든 함수들을 import
from tensorflow.keras.models import *
from tensorflow.keras.layers import *
from tensorflow.keras.optimizers import *

print('필요한 라이브러리 임포트 완료')

필요한 라이브러리 임포트 완료


In [2]:
#다운로드한 데이터셋 위치
imagedata_path = os.getenv('HOME')+'/AI_J/GoingDeeper/Semantic_data/'
training_path = 'training/image_2'
test_path = 'testing/image_2'

### 데이터셋을 준비하기 위한 Augmentation 함수 정의

In [3]:
from albumentations import HorizontalFlip, RandomSizedCrop, Compose, OneOf, Resize

def augmentations(is_train=True):
    
    if is_train:
        return Compose([
            #적용할 확률
            HorizontalFlip(p=0.5),
            RandomSizedCrop(
            min_max_height=(300,370),
            w2h_ratio=370/1242,
            #모델에 투입할 사이즈대로 조절하기 위해 h,w = (224, 224)
            height=224,
            width=224,
            p=0.5),
            Resize(width=224,height=224)
        ])
   
    #훈련셋이 아닌 경우는 사이즈 조절만 수행함
    return Compose([Resize(width=224,height=224)])

#### 데이터셋 구성

In [4]:
augmentation = augmentations()

#훈련 데이터셋 위치의 이미지들을 모두 가져옴
input_images = glob(os.path.join(imagedata_path, training_path, "/*.png"))

In [5]:
print(os.path.join(imagedata_path, training_path))

/home/ssac23/AI_J/GoingDeeper/Semantic_data/training/image_2


In [23]:
class KittiGenerator(tf.keras.utils.Sequence):
    def __init__(self, 
               imagedata_path,
               batch_size=16,
               image_size=(224, 224, 3),
               output_size=(224, 224),
               is_train=True,
               augmentation=None):
        self.batch_size = batch_size
        self.is_train = is_train
        self.imagedata_path = imagedata_path
        self.augmentation = augmentation
        self.image_size = image_size
        self.output_size = output_size

        # load_dataset()을 통해서 kitti dataset의 directory path에서 라벨과 이미지를 확인합니다.
        self.data = self.load_dataset()
        
    
    def load_dataset(self):
        
        #인풋 이미지
        input_images = glob(os.path.join(imagedata_path, training_path, '/*.png'))
        label_images = glob(os.path.join(imagedata_path, '/training/semantic/*.png'))
        
        #불러온 데이터셋을 sort함
        input_images.sort()
        label_images.sort()
                           
        assert len(input_images) == len(label_images)
        
        data = [_ for _ in zip(input_images, label_images)]
        
        #테스트셋 분리작업
        if self.is_train:
            return data[:-30]
        return data[-30:]
    
    def __len__(self):
        return math.ceil(len(self.data)/self.batch_size)
    
    def __getitem__(self, index):
        batch_data = self.data[
            index * self.batch_size:(index+1)*self.batch_size
        ]
        
        inputs = np.zeros([self.batch_size, *self.image_size])
        outputs = np.zeros([self.batch_size, *self.output_size])
        
        for i, data in enumerate(batch_data):
            input_image_path, output_image_path = data
            _input = imread(input_image_path)
            _output = imread(output_path)
            _output = (_output==7).astype(np.uint8)*1
            data = {"image": _input,"mask": _output,}
            
            augmented = augmentation(**data)
            
            #이미지는 augmented를 거쳐 반환
            inputs[i]= augmented["image"]/255
            outputs[i]= augmented["mask"]
            
            return inputs, outputs
        
    def on_epoch_end(self):
        
        #인덱스를 섞어 적용할 수 있도록
        self.indexes = np.arange(len(self.data))
        
        if self.is_train == True:
            np.random.shuffle(self.indexes)
            return self.indexes

In [10]:
augmentation = augmentations()
test_augmentation = augmentations(is_train=False)

In [25]:
train_generator= KittiGenerator(imagedata_path,augmentation=augmentation)
test_generator = KittiGenerator(imagedata_path,augmentation=test_augmentation, is_train=False)

### 2.U-Net 모델 구성

- 논문 모델 구조 파악

![유넷](./PostingPic/8_unet.png)

- 논문에서 나온 위의 그림을 참고하여 확인해보자.            

- 1. 각 층의 conv(3*3) + ReLU로 구성되어 있다. 
- 2. 다음 층으로 넘어갈 때는 maxPooling 층을 거친다.
- 3. 각 층의 채널은 점차 증가하여, 5번째 층에서 1024의 정점을 찍는다.          
- 4. 이후는 점차 채널의 수를 줄여가며 2채널로 이루어진 output을 낸다.

#### 논문의 implement 확인

#### 위의 분석에 따른 모델 구현

In [28]:
def unet_model_build(input_shape=(224, 224, 3)):
    
    #첫 인풋 이미지
    inputs = Input(input_shape)
    
    #1계층 세트
    #동일 구조를 4번 반복한다.
    #Contracting_path
    conv1 = Conv2D(64,3,activation='relu',padding='same', kernel_initializer='he_normal')(inputs)
    conv1 = Conv2D(64,3,activation='relu',padding='same', kernel_initializer='he_normal')(conv1)
    pool1 = MaxPooling2D(pool_size=(2,2))(conv1)
    
    conv2 = Conv2D(128,3,activation='relu',padding='same', kernel_initializer='he_normal')(pool1)
    conv2 = Conv2D(128,3,activation='relu',padding='same', kernel_initializer='he_normal')(conv2)
    pool2 = MaxPooling2D(pool_size=(2,2))(conv2)
    
    conv3 = Conv2D(256,3,activation='relu',padding='same', kernel_initializer='he_normal')(pool2)
    conv3 = Conv2D(256,3,activation='relu',padding='same', kernel_initializer='he_normal')(conv3)
    pool3 = MaxPooling2D(pool_size=(2,2))(conv3)
    
    conv4 = Conv2D(512,3,activation='relu',padding='same', kernel_initializer='he_normal')(pool3)
    conv4 = Conv2D(512,3,activation='relu',padding='same', kernel_initializer='he_normal')(conv4)
    drop4 = Dropout(0.5)(conv4)
    pool4 = MaxPooling2D(pool_size=(2,2))(drop4)
    
    conv5 = Conv2D(1024,3,activation='relu', padding='same', kernel_initializer='he_normal')(pool4)
    conv5 = Conv2D(1024,3,activation='relu', padding='same', kernel_initializer='he_normal')(conv5)
    
    
    #Expanding_path
    #여기부터는 up_conv 연산을 거치게 된다.
    drop5 = Dropout(0.5)(conv5)
    up6 = Conv2DTranspose(512,2,activation='relu', strides=(2,2), kernel_initializer='he_normal')(drop5)
    #이전의 층에서 수행한 결과값을 바탕으로 concatenate연산을 통해 합쳐준다.
    merge6 = concatenate([conv4, up6], axis=3)
    #여기까지의 블록을 4차례 반복한다.
    
    conv6 = Conv2D(512, 3, activation='relu',padding='same', kernel_initializer='he_normal')(merge6)
    conv6 = Conv2D(512, 3, activation='relu',padding='same', kernel_initializer='he_normal')(conv6)
    up7 = Conv2DTranspose(256,2,activation='relu', strides=(2,2), kernel_initializer='he_normal')(conv6)
    merge7 = concatenate([conv3, up7], axis=3)
    
    conv6 = Conv2D(512, 3, activation='relu',padding='same', kernel_initializer='he_normal')(merge6)
    conv6 = Conv2D(512, 3, activation='relu',padding='same', kernel_initializer='he_normal')(conv6)
    up7 = Conv2DTranspose(256,2,activation='relu', strides=(2,2), kernel_initializer='he_normal')(conv6)
    merge7 = concatenate([conv3, up7], axis=3)
    
    conv7 = Conv2D(256, 3, activation='relu',padding='same', kernel_initializer='he_normal')(merge7)
    conv7 = Conv2D(256, 3, activation='relu',padding='same', kernel_initializer='he_normal')(conv7)
    up8 = Conv2DTranspose(128,2,activation='relu', strides=(2,2), kernel_initializer='he_normal')(conv7)
    merge8 = concatenate([conv2, up8], axis=3)
    
    conv8 = Conv2D(128, 3, activation='relu',padding='same', kernel_initializer='he_normal')(merge8)
    conv8 = Conv2D(128, 3, activation='relu',padding='same', kernel_initializer='he_normal')(conv8)
    up9 = Conv2DTranspose(64,2,activation='relu', strides=(2,2), kernel_initializer='he_normal')(conv8)
    merge9 = concatenate([conv1, up9], axis=3)
    
    conv9 = Conv2D(64, 3, activation='relu',padding='same', kernel_initializer='he_normal')(merge9)
    conv9 = Conv2D(64, 3, activation='relu',padding='same', kernel_initializer='he_normal')(conv9)
    conv9 = Conv2D(2, 3, activation='relu',padding='same', kernel_initializer='he_normal')(conv9)
    conv10 = Conv2D(1, 1, activation='sigmoid')(conv9)
    
    model = Model(inputs = inputs, outputs=conv10)
    
    return model

#### 모델 만들기

In [30]:
unet_model = unet_model_build()

unet_model.summary()

Model: "model_1"
__________________________________________________________________________________________________
Layer (type)                    Output Shape         Param #     Connected to                     
input_3 (InputLayer)            [(None, 224, 224, 3) 0                                            
__________________________________________________________________________________________________
conv2d_34 (Conv2D)              (None, 224, 224, 64) 1792        input_3[0][0]                    
__________________________________________________________________________________________________
conv2d_35 (Conv2D)              (None, 224, 224, 64) 36928       conv2d_34[0][0]                  
__________________________________________________________________________________________________
max_pooling2d_8 (MaxPooling2D)  (None, 112, 112, 64) 0           conv2d_35[0][0]                  
____________________________________________________________________________________________

- 파라미터의 수를 논문과 비교했을 때, 

#### 모델 훈련

In [31]:
# unet_model.compile(optimizer=Adam(lr=1e-4), loss='binary_crossentropy')

# #아래의 설정으로 훈련시킴
# unet_model.fit_generator(generator=train_generator, validation_data=test_generator, 
#                     steps_per_epoch=len(train_generator),epochs=100)

# unet_model_path = imagedata_path + '/model_his/seg_model_unet.h5'
# unet_model.save(unet_model_path)

## U-NET++ 모델의 구성              
---

![유넷++이미지](./PostingPic/8_unet++.png)

### 1. U-NET++ 모델 논문 요약         
---

#### 3. Proposed Network Architecture : UNet++        

- UNet++ 는 엔코더 서브 네트워크/백본 네트워크로 시작하여 디코더 서브 네트워크로 이어진다.     
- UNet++가 UNet과 구분되는 점은
    1. 재구성된 skip pathways(초록, 파랑 선으로 구분되어 있는 선) 
        - a. skip pathways에서 두 개의 서브 네트워크를 연결한다.
        - b. deep supervision(빨간색 선)을 사용한다.

#### 3-1. Re-Designed Skip pathways
- 재구성된 skip pathways는 인코더와 디코더의 서브 네트워크를 연결한다.       
- U-Net에서 인코더의 피쳐 맵은 곧바로 디코더로 연결되었으나, 
- UNet++에서는 __인코더의 피쳐 맵이 pyramid level에 따른 CNN layer와 Dense 레이어를 통과하도록__ 하였다.     


- dense convolution block은 인코더의 피쳐 맵의 semantic level을 decoder의 것과 비슷하게 가져온다.    
- 이는 최적화에 있어서 디코더의 피쳐 맵과 semantic 하게 비슷한 인코더의 피쳐 맵을 받아온다면, 최적화 문제를 보다 쉽게 해결할 수 있을 것이라는 가정을 바탕으로 고안되었다.      

- 결국, 우리는 skip pathway를 다음과 같이 고안한다.

![수식](./PostingPic/8_수식.png)

1. $X^{i,j}$ 에서, $i$는 인코더에서의 down-sampling layer, $j$는 skip-pathway를 따라간 convolution layer의 dense block을 의미한다.          
2. 피쳐 맵의 stack을 $X^{i,j}$ 라고 나타내기로 하고, 위의 수식과 같은 방법으로 산출한다.        
3. $H(x)$는 activation function이 이어지는 convolution operation 이다.     
4. $U(')$는 up-sampling layer를 의미하며, $[]$는 concatenation layer이다.

#### 3-2. Deep supervision 

- UNet++에서 deep supervision을 제안하였다.          
- 이에 따르면, 모델은 두 가지 모드에 따라 작동하게 된다.           
    1. accurate mode : 모든 segmentation branch가 평균내어진 아웃풋이 반영되는 모드       
    2. fast mode : 최종 segmentation map은 하나의 segmentation branch에서만 선택하여 반영하되, 그 선택은 스피드와 '가지치기' 가 반영된다.        
    
    
- 이전에 설명한 skip pathway에 의해, UNet++은 deep supervision을 적용한 다중 semantic level에 대한 full resolution features를 산출하게 된다.     

> {$X^{0, j}, j \in {1,2,3,4}$}

In [None]:
- 우리는 binary cross entropy와 

### 2. U-NET++ 모델 구성           
---

In [None]:
- 커널 

In [None]:
def unetplus_model_build(input_shape=(224, 224, 3)):
    
    #첫 인풋 이미지
    inputs = Input(input_shape)
    
    #1계층 세트
    #동일 구조를 4번 반복한다.
    #Baseline 
    conv1 = Conv2D(64,3,activation='relu',padding='same', kernel_initializer='he_normal')(inputs)
    conv1 = Conv2D(64,3,activation='relu',padding='same', kernel_initializer='he_normal')(conv1)
    pool1 = MaxPooling2D(pool_size=(2,2))(conv1)
    
    conv2 = Conv2D(128,3,activation='relu',padding='same', kernel_initializer='he_normal')(pool1)
    conv2 = Conv2D(128,3,activation='relu',padding='same', kernel_initializer='he_normal')(conv2)
    pool2 = MaxPooling2D(pool_size=(2,2))(conv2)
    
    conv3 = Conv2D(256,3,activation='relu',padding='same', kernel_initializer='he_normal')(pool2)
    conv3 = Conv2D(256,3,activation='relu',padding='same', kernel_initializer='he_normal')(conv3)
    pool3 = MaxPooling2D(pool_size=(2,2))(conv3)
    
    conv4 = Conv2D(512,3,activation='relu',padding='same', kernel_initializer='he_normal')(pool3)
    conv4 = Conv2D(512,3,activation='relu',padding='same', kernel_initializer='he_normal')(conv4)
    drop4 = Dropout(0.5)(conv4)
    pool4 = MaxPooling2D(pool_size=(2,2))(drop4)
    
    conv5 = Conv2D(1024,3,activation='relu', padding='same', kernel_initializer='he_normal')(pool4)
    conv5 = Conv2D(1024,3,activation='relu', padding='same', kernel_initializer='he_normal')(conv5)
    
    
    #Expanding_path
    #여기부터는 up_conv 연산을 거치게 된다.
    drop5 = Dropout(0.5)(conv5)
    up6 = Conv2DTranspose(512,2,activation='relu', strides=(2,2), kernel_initializer='he_normal')(drop5)
    #이전의 층에서 수행한 결과값을 바탕으로 concatenate연산을 통해 합쳐준다.
    merge6 = concatenate([conv4, up6], axis=3)
    #여기까지의 블록을 4차례 반복한다.
    
    conv6 = Conv2D(512, 3, activation='relu',padding='same', kernel_initializer='he_normal')(merge6)
    conv6 = Conv2D(512, 3, activation='relu',padding='same', kernel_initializer='he_normal')(conv6)
    up7 = Conv2DTranspose(256,2,activation='relu', strides=(2,2), kernel_initializer='he_normal')(conv6)
    merge7 = concatenate([conv3, up7], axis=3)
    
    conv6 = Conv2D(512, 3, activation='relu',padding='same', kernel_initializer='he_normal')(merge6)
    conv6 = Conv2D(512, 3, activation='relu',padding='same', kernel_initializer='he_normal')(conv6)
    up7 = Conv2DTranspose(256,2,activation='relu', strides=(2,2), kernel_initializer='he_normal')(conv6)
    merge7 = concatenate([conv3, up7], axis=3)
    
    conv7 = Conv2D(256, 3, activation='relu',padding='same', kernel_initializer='he_normal')(merge7)
    conv7 = Conv2D(256, 3, activation='relu',padding='same', kernel_initializer='he_normal')(conv7)
    up8 = Conv2DTranspose(128,2,activation='relu', strides=(2,2), kernel_initializer='he_normal')(conv7)
    merge8 = concatenate([conv2, up8], axis=3)
    
    conv8 = Conv2D(128, 3, activation='relu',padding='same', kernel_initializer='he_normal')(merge8)
    conv8 = Conv2D(128, 3, activation='relu',padding='same', kernel_initializer='he_normal')(conv8)
    up9 = Conv2DTranspose(64,2,activation='relu', strides=(2,2), kernel_initializer='he_normal')(conv8)
    merge9 = concatenate([conv1, up9], axis=3)
    
    conv9 = Conv2D(64, 3, activation='relu',padding='same', kernel_initializer='he_normal')(merge9)
    conv9 = Conv2D(64, 3, activation='relu',padding='same', kernel_initializer='he_normal')(conv9)
    conv9 = Conv2D(2, 3, activation='relu',padding='same', kernel_initializer='he_normal')(conv9)
    conv10 = Conv2D(1, 1, activation='sigmoid')(conv9)
    
    model = Model(inputs = inputs, outputs=conv10)
    
    return model

### 3. U-NET++ 모델 훈련            
---