# Deconvolution
Convolution Layer는 Convolution 연산을 통해 Feature map의 크기를 줄이고 특정 Feature를 추출하는 역할을 담당하고 있습니다.

이와 반대로 Deconvolution은 Feature map의 크기를 증가시키는 방식으로 동작합니다.

---------------------
* tf.keras.layers.Conv2DTranspose()
    * filters : Output filter 개수
    * kernel_size : Convolution Kernel의 크기
    * padding : same or valid
    * strides : Kernel이 움직이는 폭
    
--------------------------
* Deconvolution 동작 방식

https://kasausyrzlhe1066469.cdn.ntruss.com/global/file/p/5d3aa68ca555dd7d27452d50/99CA8E3359FE990510.gif

Deconvolution은 픽셀 주위에 Zero padding을 통해 feature map의 크기를 우선 늘려줍니다.

그 후 늘어난 feature map에 Convolution 연산을 해줍니다.

Deconvolution은 CNN의 결과물을 반대로 되돌려 Input과 같은 사이즈를 만들때 사용합니다. 이를 통해 Segmentation이나 CNN Visualization에 사용됩니다.

### 실습
임의의 Feature map feature_map을 tuple 형태로 선언해주세요.

Conv2DTranspose로 Deconvolution layer를 쌓아보세요.  
(Conv2DTranspose sample codes https://www.programcreek.com/python/example/93303/keras.layers.convolutional.Conv2DTranspose)

Deconv_model의 결과 Shape이 임의의 이미지 image_size와 같아지도록 모델을 구성해보세요.

In [1]:
import numpy as np
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.layers import Input, Dense, Conv2DTranspose, MaxPooling2D, AveragePooling2D, Dropout, Flatten, concatenate
from tensorflow.keras.models import Model


# 입력 이미지의 Shape입니다.
image_size = (256, 256, 3)

# TODO : 임의의 Feature map (16,16,64)을 만들어줍니다.
feature_map = (16,16,64)

# Deconvolution Model입니다.
Deconv_model = keras.Sequential([
# TODO : Conv2DTranspose를 4층 이상 쌓아보세요.
keras.layers.Conv2DTranspose(input_shape =feature_map ,filters= 32, kernel_size=(3,3), strides = 2, padding='same'),
keras.layers.Conv2DTranspose(filters=16,kernel_size=(3,3),strides = 2, padding='same'),
keras.layers.Conv2DTranspose(filters=8,kernel_size=(3,3), strides = 2, padding='same'),

# TODO : 마지막 Conv2DTranspose를 통해 입력 이미지의 Shape과 같은 (256,256,3)의 Shape을 만들어주세요.
keras.layers.Conv2DTranspose(filters=3,kernel_size = (3,3), strides =2, padding='same')
])   #rgb chenal 이 filters 수 = 3
# Deconvolution Model 구조 출력
Deconv_model.summary()

# image_size와 Deconv_model의 결과 Shape 비교
if image_size == Deconv_model.layers[-1].output_shape[1:4]:
    print('Feature Map을 입력 이미지의 Shape과 똑같이 복원해냈습니다.')
else:
    print('입력 이미지의 Shape과 Output Feature map의 Shape이 다릅니다.')


W0807 00:12:03.701199 15520 __init__.py:308] Limited tf.compat.v2.summary API due to missing TensorBoard installation.
W0807 00:12:04.977176 15520 __init__.py:335] Limited tf.summary API due to missing TensorBoard installation.


Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d_transpose (Conv2DTran (None, 32, 32, 32)        18464     
_________________________________________________________________
conv2d_transpose_1 (Conv2DTr (None, 64, 64, 16)        4624      
_________________________________________________________________
conv2d_transpose_2 (Conv2DTr (None, 128, 128, 8)       1160      
_________________________________________________________________
conv2d_transpose_3 (Conv2DTr (None, 256, 256, 3)       219       
Total params: 24,467
Trainable params: 24,467
Non-trainable params: 0
_________________________________________________________________
Feature Map을 입력 이미지의 Shape과 똑같이 복원해냈습니다.


# CNN Visualization
CNN에서 Convolution kernel의 효과가 있는지 판단하기 위해 CNN 시각화를 합니다.

즉, Convolution Layer에 있는 필터들의 역할을 눈으로 볼수 있게 만드는 것입니다.

이번 실습에서는 간단한 CNN을 학습시키고 각 Layer의 결과를 뽑아 시각화를 진행해보겠습니다.

* model.layers : model안의 Layer 정보를 return 합니다.

* model.layers.output : 각 Layer의 output을 return 합니다.

### 실습
작성된 코드를 보고 이해해보세요.

layer_outputs에 layer의 output을 모두 저장해보세요.

display_feature_map()의featuremap_index를 바꿔가며 각 Layer 별 시각화 결과를 확인해보세요.

In [2]:
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.layers import Input, Dense, Conv2D, Activation,MaxPooling2D,Dropout ,BatchNormalization, Flatten
from tensorflow.keras.models import Model
from tensorflow.keras.utils import to_categorical

# 각 Layer의 결과를 시각화하기 위한 함수입니다.
def display_feature_map(feature_maps, col_size, row_size, featuremap_index): 
    activation = feature_maps[featuremap_index]
    activation_index=0
    fig, ax = plt.subplots(row_size, col_size)
    for row in range(0,row_size):
        for col in range(0,col_size):
            ax[row][col].imshow(activation[0, :, :, activation_index], cmap='gray')
            activation_index += 1
#     fig.savefig('plot.png')

# CNN 모델입니다.
def CNN():
    Shape=(28,28,1)
    inputs = Input(Shape)

    x = Conv2D(64,(3,3),strides = (1,1),name='layer_conv1',padding='same')(inputs)
    x = Activation('relu')(x)
    x = MaxPooling2D((2,2),name='maxPool1')(x)

    x = Conv2D(64,(3,3),strides = (1,1),name='layer_conv2',padding='same')(x)
    x = Activation('relu')(x)
    x = MaxPooling2D((2,2),name='maxPool2')(x)

    x = Conv2D(32,(3,3),strides = (1,1),name='conv3',padding='same')(x)
    x = Activation('relu')(x)
    x = MaxPooling2D((2,2),name='maxPool3')(x)

    x = Flatten()(x)
    x = Dense(64,activation = 'relu',name='fc0')(x)
    x = Dense(32,activation = 'relu',name='fc1')(x)
    x = Dense(10,activation = 'softmax',name='fc2')(x)

    model = Model(inputs = [inputs],outputs = [x], name='Predict')
    
    return model

# MNIST 데이터 세트를 불러옵니다.
mnist = np.load('./data/mnist.npz')
# 중간의 Feature map만을 보기위해 Train data만 사용합니다.
X_train, y_train= mnist['x_train'][:2000], mnist['y_train'][:2000]


# MNIST 데이터 전처리
X_train = X_train.astype(np.float32) / 255.
X_train = np.expand_dims(X_train, axis=-1)
y_train = to_categorical(y_train, 10)

# Model을 불러옵니다.
model = CNN()
model.summary()

# Model을 학습합니다.
model.compile(optimizer = 'adam', loss = 'mse', metrics = ['accuracy'])
model.fit(X_train, y_train, epochs = 5, batch_size = 100, verbose = 2)

# TODO : 각 Layer의 Output을 모두 저장합니다.
layer_outputs = [layer.output for layer in model.layers]

# 각 LAyer별로 Output을 뽑아내기 위해 Model로 만들어줍니다.
visualize_model = Model(inputs=model.input, outputs=layer_outputs)

# MNIST 이미지 한장을 넣어 모든 Layer의 Feature map의 결과를 뽑아냅니다.
feature_maps = visualize_model.predict(X_train[10].reshape(1,28,28,1))

# Feature Map을 시각화 합니다.
display_feature_map(feature_maps, 5, 5, 1)


Model: "Predict"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_1 (InputLayer)         [(None, 28, 28, 1)]       0         
_________________________________________________________________
layer_conv1 (Conv2D)         (None, 28, 28, 64)        640       
_________________________________________________________________
activation (Activation)      (None, 28, 28, 64)        0         
_________________________________________________________________
maxPool1 (MaxPooling2D)      (None, 14, 14, 64)        0         
_________________________________________________________________
layer_conv2 (Conv2D)         (None, 14, 14, 64)        36928     
_________________________________________________________________
activation_1 (Activation)    (None, 14, 14, 64)        0         
_________________________________________________________________
maxPool2 (MaxPooling2D)      (None, 7, 7, 64)          0   

# 영상 분할 (Image Segmentation)
Semantic Segmentation은 컴퓨터 비전 분야에서 많이 연구되어온 분야입니다. 사진에서 물체 (Object)를 찾고 물체와 배경을 분리해내는 작업을 Semantic Segmentation이라고 합니다.

Semantic Segmentation은 Classification, Detection 과도 많은 연관이 있으며, 픽셀 단위의 예측을 수행하여 대상을 분리해냅니다.

https://kasausyrzlhe1066469.cdn.ntruss.com/global/file/p/5d3abb162052a63e723df2bb/segmentation.JPG

이번 실습에서는 간단하게 Fully Convolution Network로 만든 Segmentation model이 어떻게 구성되어있는지 알아보겠습니다.

## FCN
FCN은 Fully Convolution Network의 약자로 CNN을 기반으로 이루어져 있습니다.

https://kasausyrzlhe1066469.cdn.ntruss.com/global/file/p/5d3abbf758509f97fffb9b27/segmentation_architecture.JPG

기존의 CNN과 다른점은 모델의 뒤쪽에서 fully connected layer를 사용하지 않고 1 x 1 Convolution layer를 사용하여 Segmentation을 진행합니다.

그리고 모델의 마지막 단에서 Upsampling을 통해 줄어든 Feature map의 크기를 다시 키우는 작업을 수행합니다.

-----------------------
* tf.keras.layers.UpSampling2D()
    * size : Upsampling을 위한 factor 값
    * interpolation : Upsampling 시 늘어난 feature map 안을 채울 방법을 선택합니다. (nearest or bilinear)
    
관련 링크

https://people.eecs.berkeley.edu/~jonlong/long_shelhamer_fcn.pdf  
https://www.tensorflow.org/api_docs/python/tf/keras/layers/UpSampling2D  
### 실습
Segmentation()을 완성해보세요.

Segmentation()의 결과 Shape이 임의의 이미지 image_shape와 같아지도록 모델을 구성해보세요.

In [3]:
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.layers import Input, Dense, Conv2D, UpSampling2D, AveragePooling2D, Dropout, Flatten, concatenate
from tensorflow.keras.models import Model

# 임의의 이미지 Shape
image_shape = (256,256,3)

# 간단한 Segmetation Model입니다.
def Segmentation():
    shape = (256,256,3)
    inputs = Input(shape)
    
    # TODO : 4 층의 3 x 3 Convolution Layer를 쌓아보세요. (padding = 'same', strides = 2)
    conv1 = Conv2D(64,(3,3),strides = 2,padding='same')(inputs)
    conv2 = Conv2D(64,(3,3),strides = 2,padding='same')(conv1)
    conv3 = Conv2D(32,(3,3),strides = 2,padding='same')(conv2)
    conv4 = Conv2D(64,(3,3),strides = 2,padding='same')(conv3)
    
    # TODO : 3 층의 1 x 1 Convolution Layer를 쌓아보세요. (padding = 'same', strides = 1)
    conv5 = Conv2D(32,(1,1),strides = 1,padding='same')(conv4)
    conv6 = Conv2D(16,(1,1),strides = 1,padding='same')(conv5)
    conv7 = Conv2D(filters=3,kernel_size=(1,1),strides = 1,padding='same',activation = 'relu')(conv6)
    
    # TODO : Upsampling을 통해 image_shape와 같은 (256,256,3)의 output을 만들어보세요.
    upsampling = UpSampling2D(size = (16,16))(conv7)
    
    # 쌓은 Layer들을 모델로 만들어줍니다.
    model = Model(inputs = [inputs], outputs = [upsampling])
    
    return model
    
seg_model = Segmentation()
seg_model.summary()

# image_shape와 seg_model의 결과 Shape 비교
if image_shape == seg_model.layers[-1].output_shape[1:4]:
    print('Segmentation을 입력 이미지의 크기와 똑같이 복원해냈습니다.')
else:
    print('입력 이미지의 크기와 Model Output Shape이 다릅니다.')

Model: "model_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_2 (InputLayer)         [(None, 256, 256, 3)]     0         
_________________________________________________________________
conv2d (Conv2D)              (None, 128, 128, 64)      1792      
_________________________________________________________________
conv2d_1 (Conv2D)            (None, 64, 64, 64)        36928     
_________________________________________________________________
conv2d_2 (Conv2D)            (None, 32, 32, 32)        18464     
_________________________________________________________________
conv2d_3 (Conv2D)            (None, 16, 16, 64)        18496     
_________________________________________________________________
conv2d_4 (Conv2D)            (None, 16, 16, 32)        2080      
_________________________________________________________________
conv2d_5 (Conv2D)            (None, 16, 16, 16)        528 

# Object Detection Case
Object Detection은 두 가지 경우가 있습니다.

1. Classification과 Localization를 동시에 수행하는 경우

2. Localization를 먼저 수행 후 Classification을 수행하는 경우

이번 실습에서는 1번 Case의 간단한 Object Detection Model 구조를 확인해보겠습니다.

관련 자료 -https://arxiv.org/pdf/1311.2524.pdf

### 실습
작성된 Object_Detection Class를 보고 이해해보세요.

summary()를 통해 모델의 전체 구조를 확인해보세요.

In [4]:
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.layers import Input, Dense, Conv2D, Activation, BatchNormalization, Flatten, concatenate, Reshape
from tensorflow.keras.models import Model

class Object_Detection(Model):
    # Keras에 내장되어 있는 CNN 모델을 불러옵니다.
    # 객체를 검출하기 이전에 CNN을 통해 Feature를 추출하는 Model입니다.
    def cnn(input_width = 224, input_height = 224):
        return keras.applications.MobileNet(include_top=False, input_shape=(input_height, input_width, 3), weights='imagenet', alpha=0.25)

    # region()은 CNN을 거친 Feature map을 받았을 때 현재 위치에 Object가 있는지 없는지의 여부를 판단하는 Model입니다.
    # Regien Proposal Network (RPN)
    def region(region_input):
        # CNN의 Feature map을 받아 Object가 있는지 없는지를 판단합니다.
        # RPN은 sliding window에 3 x 3 convolution을 적용해 input feature map을 256(ZFNet)또는 512(VGG)크기의 feature로 mapping합니다. 
        x = Conv2D(9, kernel_size = 3, padding='same', name='region_conv2d_1')(region_input)
        x = BatchNormalization(name='region_batchnorm_1')(x)
        x = Activation('relu', name='region_activation_1')(x)
        region = Conv2D(9, kernel_size = 1, activation='sigmoid', name='region')(x)
        
        # 최종적으로 Region Proposal의 값으로 Bounding Box를 그려줍니다.
        # RPN의 결과는 box classification layer (classes)와 box regression layer (bboxes)으로 들어갑니다. 
        return region
    
    # Bounding box의 parameter를 찾는 regression을 의미합니다.
    def bboxes(region_input):
        # region에서 받은 Feature map을 평평하게 만들어
        # Bounding box를 그릴 좌표를 regression 합니다.
        x = Flatten(name='bboxes_flatten')(region_input)
        x = Dense(7 * 7 * 4, name='bboxes_dense')(x)
        bboxes = Reshape((7, 7, 4), name='bboxes')(x)
        
        return bboxes

    # Classes()는 영상내의 물체가 어떤 물체인지 분류해주는 Classification Model입니다.
    def classes(cnn_input):
        
        x = Conv2D(4, 3, padding='same', name='classes_conv2d')(cnn_input)
        x = BatchNormalization(name='classes_batchnorm')(x)
        x = Activation('relu', name='classes_activation')(x)
        x = Flatten(name='classes_flatten')(x)
        x = Dense(7 * 7 * 1, name='classes_dense', activation='sigmoid')(x)

        classes = Reshape((7, 7, 1), name='classes')(x)

        return classes

    # Object Detection은 여러가지 Loss (region, bboxes, classes)를 한번에 계산하도록 구성되어있습니다. 
    # 기존의 단순한 CNN보다 복잡하지만 객체를 검출하기 위해서 필요한 부분들이니 꼭 기억하세요. 
    def complete_model():
        
        # 위의 각각 다른 4개의 Model을 합쳐 하나의 전체적인 Object Detection Model을 만들어냅니다.
        cnn = Object_Detection.cnn()
        region = Object_Detection.region(cnn.output)
        bboxes = Object_Detection.bboxes(region)
        classes = Object_Detection.classes(cnn.output)
        
        # 하나의 입력 Image에 대해 3가지의 Loss를 계산합니다.
        model_inputs = [cnn.input]
        model_outputs = [region, bboxes, classes]

        return Object_Detection(inputs=model_inputs, outputs=model_outputs)
        
OD = Object_Detection.complete_model()
OD.summary()


Downloading data from https://github.com/fchollet/deep-learning-models/releases/download/v0.6/mobilenet_2_5_224_tf_no_top.h5
Model: "object__detection"
__________________________________________________________________________________________________
Layer (type)                    Output Shape         Param #     Connected to                     
input_3 (InputLayer)            [(None, 224, 224, 3) 0                                            
__________________________________________________________________________________________________
conv1_pad (ZeroPadding2D)       (None, 225, 225, 3)  0           input_3[0][0]                    
__________________________________________________________________________________________________
conv1 (Conv2D)                  (None, 112, 112, 8)  216         conv1_pad[0][0]                  
__________________________________________________________________________________________________
conv1_bn (BatchNormalization)   (None, 112, 112, 8)  32 

# Style Transfer
Style transfer는 2015년에 발표된 내용으로, 논문이 발표된 후에 연구자들에게 큰 반응과 관심을 받은 주제입니다.

https://kasausyrzlhe1066469.cdn.ntruss.com/global/file/p/5d3ddad029d7034eeb9a4d17/Style_transfer.JPG

Style transfer란 Content image (입력 영상), Style image (적용할 스타일 영상) 이렇게 두 영상을 기반으로 새로운 영상을 재구성하는것입니다.  

-----------------------------------------
* 영상의 윤곽, 형태 : Content image 기반
* 스타일, Texture 정보 : Style image 기반  
------------------------------
__Style transfer__ 를 적용하기 위해 CNN(Pretrained VGG16)의 내부 Feature map을 추출해 Content Loss와 Style Loss를 계산합니다.

그 후 출력 영상이 Content & Style image의 feature map과 유사하게 재구성되도록 최적화합니다.

__Style transfer__ 는 Feature map 추출과 추출된 Feature map에 대해 Matrix 연산이 필요합니다. 그러므로 이번 실습에서는 Content Loss와 Style Loss가 각각 어떤 수식에 의해 계산되는지 알아보겠습니다.

### Content Loss
Content Loss는 특정 Layer의 결과를 뽑고 결과 값들의 차를 제곱합으로 정의합니다.

https://kasausyrzlhe1066469.cdn.ntruss.com/global/file/p/5d3dce1737cb569fa82f3468/Content.JPG

앞쪽의 Layer에서는 Edge 성분 같은 비교적 단순한 특징을 찾고, 뒤쪽의 Layer에서는 영상에서 사물의 형태 같이 복잡한 특징을 추출하기 때문에 주로 뒤쪽 Layer의 출력 값을 사용합니다.

### Style Loss
Style Loss는 Layer의 출력 값을 뽑아 Gram Matrix를 만드는 과정이 추가됩니다.

https://kasausyrzlhe1066469.cdn.ntruss.com/global/file/p/5d3dce1e7dbff6e2541a7279/Gram.JPG

----------------------

#### Gram Matrix란?

Gram Matrix는 Feature Map을 내적하여 만든 행렬로 Feature map 간의 Correlation 정보를 가지고 있습니다.

이 Correlation의 정보가 이미지가 가지고 있는 복합적인 스타일을 표현합니다.

---------------------------
Style Loss는 Style image의 여러 Layer의 출력 값으로 만든 Gram Matrix와 결과 영상의 같은 Layer들의 출력값으로 만든 Gram Matrix의 차를 제곱하여 Error를 계산합니다.

https://kasausyrzlhe1066469.cdn.ntruss.com/global/file/p/5d3dce21ad4a1a6db6d2e31c/Style.JPG

Gram Matrix 연산이 추가로 들어가는데다 Style Loss는 여러개의 Featrue map을 사용하기 때문에 굉장히 많은 연산량이 필요합니다.

* 관련 링크

https://arxiv.org/pdf/1508.06576.pdf
### 실습
content_loss()를 완성해보세요.

gram_matrix()의 입력 input_tensor의 shape을 추출해보세요.

gram_matrix()에서 Gram_matrix를 계산하고 Return해주세요.

style_loss()를 완성해보세요.

In [5]:
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.layers import Input, Dense, Conv2D, Activation,MaxPooling2D,Dropout ,BatchNormalization, Flatten
from tensorflow.keras.models import Model
from tensorflow.keras.utils import to_categorical

# 임의의 Feature map을 만들어 Loss를 계산해보겠습니다.

# Content
# 특정 Layer에서 뽑은 하나의 Feature map을 사용합니다,
# Content_image의 Layer 결과값입니다.
content_image = tf.random.normal([5,10,10,1])
# 생성할 Output Image의 Layer 결과값입니다.
content_output= tf.random.normal([5,10,10,1])

# Style
# 여러 Layer에서 뽑은 Feature map들을 사용합니다.
# 임의로 3개의 Feature map을 추출했다 가정하겠습니다.
# Style Image의 Layer 결과 값입니다.
style1 = tf.random.normal([5,5,2])
style2 = tf.random.normal([10,10,2])
style3 = tf.random.normal([15,15,2])

# 생성할 Output Image의 Layer 결과값입니다.
style1_output = tf.random.normal([5,5,2])
style2_output = tf.random.normal([10,10,2])
style3_output = tf.random.normal([15,15,2])


# Content Loss를 계산하는 메서드 입니다.
def content_loss(content, target):
    # Feature map간의 차이를 제곱하여 Loss를 계산합니다.
    # TODO : tf.reduce_mean과 tf.squere를 이용하여 Content loss를 만들어보세요. (Hint. MSE)
    content_loss = tf.reduce_mean(tf.square(content-target))
    
    # content_loss= sum((target-content)**2)
    
    return content_loss

# Gram_matrix를 연산하는 메서드입니다.
def gram_matrix(input_tensor):
    # TODO : 입력 Feature Map의 Width, Height, Channel을 추출해보세요. (Hint. tf.shape)
    w, h, c =  input_tensor.shape
    
    # (C * H * W)의 3차원 형태의 Feature map을 1차원으로 Flatten하게 만들어줍니다.
    # Flatten을 통해 연산 속도를 조금 빠르게 만들 수 있습니다.
    input_tensor = tf.reshape(input_tensor, [-1, w * h * c])
    
    # TODO : Gram Matrix를 연산해보세요. (Hint. Transpose)
    return  tf.matmul(input_tensor, tf.transpose(input_tensor))


# Style Loss를 계산하는 메서드입니다.
def style_loss(style, target):
    loss = 0
    # 추출한 여러개의 Feature map을 Gram Matrix로 만들어줍니다.
    # 그 후 Gram Matrix의 차이를 계산한 후 Loss에 더해줍니다.
    for i in range(len(style)):
        # TODO : 각 Feature map에 대해 Gram matrix를 계산해주세요.
        gram_style = gram_matrix(style[i])
        gram_target = gram_matrix(target[i])
        
        # TODO : tf.reduce_mean과 tf.squere를 이용하여 Style loss를 만들어보세요. (Hint. MSE)
        # Style Loss는 여러개의 Feature map을 사용하기 때문에 Loss의 값도 여러개가 나옵니다.
        # 이를 모두 합쳐서 계산합니다.
        loss += tf.reduce_mean(tf.square(gram_style-gram_target))
    
    return loss

# Content Loss 계산
content_loss= content_loss(content_image, content_output)

# Stlye Loss 계산
style = [style1, style2, style3]
style_output =[style1_output, style2_output, style3_output]
style_loss = style_loss(style, style_output)

# 아래의 Loss 값은 임의의 Feature map으로 계산한 Loss 때문에 초기의 학습되지 않은 Loss를 의미합니다.
# 실제로 모델에 Loss를 적용하여 학습하게 되면 아래의 Loss값들이 점점 작아지는 방향으로 학습을 진행합니다.
print(content_loss.numpy())
print(style_loss.numpy())

2.1106133
4390.954


# **Custom Loss Function 설계하기 **
19장 실습을 진행하며 각 분야(Object Detection, Segmentation…)의 CNN 구조를 살펴봤습니다. CNN의 구조는 특정 Layer를 제외하고는 어느정도 유사한 것을 볼 수 있습니다.

원하는 어플리케이션을 구현하기 위해서는 적절한 CNN을 만드는 것 이외에 적절한 Loss Function의 설계도 필요합니다.

앞서 실습에서 CNN을 학습하는데 있어 여러개의 Loss Function을 학습해야 하는 경우가 있습니다.

이번 미션을 통해 직접 Loss fucntion을 구현하고 여러 Loss Fucntion을 동시에 최소화하는 CNN을 구현해보겠습니다.

### 미션
MNIST 데이터를 전처리해보세요.
* Float 변환, 0 ~ 1로 Normalize
* CNN에 넣기 위한 Dimension 확장
* Lable One hot Encoding  

custom_loss()를 완성해보세요. 설계할 Loss fucntion은 아래의 두 가지 입니다.

* Mean Square Error mse = \sum(y_{true} - y_{pred})^2mse=∑(ytrue​−ypred​)2

* Mean Absolute Error mae = \sum|y_{true} - y_{pred}|mae=∑∣ytrue​−ypred​∣

MNIST 데이터를 학습할 CNN() 구현해보세요.

CNN()을 학습시켜주세요.

test_accuracy를 96% 이상 나오도록 모델을 설계해보세요.



In [6]:
import numpy as np
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.layers import Input, Dense, Conv2D, Conv2DTranspose, Flatten
from tensorflow.keras.models import Model
from tensorflow.keras.utils import to_categorical

# MNIST 데이터 세트를 불러옵니다.
mnist = np.load('./data/mnist.npz')

# TODO : Train과 Test 데이터로 나누어주세요.
# 원하는 만큼 데이터를 사용해보세요.
X_train, y_train, X_test, y_test = mnist['x_train'][:10000], mnist['y_train'][:10000],mnist['x_test'][:1000], mnist['y_test'][:1000]

# TODO : MNIST 데이터를 전처리해주세요.
# TODO : 0 ~ 1 Float으로 normalize 해주세요.
X_train = X_train.astype(np.float32) / 255.
X_test = X_test.astype(np.float32) / 255.

# TODO : (num, 28, 28) -> (num, 28, 28 ,1)로 Channel Dimension을 추가해주세요.
X_train = np.expand_dims(X_train, axis=-1)
X_test = np.expand_dims(X_test, axis=-1)

# TODO : Label을 One Hot Encoding 해주세요.
y_train =  to_categorical(y_train, 10)
y_test =  to_categorical(y_test, 10)

 # custom_loss를 완성해보세요.
def custom_loss(y_true, y_pred):
    # TODO : MSE를 구현해주세요.
    mse_loss = (tf.square(y_true-y_pred))    
    # TODO : MAE를 구현해주세요.
    mae_loss = (np.absolute(y_true-y_pred)) 
    
    # 여러개의 Loss를 사용하면 아래와 같이 더해져서 Loss를 계산합니다.
    # 일반적으로 여러개의 Loss를 계산할 때는 
    # (a * mse_loss) + (b * mae_loss) 
    # 형태로 각 Loss를 얼마나 반영할 것인가에 대한 Parameter를 사용하는 경우도 많습니다.
    return (1*mse_loss) + (1*mae_loss)
# TODO : 적절한 CNN을 만들어주세요.
def CNN():
    
    model = keras.Sequential([
    # TODO : 3개의 Convolution Layer, 3개의 BatchNormalization을 추가해주세요.
    keras.layers.Conv2D(32 ,kernel_size = (3,3), strides = (2,2), padding = 'same', input_shape=(28,28,1)),
    keras.layers.BatchNormalization(),
    keras.layers.Activation('relu'),
    
    keras.layers.Conv2D(64 ,kernel_size = (3,3), strides = (2,2), padding = 'same'),
    keras.layers.BatchNormalization(),
    keras.layers.Activation('relu'),
    
    keras.layers.Conv2D(32 ,kernel_size = (3,3), strides = (2,2), padding = 'same'),
    keras.layers.BatchNormalization(),
    keras.layers.Activation('relu'),
    
    
    keras.layers.Flatten(),
    keras.layers.Dense(32, activation = tf.nn.relu),
    keras.layers.Dense(32, activation = tf.nn.relu),
    keras.layers.Dense(10, activation = tf.nn.softmax)
    ])
    return model
# TODO : 만든 CNN을 불러와주세요.
model = CNN()
model.summary()

# TODO : Comfile과 fit으로 CNN을 학습시켜주세요. Loss는 직접 설계한 custum_loss를 사용합니다.
model.compile(optimizer = 'adam', loss = custom_loss, metrics = ['accuracy'])
history = model.fit(X_train, y_train, epochs = 9, batch_size = 100, validation_data = (X_test, y_test), verbose = 2)

# TODO : CNN 모델을 평가해주세요.
# test_accuracy가 96% 이상 나와야합니다.
loss, test_accuracy = model.evaluate(X_test, y_test)

Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d_7 (Conv2D)            (None, 14, 14, 32)        320       
_________________________________________________________________
batch_normalization (BatchNo (None, 14, 14, 32)        128       
_________________________________________________________________
activation_3 (Activation)    (None, 14, 14, 32)        0         
_________________________________________________________________
conv2d_8 (Conv2D)            (None, 7, 7, 64)          18496     
_________________________________________________________________
batch_normalization_1 (Batch (None, 7, 7, 64)          256       
_________________________________________________________________
activation_4 (Activation)    (None, 7, 7, 64)          0         
_________________________________________________________________
conv2d_9 (Conv2D)            (None, 4, 4, 32)         