# Week 10. Convolutional Neural Networks

과제는 총 2개의 cell을 작성하도록 구성되어있습니다

1~2 문제는 영상과 실습자료에 나와있는 것들을 적절히 응용하시면 됩니다

주석의 경우 이미지, 테이블 등의 표현이 어려운 관계로 받지 않겠습니다

### 실습 01. Cifar 100 for Coarse labels

Dataset cifar 100을 dataset으로 사용하여 과제를 진행합니다

Train set으로 학습하면서 validation으로 test를 사용해주세요

Monitoring 용도로만 사용하며 학습에는 개입하지않습니다

모델은 convolution layer를 사용하여 자유롭게 생성하시면 됩니다

그리고 convolution layer의 일부분이 저장가능하도록 만들어주세요

실습 02에서 fine labels로 transfer learning을 시도해보겠습니다

생성한 모델로 coarse labels를 학습하고 성능과 loss가 학습하는 동안 어떻게 변했는지 시각화해주세요

In [3]:
import pandas as pd
import numpy as np
import os

from plotly.subplots import make_subplots
from plotly import graph_objs as go
import plotly.express as px
from plotly.offline import iplot,plot

import tensorflow as tf

In [4]:
train = np.load('10_train.npy')
test = np.load('10_test.npy')
train_labels = pd.read_csv('10_tr_labels.csv')
test_labels = pd.read_csv('10_ts_labels.csv')

In [5]:
tr_super_dict = {i:n for n,i in enumerate(train_labels.coarse_labels.unique())}
tr_sub_dict = {i:n for n,i in enumerate(train_labels.fine_labels.unique())}

tr_super_y = train_labels['coarse_labels'].apply(lambda x: tr_super_dict[x]).values
tr_sub_y = train_labels['fine_labels'].apply(lambda x: tr_sub_dict[x]).values

ts_super_y = test_labels['coarse_labels'].apply(lambda x: tr_super_dict[x]).values
ts_sub_y = test_labels['fine_labels'].apply(lambda x: tr_sub_dict[x]).values

In [41]:
def shared_function():
    input_layer = tf.keras.Input((32,32,3))
    for n in range(3):
        if n == 0:
            conv = tf.keras.layers.Conv2D(filters=2**7,kernel_size=3,padding='same')(input_layer)
        else:
            conv = tf.keras.layers.Conv2D(filters=2**7,kernel_size=3,padding='same')(pool)
        batch=tf.keras.layers.BatchNormalization()(conv)
        activ=tf.keras.layers.Activation('relu')(batch)
        pool=tf.keras.layers.MaxPool2D()(activ)
        
    return tf.keras.models.Model(input_layer, pool)
model=shared_function()


In [19]:
super_input_layer = tf.keras.Input((32,32,3))
flat_layer=tf.keras.layers.Flatten()(model(super_input_layer))  # functional_1으로 표시됨 
super_output_layer=tf.keras.layers.Dense(3, activation='softmax')(flat_layer)
super_model=tf.keras.models.Model(super_input_layer, super_output_layer)
super_model.compile('Adam','categorical_crossentropy','accuracy')
history_super=super_model.fit(train,
                             tf.keras.utils.to_categorical(tr_super_y),
                             batch_size=200, epochs=10)

Model: "functional_11"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_6 (InputLayer)         [(None, 32, 32, 3)]       0         
_________________________________________________________________
functional_7 (Functional)    (None, 4, 4, 128)         300288    
_________________________________________________________________
flatten_3 (Flatten)          (None, 2048)              0         
_________________________________________________________________
dense_3 (Dense)              (None, 3)                 6147      
Total params: 306,435
Trainable params: 305,667
Non-trainable params: 768
_________________________________________________________________
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


In [20]:
print(f'super_model : {(super_model.predict(test).argmax(1)==ts_super_y).mean()*100:.5}%')

super_model : 68.4%


10 epoch동안 학습한 결과 loss : 0.93, 정확도 : 0.58이 loss : 0.29, 정확도 : 0.90 까지 성능이 향상이 되었고 해당 모델로 테스트 한 결과 68.4%의 정확도가 나왔습니다. 
epoch를 더 높게 한다면 정확도가 더 높게 측정될것으로 생각됩니다. 

### 실습 02. Cifar 100 for fine labels applied transfer learning

Coarse labels로 학습된 모델을 저장한 뒤 transfer learning으로 fine label을 학습시켜보세요

그리고 test set에 대해 loss와 성능이 어떻게 변하는지 시각화해주세요

In [31]:
import warnings
warnings.filterwarnings('ignore')

model.save('model')

INFO:tensorflow:Assets written to: model\assets


In [40]:
load_model=tf.keras.models.load_model('model')



In [36]:
load_input_layer = tf.keras.Input((32,32,3))
flat_layer=tf.keras.layers.Flatten()(load_model(load_input_layer))  
load_output_layer=tf.keras.layers.Dense(15, activation='softmax')(flat_layer)
load_super_model=tf.keras.models.Model(load_input_layer, load_output_layer)
load_super_model.summary()
load_super_model.compile('Adam','categorical_crossentropy','accuracy')
history_super=load_super_model.fit(train,
                                   tf.keras.utils.to_categorical(tr_sub_y),
                                   batch_size=200, epochs=10)

Model: "functional_27"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_15 (InputLayer)        [(None, 32, 32, 3)]       0         
_________________________________________________________________
functional_7 (Functional)    (None, 4, 4, 128)         300288    
_________________________________________________________________
flatten_12 (Flatten)         (None, 2048)              0         
_________________________________________________________________
dense_12 (Dense)             (None, 15)                30735     
Total params: 331,023
Trainable params: 330,255
Non-trainable params: 768
_________________________________________________________________
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


In [39]:
print(f'sub_model : {(load_super_model.predict(test).argmax(1)==ts_sub_y).mean()*100:.5}%')

sub_model : 34.467%


10번의 학습 결과 loss : 2.16, 정확도 : 0.3에서 loss 0.39, 정확도 0.92로 실습1에 비해서 정확도가 0.02정도 높게 측정이 되었지만 테스트 결과에서 더 안좋게 측정이 되었습니다. epoch를 좀더 높게 한다면 더 나은 결과가 나올것이라 생각합니다.