### Transfer Learning, 전이 학습
- 이미지 분류 문제를 해결하는 데에 사용했던 모델을 다른 데이터세트 혹은 다른 문제에 적용시켜 해결하는 것을 의미한다.
- 즉, 사전에 학습된 모델을 다른 작업에 이용하는 것을 의미한다.
- Pretrained Model의 Convolutional Base 구조(Conv2D + Pooling)를 그대로 두고 분류기(FC)를 붙여서 학습시킨다.
=기존 훈련 모델을 다른 모델로 만들고 싶다면 전니 하긋ㅂ을 해야 한다.

<div style="display: flex; margin-left:-10px">
    <div>
        <img src="./images/transfer_learning01.png" width="150">
    </div>
    <div>
        <img src="./images/fc.png" width="600" style="margin-top: 10px; margin-left: 50px">
    </div>
</div>

- 사전 학습된 모델의 용도를 변경하기 위한 층별 미세 조정(fine tuning)은 데이터 세트의 크기와 유사성을 기반으로 고민하여 조정한다.
- 2018년 FAIR(Facebook AI Research)논문에서 실험을 통해 '전이학습이 학습 속도 면에서 효과가 있다'라는 것을 밝혀냈다.

<img src="./images/transfer_learning02.png" width="400" style="margin-left: -30px">
=랜덤 인잇=모델에 맞게 초기화 
처음부터 가중치(웨이트를 갖고 시작함
시간에 따라 pre-train이 더 좋은 성능을 갖는다...

In [1]:
from tensorflow.keras.applications import VGG16

# 사전 훈련 모델 생성
model = VGG16()
# 사전 훈련 모델 정보 확인
model.summary()

In [2]:
# 모델 확인
print('model: ', model)
# <Functional name=vgg16, built=True>
# name: vgg16, built: 이미 제작이 되어 있고 

# 모델의 아웃풋이 어떻게 되어있는지 확인 가능,sparse = 원핫 인코딩 여부
print('model output: ', model.output)

model:  <Functional name=vgg16, built=True>
model output:  <KerasTensor shape=(None, 1000), dtype=float32, sparse=False, name=keras_tensor_22>


In [3]:
IMAGE_SIZE = 32
BATCH_SIZE = 64

In [4]:
from tensorflow.keras.models import Model
from tensorflow.keras.layers import Input, Dense, Conv2D, Dropout, Flatten, Activation, MaxPooling2D, GlobalAveragePooling2D
from tensorflow.keras.applications import VGG16

# include_top분류기를 포함 할 것이냐(윗대가리가 사실 제일 아래다),우리는 바로 predict 안하기 때문에 false,
# 훈련을 마친 가중치 파일을 가지고 있음, imagenet이걸 하면 가중치를 가지고 감, 처음부터 훈련하고 싶ㅅ으면 weights를 안 주면 됨
model = VGG16(input_shape=(IMAGE_SIZE, IMAGE_SIZE, 3), include_top=False, weights='imagenet')

# 분류기
# GlobalAveragePooling2D()(인풋)
# GlobalAveragePooling2D()(model.output)
x = model.output
x = GlobalAveragePooling2D()(x)
x = Dense(50, activation='relu')(x)
output = Dense(10, activation='softmax')(x)

model = Model(inputs=model.input, outputs=output)
model.summary()

In [12]:
import numpy as np
from sklearn.model_selection import train_test_split
from tensorflow.keras.datasets import cifar10
from tensorflow.keras.preprocessing.image import ImageDataGenerator
import albumentations as A

def transform(image):
    aug = A.HorizontalFlip(p=0.5)

    return aug(image=image)['image']

(train_images, train_targets), (test_images, test_targets) = cifar10.load_data()

train_images, validation_images, train_targets, validation_targets = \
train_test_split(train_images, train_targets, stratify=train_targets, test_size=0.2, random_state=124)

train_targets = np.squeeze(train_targets)
validation_targets = np.squeeze(validation_targets)
test_targets = np.squeeze(test_targets)

print(train_images.shape, train_targets.shape)
print(validation_images.shape, validation_targets.shape)
print(test_images.shape, test_targets.shape)

train_generator = ImageDataGenerator(preprocessing_function=transform, rescale=1./255)
validation_generator = ImageDataGenerator(rescale=1./255)
test_generator = ImageDataGenerator(rescale=1./255)

# train만 shuffle을 사용하여 섞어주기
train_flow = train_generator.flow(train_images, train_targets, batch_size=BATCH_SIZE, shuffle=True)
validation_flow = validation_generator.flow(validation_images, validation_targets, batch_size=BATCH_SIZE)
test_flow = test_generator.flow(test_images, test_targets, batch_size=BATCH_SIZE)

(40000, 32, 32, 3) (40000,)
(10000, 32, 32, 3) (10000,)
(10000, 32, 32, 3) (10000,)


In [None]:
from tensorflow.keras.models import Model
from tensorflow.keras.layers import Input, Dense, Conv2D, Dropout, Flatten, Activation, MaxPooling2D, GlobalAveragePooling2D
from tensorflow.keras.applications import VGG16

# verbose 썸머리 출력 여부
def create_model(verbose=False):
    input_tensor = Input(shape=(IMAGE_SIZE, IMAGE_SIZE, 3))
    # model = VGG16(input_shape=(IMAGE_SIZE, IMAGE_SIZE, 3), include_top=False, weights='imagenet')
    model = VGG16(input_tensor=input_tensor, include_top=False, weights='imagenet')
    # include_top : 분류기 넣을건지 말지, weights가중치 그대로 가져올건지... 직접 처음부터 훈련시킬 거면 안써주면 됨

    # 분류기
    x = model.output
    x = GlobalAveragePooling2D()(x)
    x = Dense(50, activation='relu')(x)
    output = Dense(10, activation='softmax')(x)
    
    model = Model(inputs=model.input, outputs=output)
    if verbose:
        model.summary()
        
    return model

In [None]:
from tensorflow.keras.callbacks import ModelCheckpoint, ReduceLROnPlateau, EarlyStopping
from tensorflow.keras.optimizers import Adam 
from tensorflow.keras.losses import SparseCategoricalCrossentropy

mcp_cb = ModelCheckpoint(
    filepath="./callback_files/weights.{epoch:03d}-{val_loss:.4f}-{acc:.4f}.weights.h5",
    monitor='val_loss',
    save_best_only=False,
    save_weights_only=True,
    mode='min'
)

rlr_cb = ReduceLROnPlateau(
    monitor='val_loss',
    factor=0.1,
    patience=2,
    mode='min'
)

ely_cb = EarlyStopping(
    monitor='val_loss',
    patience=4,
    mode='min'
)

model = create_model(verbose=True)
model.compile(optimizer=Adam(), loss=SparseCategoricalCrossentropy, metrics=['acc'])

In [None]:
# pvm = 일괄처리에 용이
# 바로 해제 하지 않고 체크하고 임계치가 넘어가면 처리, 우리가 fit을 하기 전에 직접 처리 , 성능을 끌어올릴 수 있음

# 메모리 해제 하기(몇개 해제 됐는지 알려줌)
# 연산 속도가 더 증가함.....
# 큰 연산을 하기 위한 준비

import gc

# 불필요한 오브젝트를 지우는 작업
gc.collect()

In [None]:
history = model.fit(train_flow, 
                    batch_size=BATCH_SIZE, 
                    epochs=10, 
                    validation_data=validation_flow, 
                    callbacks=[mcp_cb, rlr_cb, ely_cb])

In [None]:
model.evaluate(test_flow)

In [None]:
import matplotlib.pyplot as plt

def show_history(history):
    plt.figure(figsize=(6, 6))
    plt.yticks(np.arange(0, 1, 0.05))
    plt.plot(history.history['acc'], label='train')
    plt.plot(history.history['val_acc'], label='validation')
    plt.legend()
    
show_history(history)

In [11]:
import numpy as np
from tensorflow.keras.preprocessing.image import load_img, img_to_array
from tensorflow.keras.applications.vgg16 import VGG16, decode_predictions

model = VGG16()
image = load_img('./datasets/hamster.jpg', target_size=(224, 224))
image = img_to_array(image)

image = np.expand_dims(image, axis=0)
prediction = model.predict(image)
# 확률에서 원래대로 돌려서 어떤 건지 확인할 수 있게 함
target = decode_predictions(prediction)
print(target)

# 높은 확률로 예측 된 것
print(target[0][0])
print(target[0][0][1], f'{np.round(target[0][0][2] * 100, 4)}%')

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 481ms/step
Downloading data from https://storage.googleapis.com/download.tensorflow.org/data/imagenet_class_index.json
[1m35363/35363[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
[[('n02342885', 'hamster', 0.4744362), ('n02441942', 'weasel', 0.17524551), ('n02442845', 'mink', 0.106843516), ('n02443484', 'black-footed_ferret', 0.07582153), ('n02443114', 'polecat', 0.032559898)]]
('n02342885', 'hamster', 0.4744362)
hamster 47.4436%
