# Transfer Learning 1 : ResNet50 계층 그대로 가져다 쓰기
전이학습에는 계층을 그대로 가져다 쓰는 방법과, 계층 중에서 일부를 더 학습시키는 방법(fine-tuning)이 있습니다. 첫 번째 방법은 분류기를 제외한 사전 학습된 모델을 가져온 다음 그 위에 사용자에게 맞게 fully-connected 계층을 얹어서 모델을 구축합니다. 기존 예제코드에서 돌려볼 수 있는 부분은 돌려보면서 최대한 바로 사용할 수 있게끔 만들어봤는데, 해결해야 될 점이 아직은 남아있습니다.

참고 : https://keraskorea.github.io/posts/2018-10-24-little_data_powerful_model/ <- 케라스 공식 블로그, 작은 데이터셋으로 강력한 이미지 분류 모델 설계하기

https://gist.github.com/fchollet/f35fbc80e066a49d65f1688a7e99f069 <- 참고한 원본 코드

In [0]:
import numpy as np
from keras.preprocessing.image import ImageDataGenerator
from keras.models import Sequential
from keras.layers import Dropout, Flatten, Dense
from keras import applications

# dimensions of our images.
img_width, img_height = 224, 224 ##프로젝트에서 활용할 이미지의 크기

top_model_weights_path = ##top_model의 가중치를 저장할 경로 '/content/drive/My Drive/Folder_Model_Train'
'''top_model은 resnet50를 의미하는 건가?'''
train_data_dir = ##train_data의 경로 - augmentation 한 이미지들
validation_data_dir = ##validation_data의 경로 '/content/drive/Shared drives/선빵팀 :)/TuningStar_최종/TuningStar'
nb_train_samples = ##학습 데이터의 갯수 : augmentation 된 전체 이미지의 갯수
nb_validation_samples = ##테스트 데이터의 갯수 : 949
epochs = 50 ## 학습 에폭 수
batch_size = 100 ## 학습 당 batch_size

## bottleneck_features : classifier 직전의 vector를 의미함. (ResNet 50을 통과시킨) feature vector와 같은 의미
def save_bottlebeck_features():
    datagen = ImageDataGenerator(rescale=1. / 255)

    # build the ResNet50 Network
    model = applications.ResNet50(include_top=False, weights='imagenet')
    # Shuffle을 false로 두어야 원래 순서대로 들어감(카테고리가 뒤섞이지 않는다.)
    generator = datagen.flow_from_directory(
        train_data_dir,
        target_size=(img_width, img_height),
        batch_size=batch_size,
        class_mode=None,
        shuffle=False)
    bottleneck_features_train = model.predict_generator(
        generator, nb_train_samples // batch_size)
    # np.save / np.load : 경로 지정한 곳으로 저장, 불러오기 가능, .npy확장자로 save하면 batch로 묶인 벡터들이 들어간다.
    np.save('/content/drive/My Drive/Folder_Model_Train/bottleneck_features_train.npy',
            bottleneck_features_train)

    generator = datagen.flow_from_directory(
        validation_data_dir,
        target_size=(img_width, img_height),
        batch_size=batch_size,
        class_mode=None,
        shuffle=False)
    bottleneck_features_validation = model.predict_generator(
        generator, nb_validation_samples)
    np.save('/content/drive/My Drive/Folder_Model_Train/bottleneck_features_validation.npy',
            bottleneck_features_validation)

    # 위에서 저장한 feature vector들을 불러와서, 순서대로 들어온 feature vector들에 label을 붙여준다.
def train_top_model():
    train_data = np.load(open('bottleneck_features_train.npy'))
    train_labels = ##상황에 맞게 따로 만들어주어야 한다.

    validation_data = np.load(open('bottleneck_features_validation.npy'))
    validation_labels = ##상황에 맞게 따로 만들어주어야 한다.

    model = Sequential()
    model.add(Flatten(input_shape=train_data.shape[1:]))
    model.add(Dense(256, activation='relu'))
    model.add(Dropout(0.5))
    model.add(Dense(756, activation='softmax')) #dense는 분류기 갯수만큼

    model.compile(optimizer='rmsprop',
                  loss='binary_crossentropy', metrics=['accuracy'])

    model.fit(train_data, train_labels,
              epochs=epochs,
              batch_size=batch_size,
              validation_data=(validation_data, validation_labels))
    model.save_weights(top_model_weights_path)


save_bottlebeck_features()
train_top_model()

## Labeling train data set and validation data set

이미지들의 갯수에 맞춰서 labeling을 해줍니다.

In [0]:
# train data labeling
## 기존에는 폴더 당 갯수 10000개를 맞췄다고 가정하고 labeling을 했는데, 실제로 받아보니 카테고리들마다 이미지 갯수가 달라서 해결해야 할 부분.
import numpy as np

a = np.array([0]*10000)
for i in range(0,756):
  x = np.array([i]*10000)
  a = np.concatenate((a,x))
a

밑으로는 쭉 validation data labeling 입니다.


In [0]:
# validation data labeling
## 원본 이미지 하나하나를 validation data로 두고 모델 검증

import glob
wheel_path = glob.glob('휠 원본 데이터 경로') ##휠들 경로 뽑아내기

wheel_path[0].split('/')[-1].split('.')[0].split('(')[0].strip() ##경로에서 휠 번호만 뽑아내기, 맨 첫 파일로만 시험


In [0]:
## 휠 번호들 하나의 리스트로 만들어주기
wheel_list = []
for path in wheel_path:
  a = path.split('/')[-1].split('.')[0].split('(')[0].strip()
  wheel_list.append(a)

## 맞게 들어왔는지 확인, set을 하면 중복 제거되어서 756개가 나와야 함
len(wheel_list)
len(set(wheel_list))

In [0]:
## 이제 번호들을 전부 int(정수형)로 바꿔주고 labeling
wheel_list_int = []
for num in wheel_list:
  wheel_list_int.append(int(num))
len(wheel_list_int)
## 0번 카테고리는 먼저 labeling 해주고, 이어서 num에 맞게 배열 만들어서 붙여나가는 방식으로
a = np.array([0]*3)
for num in wheel_list_int[3:]:
  x = np.array([num])
  a = np.concatenate((a,x))
a

## 추가 : EarlyStopping과 LambdaCallback
검색하다가 발견한건데, 밑의 코드를 활용하면 학습이 잘 되고 있는지(가중치가 변화하고 있는지) 확인할 수 있다고 합니다. 사용하면 좋을 것 같아서 일단 추가해놓습니다.

참고 : https://rarena.tistory.com/entry/keras%ED%8A%B8%EB%A0%88%EC%9D%B4%EB%8B%9D-%EB%90%9C%EB%90%98%EA%B3%A0%EC%9E%88%EB%8A%94-weigth%EA%B0%92-%ED%99%95%EC%9D%B8?category=814480 , keras 트레이닝 되고 있는 weight값 확인

In [0]:
from keras.callbacks import EarlyStopping, LambdaCallback
 
print_weights = LambdaCallback(on_epoch_end=lambda epoch, logs: print(model.layers[3].get_weights()))
early_stopping = EarlyStopping(patience=15, mode='auto', monitor='val_loss')
history = model.fit_generator(train_generator,
                              steps_per_epoch=25,
                              epochs=100,
                              validation_data=val_generator,
                              validation_steps=5,
                              callbacks=[early_stopping, print_weights])

# Transfer Learning 2 : ResNet50 계층 일부분을 추가로 학습시켜서 활용하기(Fine-tuning)

기존에 학습되어있는 fully-connected 계층을 가져와서(위에서 학습시킨 모델 가중치) ResNet50 위에 얹습니다. 이후 ResNet50 계층 구조를 참고하여 학습시키지 않을 부분은 동결시키고(non-trainable) 학습시킬 부분만 살려서 학습을 진행합니다.(중간에 non-trainable 계층 갯수는 생각해봐야 할 부분) 참고 페이지에서도 말하듯 fine tuning의 핵심은 미세 조정이기 때문에 learning rate를 낮게 설정하고, 또한 사례에서는 모델의 마지막 계층만을 추가로 학습시켰습니다. 

참고 : https://keraskorea.github.io/posts/2018-10-24-little_data_powerful_model/ <- 케라스 공식 블로그, 작은 데이터셋으로 강력한 이미지 분류(Transfer Learning 1과 동일)

https://gist.github.com/fchollet/7eb39b44eb9e16e59632d25fb3119975 <- 원본 코드


In [0]:
from keras import applications
from keras.preprocessing.image import ImageDataGenerator
from keras import optimizers
from keras.models import Sequential
from keras.layers import Dropout, Flatten, Dense

# path to the model weights files.
## top_model_weights : 얹기 전에 미리 학습을 시켜야 함, 위에서 활용한 모델 가중치 활용
weights_path = '../keras/examples/vgg16_weights.h5' ## 이건 왜 있는거지?? weights = 'imagenet'으로 부르면 되지 않을까 싶다.
top_model_weights_path = 'fc_model.h5' ## 먼저 학습을 시키고 weight를 저장해둬야 함.
# dimensions of our images.
img_width, img_height = 150, 150

train_data_dir = 'training data의 경로'
validation_data_dir = 'validation data의 경로'
nb_train_samples = ##데이터 갯수에 맞춰서
nb_validation_samples = ##validation sample 갯수에 맞춰서
epochs = 50
batch_size = 16

# build the ResNet50 network(사용자에 맞게)
model = applications.ResNet50(weights='imagenet', include_top=False)
print('Model loaded.')

# build a classifier model to put on top of the convolutional model
top_model = Sequential()
top_model.add(Flatten(input_shape=model.output_shape[1:]))
top_model.add(Dense(256, activation='relu'))
top_model.add(Dropout(0.5))
top_model.add(Dense(756, activation='softmax'))

# note that it is necessary to start with a fully-trained
# classifier, including the top classifier,
# in order to successfully do fine-tuning
top_model.load_weights(top_model_weights_path)

# add the model on top of the convolutional base
model.add(top_model)

# set the first 25 layers (up to the last conv block)
# to non-trainable (weights will not be updated)
## 모델 레이어의 갯수가 여기서는 VGG16 기준이라, 구조를 보고 어디까지 살려야할지 생각해봐야 한다.
for layer in model.layers[:25]:
    layer.trainable = False

# compile the model with a SGD/momentum optimizer
# and a very slow learning rate.
model.compile(loss='binary_crossentropy',
              optimizer=optimizers.SGD(lr=1e-4, momentum=0.9),
              metrics=['accuracy'])

# prepare data augmentation configuration - augmentation을 미리 했으므로 굳이 필요는 없을 듯
train_datagen = ImageDataGenerator(
    rescale=1. / 255,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True)

test_datagen = ImageDataGenerator(rescale=1. / 255)

train_generator = train_datagen.flow_from_directory(
    train_data_dir,
    target_size=(img_height, img_width),
    batch_size=batch_size,
    class_mode='binary')

validation_generator = test_datagen.flow_from_directory(
    validation_data_dir,
    target_size=(img_height, img_width),
    batch_size=batch_size,
    class_mode='binary')

# fine-tune the model
model.fit_generator(
    train_generator,
    samples_per_epoch=nb_train_samples,
    epochs=epochs,
    validation_data=validation_generator,
    nb_val_samples=nb_validation_samples)