##### Copyright 2018 The TensorFlow Authors.

In [None]:
#@title Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# TensorFlow 허브와 Transfer Learning (전이학습)

<table class="tfo-notebook-buttons" align="left">
  <td>
    <a target="_blank" href="https://www.tensorflow.org/tutorials/images/transfer_learning_with_hub"><img src="https://www.tensorflow.org/images/tf_logo_32px.png" />View on TensorFlow.org</a>
  </td>
  <td>
    <a target="_blank" href="https://colab.research.google.com/github/tensorflow/docs-l10n/blob/master/site/ko/tutorials/images/transfer_learning_with_hub.ipynb"><img src="https://www.tensorflow.org/images/colab_logo_32px.png" />Run in Google Colab</a>
  </td>
  <td>
    <a target="_blank" href="https://github.com/tensorflow/docs-l10n/blob/master/site/ko/tutorials/images/transfer_learning_with_hub.ipynb"><img src="https://www.tensorflow.org/images/GitHub-Mark-32px.png" />View source on GitHub</a>
  </td>
  <td>
    <a href="https://storage.googleapis.com/tensorflow_docs/docs-l10n/site/ko/tutorials/images/transfer_learning_with_hub.ipynb"><img src="https://www.tensorflow.org/images/download_logo_32px.png" />Download notebook</a>
  </td>
</table>

[TensorFlow 허브](http://tensorflow.org/hub)는 이전에 학습된 모델들의 parameter를 공유받을 수 있는 하나의 방법
- 학습된 모델들의 리스트: [텐서플로 모듈 허브](https://tfhub.dev/)


본 tutorial에서는 다음과 같은 내용을 다루고 있음

1. `tf.keras`을 통한 TensorFlow 허브 사용 방법 및 이미지 분류
1. 전이학습을 하는 방법

## 설치하기


In [None]:
import matplotlib.pylab as plt

import tensorflow as tf

In [None]:
!pip install -q -U tf-hub-nightly
import tensorflow_hub as hub

from tensorflow.keras import layers

## ImageNet 분류기


### 분류기 다운로드

`hub.KerasLayer`로 mobilenet 다운로드

In [None]:
classifier_url ="https://tfhub.dev/google/tf2-preview/mobilenet_v2/classification/2" #@param {type:"string"}

In [None]:
IMAGE_SHAPE = (224, 224)

classifier = tf.keras.Sequential([
    hub.KerasLayer(classifier_url, input_shape=IMAGE_SHAPE+(3,))
])

### 이미지 클래스 예측


모델을 test하기 위한 이미지 다운로드

In [None]:
import numpy as np
import PIL.Image as Image

grace_hopper = tf.keras.utils.get_file('image.jpg','https://storage.googleapis.com/download.tensorflow.org/example_images/grace_hopper.jpg')
grace_hopper = Image.open(grace_hopper).resize(IMAGE_SHAPE)
grace_hopper

In [None]:
grace_hopper = np.array(grace_hopper)/255.0
grace_hopper.shape

Batch 차원 추가 & 이미지 test

In [None]:
result = classifier.predict(grace_hopper[np.newaxis, ...])
result.shape

결과는 1001차원의 벡터
- ImageNet의 대한 각각의 클래스에 대한 확률을 의미

`np.argmax`함수를 통해 최대값을 갖는 클래스 추출

In [None]:
predicted_class = np.argmax(result[0], axis=-1)
predicted_class

### 예측 분석

`ImageNet` 클래스 label을 예측

In [None]:
labels_path = tf.keras.utils.get_file('ImageNetLabels.txt','https://storage.googleapis.com/download.tensorflow.org/data/ImageNetLabels.txt')
imagenet_labels = np.array(open(labels_path).read().splitlines())

In [None]:
plt.imshow(grace_hopper)
plt.axis('off')
predicted_class_name = imagenet_labels[predicted_class]
_ = plt.title("Prediction: " + predicted_class_name.title())

## 간단한 전이 학습


TensorFlow 허브를 사용하여 custom 데이터셋에 있는 클래스들을 학습시키기 위한 모델의 최상위 층을 재학습

### 데이터셋

 TensorFlow의 flowers 데이터셋 사용

In [None]:
data_root = tf.keras.utils.get_file(
  'flower_photos','https://storage.googleapis.com/download.tensorflow.org/example_images/flower_photos.tgz',
   untar=True)

`tf.keras.preprocessing.image.image.ImageDataGenerator`를 사용하여 데이터 로드

In [None]:
image_generator = tf.keras.preprocessing.image.ImageDataGenerator(rescale=1/255)
image_data = image_generator.flow_from_directory(str(data_root), target_size=IMAGE_SHAPE)

`image_data`는 `image_batch`와 `label_batch`를 같이 return

In [None]:
for image_batch, label_batch in image_data:
  print("Image batch shape: ", image_batch.shape)
  print("Label batch shape: ", label_batch.shape)
  break

### 이미지 분류기를 통한 예측


In [None]:
result_batch = classifier.predict(image_batch)
result_batch.shape

In [None]:
predicted_class_names = imagenet_labels[np.argmax(result_batch, axis=-1)]
predicted_class_names

얼마나 많은 예측들이 맞는지 확인

In [None]:
plt.figure(figsize=(10,9))
plt.subplots_adjust(hspace=0.5)
for n in range(30):
  plt.subplot(6,5,n+1)
  plt.imshow(image_batch[n])
  plt.title(predicted_class_names[n])
  plt.axis('off')
_ = plt.suptitle("ImageNet predictions")

결과는 모델이 제대로 분류하고 있지 못하다는 것을 보여줌
- 모델이 ("daisy"를 제외한) 다른 클래스에 대해서 학습된 것이 아니라는 것을 고려하면 합리적

### 헤드리스 모델 다운로드

TensorFlow 허브는 맨 위 분류층이 없어도 모델을 불러올 수 있음
- 전이 학습을 쉽게 할 수 있게 해 줌.

In [None]:
feature_extractor_url = "https://tfhub.dev/google/tf2-preview/mobilenet_v2/feature_vector/2" #@param {type:"string"}

feature extractor 정의

In [None]:
feature_extractor_layer = hub.KerasLayer(feature_extractor_url,
                                         input_shape=(224,224,3))

각각의 이미지마다 길이가 1280인 벡터가 반환

In [None]:
feature_batch = feature_extractor_layer(image_batch)
print(feature_batch.shape)

feature extractor layer의 variable들을 학습이 되지 않도록 하면(update를 하지 않고 고정시킴), 학습은 분류 layer에서만 이루어짐

In [None]:
feature_extractor_layer.trainable = False

### 분류 layer 추가

In [None]:
model = tf.keras.Sequential([
  feature_extractor_layer,
  layers.Dense(image_data.num_classes, activation='softmax')
])

model.summary()

In [None]:
predictions = model(image_batch)

In [None]:
predictions.shape

### 모델 학습

In [None]:
model.compile(
  optimizer=tf.keras.optimizers.Adam(),
  loss='categorical_crossentropy',
  metrics=['acc'])

`callbacks` argument를 사용하여 loss와 batch 별 정확도를 기록할 수 있음

In [None]:
class CollectBatchStats(tf.keras.callbacks.Callback):
  def __init__(self):
    self.batch_losses = []
    self.batch_acc = []

  def on_train_batch_end(self, batch, logs=None):
    self.batch_losses.append(logs['loss'])
    self.batch_acc.append(logs['acc'])
    self.model.reset_metrics()

In [None]:
steps_per_epoch = np.ceil(image_data.samples/image_data.batch_size)

batch_stats_callback = CollectBatchStats()

history = model.fit_generator(image_data, epochs=2,
                              steps_per_epoch=steps_per_epoch,
                              callbacks = [batch_stats_callback])

In [None]:
plt.figure()
plt.ylabel("Loss")
plt.xlabel("Training Steps")
plt.ylim([0,2])
plt.plot(batch_stats_callback.batch_losses)

In [None]:
plt.figure()
plt.ylabel("Accuracy")
plt.xlabel("Training Steps")
plt.ylim([0,1])
plt.plot(batch_stats_callback.batch_acc)

### 예측 확인

In [None]:
class_names = sorted(image_data.class_indices.items(), key=lambda pair:pair[1])
class_names = np.array([key.title() for key, value in class_names])
class_names

학습된 모델로 이미지 예측 & index들을 클래스 이름으로 변경

In [None]:
predicted_batch = model.predict(image_batch)
predicted_id = np.argmax(predicted_batch, axis=-1)
predicted_label_batch = class_names[predicted_id]

결과 시각화

In [None]:
label_id = np.argmax(label_batch, axis=-1)

In [None]:
plt.figure(figsize=(10,9))
plt.subplots_adjust(hspace=0.5)
for n in range(30):
  plt.subplot(6,5,n+1)
  plt.imshow(image_batch[n])
  color = "green" if predicted_id[n] == label_id[n] else "red"
  plt.title(predicted_label_batch[n].title(), color=color)
  plt.axis('off')
_ = plt.suptitle("Model predictions (green: correct, red: incorrect)")

## 모델 저장

In [None]:
import time
t = time.time()

export_path = "/tmp/saved_models/{}".format(int(t))
model.save(export_path, save_format='tf')

export_path

저장한 모델을 불러오는 방법:

In [None]:
reloaded = tf.keras.models.load_model(export_path)

In [None]:
result_batch = model.predict(image_batch)
reloaded_result_batch = reloaded.predict(image_batch)

In [None]:
abs(reloaded_result_batch - result_batch).max()