# AI Hub を使用した転移学習（Transfer Learning）

AI Hub は、 トレーニング済みのモデルコンポーネントを共有するためのプラットフォームです。<br>
このラボでは以下について学習します。

- AI Hub の `tf.keras` モデルを使用する方法
- AI Hub を利用して画像分類を行う方法
- 簡単な転移学習を行う方法

In [None]:
import matplotlib.pylab as plt

import tensorflow as tf
import tensorflow_hub as hub
from tensorflow.keras import layers
import tensorflow_datasets as tfds


## ImageNet 分類器
### 分類器のダウンロード


`hub.KerasLayer` を使用して、mobilenet をロードし、 Keras layer としてラップします。

他のモデルは、 [AI Hub](https://aihub.cloud.google.com/s?q=tf2) のページから検索やフィルタリングを行うことで探索することができます。

In [None]:
classifier_url ="https://tfhub.dev/google/tf2-preview/mobilenet_v2/classification/2" 

model = tf.keras.Sequential([
    hub.KerasLayer(classifier_url, output_shape=[1001])
])
model.build([None, 224, 224, 3])  # Batch input shape.

In [None]:
model.summary()

In [None]:
import numpy as np
import PIL.Image as Image

IMAGE_SHAPE = (224, 224)

sample_img_url = 'https://storage.googleapis.com/download.tensorflow.org/example_images/grace_hopper.jpg'

grace_hopper = tf.keras.utils.get_file('image.jpg', sample_img_url)
grace_hopper = Image.open(grace_hopper).resize(IMAGE_SHAPE)
grace_hopper

In [None]:
grace_hopper = np.array(grace_hopper)/255.0
grace_hopper.shape

バッチの次元を追加し、画像をモデルに入力します。



In [None]:
result = model.predict(grace_hopper[np.newaxis, ...])
result.shape

この結果はロジットの 1001 要素の配列で、画像がそれぞれのクラスである確率に基づく数値が割り振られ、順位付けされています。

そのため、トップのクラス ID は argmax を使うことでみつけることができます:

In [None]:
predicted_class = np.argmax(result[0], axis=-1)
predicted_class

### 推論結果のデコード
ここまでの内容で推論結果のクラス ID を表す数値が得られるので、 ImageNet のラベルを取得し、推論結果をデコードします

In [None]:
labels_path = tf.keras.utils.get_file('ImageNetLabels.txt','https://storage.googleapis.com/download.tensorflow.org/data/ImageNetLabels.txt')
imagenet_labels = np.array(open(labels_path).read().splitlines())


In [None]:
imagenet_labels[:10]

In [None]:
plt.imshow(grace_hopper)
plt.axis('off')
predicted_class_name = imagenet_labels[predicted_class]
_ = plt.title("Prediction: " + predicted_class_name.title())

## シンプルな転移学習
AI Hub を利用することで、データセットのクラスを認識するための、モデルの最上位層を簡単に再訓練することができます。

### データセット
こちらの例では、TensorFlow flowers データセットを利用して進めます:

In [None]:
data_root = tf.keras.utils.get_file(
  'flower_photos','https://storage.googleapis.com/download.tensorflow.org/example_images/flower_photos.tgz',
   untar=True)

このデータをモデルにロードするには `tf.keras.preprocessing.image.ImageDataGenerator` を使うのがもっとも簡単な方法です。

すべての AI Hub の画像モジュールは [0, 1] の範囲で float で入力されることを想定しています。入力をリスケールする際には `ImageDataGenerator` の `rescale` パラメータを利用してください。

In [None]:
image_generator = tf.keras.preprocessing.image.ImageDataGenerator(rescale=1/255)
image_data = image_generator.flow_from_directory(str(data_root), target_size=IMAGE_SHAPE)

In [None]:
for image_batch, label_batch in image_data:
    print("Image batch shape: ", image_batch.shape)
    print("Label batch shape: ", label_batch.shape)
    break

### 分類器で画像をバッチ処理する
分類器で画像をバッチ処理します。（処理には数分かかります）

In [None]:
result_batch = model.predict(image_data)
result_batch.shape

In [None]:
predicted_class_names = imagenet_labels[np.argmax(result_batch, axis=-1)]
predicted_class_names

次に、これらの推論結果が画像とどのように一致するかを確認します:



In [None]:
plt.figure(figsize=(10,9))
plt.subplots_adjust(hspace=0.5)
for n in range(30):
    plt.subplot(6,5,n+1)
    plt.imshow(image_batch[n])
    plt.title(predicted_class_names[n])
    plt.axis('off')
_ = plt.suptitle("ImageNet predictions")

完璧とは程遠い結果ですが、この元のモデルはこれらのデータのクラスのために訓練されたものではない（"daisy" を除いて）ことを考慮すると、妥当な結果でしょう。


### ヘッドレスモデルのダウンロード
TensorFlow Hub は最上位の分類層を含まないモデルも配布しています。これらは転移学習に簡単に利用することができます。

In [None]:
feature_extractor_url = "https://tfhub.dev/google/tf2-preview/mobilenet_v2/feature_vector/4" 
feature_extractor_layer = hub.KerasLayer(feature_extractor_url,
                                         input_shape=(224,224,3))

In [None]:
feature_batch = feature_extractor_layer(image_batch)

これは画像毎に長さ 1280 のベクトルデータを返します:

In [None]:
feature_batch = feature_extractor_layer(image_batch)
print(feature_batch.shape)

特徴抽出レイヤーの変数をフリーズして、訓練が新しい分類器のレイヤーのみを変更するようにします。



In [None]:
feature_extractor_layer.trainable = False

### 上位の分類層を接合する
`tf.keras.Sequential` モデルの hub レイヤーをラップして、新しい分類層を追加します。

In [None]:
model = tf.keras.Sequential([
  feature_extractor_layer,
  layers.Dense(image_data.num_classes)
])

model.summary()

In [None]:
predictions = model(image_batch)

In [None]:
predictions.shape

### モデルの訓練

In [None]:
model.compile(
  optimizer=tf.keras.optimizers.Adam(),
  loss=tf.keras.losses.CategoricalCrossentropy(from_logits=True),
  metrics=['acc'])

ここでは、トレーニングは 2 エポックのみ行います。<br>
トレーニングのプロセスを可視化するために、各エポックの平均だけではなく各々のバッチで個別に損失と精度を記録するためのカスタムコールバックを使用します。

In [None]:
class CollectBatchStats(tf.keras.callbacks.Callback):
    def __init__(self):
        self.batch_losses = []
        self.batch_acc = []

    def on_train_batch_end(self, batch, logs=None):
        self.batch_losses.append(logs['loss'])
        self.batch_acc.append(logs['acc'])
        self.model.reset_metrics()

steps_per_epoch = np.ceil(image_data.samples/image_data.batch_size)

batch_stats_callback = CollectBatchStats()

history = model.fit_generator(image_data, epochs=2,
                              steps_per_epoch=steps_per_epoch,
                              callbacks = [batch_stats_callback])

ほんの数回の訓練の繰り返しで、タスクにおいてモデルが進歩していることが分かりました。

In [None]:
plt.figure()
plt.ylabel("Loss")
plt.xlabel("Training Steps")
plt.ylim([0,2])
plt.plot(batch_stats_callback.batch_losses)

In [None]:
plt.figure()
plt.ylabel("Accuracy")
plt.xlabel("Training Steps")
plt.ylim([0,1])
plt.plot(batch_stats_callback.batch_acc)

### 推論結果の確認
プロットを行うために、クラス名のリストを取得します:



In [None]:
class_names = sorted(image_data.class_indices.items(), key=lambda pair:pair[1])
class_names = np.array([key.title() for key, value in class_names])
class_names

画像のバッチをモデルに入力し、得られた ID をクラス名に変換します。



In [None]:
predicted_batch = model.predict(image_batch)
predicted_id = np.argmax(predicted_batch, axis=-1)
predicted_label_batch = class_names[predicted_id]

結果をプロットします

In [None]:
label_id = np.argmax(label_batch, axis=-1)

In [None]:
plt.figure(figsize=(10,9))
plt.subplots_adjust(hspace=0.5)
for n in range(30):
    plt.subplot(6,5,n+1)
    plt.imshow(image_batch[n])
    color = "green" if predicted_id[n] == label_id[n] else "red"
    plt.title(predicted_label_batch[n].title(), color=color)
    plt.axis('off')
_ = plt.suptitle("Model predictions (green: correct, red: incorrect)")

### モデルのエクスポート
訓練が完了したので、saved model としてエクスポートします:

In [None]:
import time
t = time.time()

export_path = "./saved_models/{}".format(int(t))
model.save(export_path, save_format='tf')

export_path

リロードできること、そしてエクスポートする前とおなじ結果が得られることを確認します:



In [None]:
reloaded = tf.keras.models.load_model(export_path)

In [None]:
result_batch = model.predict(image_batch)
reloaded_result_batch = reloaded.predict(image_batch)

In [None]:
abs(reloaded_result_batch - result_batch).max()

Copyright 2021 Google Inc.
Licensed under the Apache License, Version 2.0 (the "License"); you may not use this file except in compliance with the License. You may obtain a copy of the License at
http://www.apache.org/licenses/LICENSE-2.0
Unless required by applicable law or agreed to in writing, software distributed under the License is distributed on an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the License for the specific language governing permissions and limitations under the License.
Original: https://www.tensorflow.org/tutorials/images/transfer_learning_with_hub <br>