# ファインチューニングの実装
転移学習では学習済みモデルの訓練は行いませんでしたが、ファインチューニングでは一部を訓練します。
学習済みのモデルの一部と、新たに追加した層を訓練して画像の分類を行います。  



## 各設定
tensorflowとKerasのバージョンによっては、Kerasのコードでエラーが発生することがあります。エラーを回避するために、以下のセルでKerasのバージョンを指定してインストールします。  
以下のコードは、デフォルトのバージョンでエラーが発生しないときには必要ありません。

In [None]:
!pip install keras==2.3  # 2020/3/28の時点ではtensorflow2.Xに対応するために必要

なお、Googleの対応により上記のコードは近いうちに必要なくなるかと思います。  
今後tensorflowやKerasのバージョンアップにより同様の問題が発生する可能性がありますが、上記のようにしてバージョンを調整することによる対応が必要になります。  
上記のセルの実行後、**ランタイム→ランタイムを再起動**によりバージョンの更新が完了します。  
念のために、以下のコードによりバージョンを確認しておきましょう。

In [None]:
import tensorflow
import keras
print(tensorflow.__version__)
print(keras.__version__)

必要なモジュールのインポート、最適化アルゴリズムの設定、及び各定数の設定を行います。  
今回はCIFAR-10の分類を行うので、画像の幅と高さは32、チャンネル数は3に設定します。

In [None]:
import numpy as np
import matplotlib.pyplot as plt 

from keras.models import Sequential
from keras.layers import Dense, Dropout, Activation, Flatten
from keras.optimizers import Adam

optimizer = Adam()

img_size = 64  # 画像の幅と高さ
n_channel = 3  # チャンネル数
n_mid = 256  # 中間層のニューロン数

batch_size = 32
epochs = 20

## VGG16の導入
ImageNetを使って訓練済みのモデル、VGG16をkeras.applicationsから導入します。  
https://keras.io/ja/applications/#vgg16

In [None]:
from keras.applications import VGG16

model_vgg16 = VGG16(weights="imagenet",  # ImageNetで学習したパラメータを使用
                 include_top=False,  # 全結合層を含まない
                 input_shape=(img_size, img_size, n_channel))  # 入力の形状
model_vgg16.summary()

## CIFAR-10
Kerasを使い、CIFAR-10を読み込みます。  
今回はこのうち飛行機と自動車の画像のみ使い、画像が飛行機か自動車かを判定できるように訓練を行います。  
以下のコードでは、CIFAR-10を読み込み、ランダムな25枚の画像を表示します。  
元の画像サイズは32×32なのですが、VGG16の入力は48x48以上のサイズである必要があるため、NumPyのrepeat関数によりサイズを2倍に調整します。  


In [None]:
from keras.datasets import cifar10

(x_train, t_train), (x_test, t_test) = cifar10.load_data()

# ラベルが0と1のデータのみ取り出す
t_train = t_train.reshape(-1)
t_test = t_test.reshape(-1)
x_train = x_train[t_train <= 1]
t_train = t_train[t_train <= 1]
x_test = x_test[t_test <= 1]
t_test = t_test[t_test <= 1]

print("Original size:", x_train.shape)

# 画像を拡大
x_train = x_train.repeat(2, axis=1).repeat(2, axis=2)
x_test = x_test.repeat(2, axis=1).repeat(2, axis=2)

print("Input size:", x_train.shape)

n_image = 25
rand_idx = np.random.randint(0, len(x_train), n_image)
cifar10_labels = np.array(["airplane", "automobile"])
plt.figure(figsize=(10,10))  # 画像の表示サイズ
for i in range(n_image):
    cifar_img=plt.subplot(5,5,i+1)
    plt.imshow(x_train[rand_idx[i]])
    label = cifar10_labels[t_train[rand_idx[i]]]
    plt.title(label)
    plt.tick_params(labelbottom=False, labelleft=False, bottom=False, left=False)  # ラベルと目盛りを非表示に

## モデルの構築
導入したVGG16に全結合層を追加します。  
訓練するのはVGG16の一部、および追加した全結合層です。  
VGG16では、block5にある複数の畳み込み層のみを訓練可能に設定します。  


In [None]:
model = Sequential()
model.add(model_vgg16)

model.add(Flatten())  # 一次元の配列に変換
model.add(Dense(n_mid))
model.add(Activation("relu"))
model.add(Dropout(0.5))  # ドロップアウト
model.add(Dense(1))
model.add(Activation("sigmoid"))

# block5のみ訓練する
for layer in model_vgg16.layers:
    if layer.name.startswith("block5_conv"):
        layer.trainable = True
    else:
        layer.trainable = False

model.compile(optimizer=Adam(), loss="binary_crossentropy", metrics=["accuracy"])
model.summary()

## 学習
モデルを訓練します。  
過学習を防ぐために、データ拡張を導入します。  
学習には時間がかかりますので、編集→ノートブックの設定のハードウェアアクセラレーターでGPUを選択しましょう。  

In [None]:
from keras.preprocessing.image import ImageDataGenerator

x_train = x_train / 255  # 0から1の範囲に収める
x_test = x_test / 255

# データ拡張
generator = ImageDataGenerator(
           rotation_range=0.2,
           width_shift_range=0.2,
           height_shift_range=0.2,
           shear_range=10,
           zoom_range=0.2,
           horizontal_flip=True)
generator.fit(x_train)

# 訓練
history = model.fit_generator(generator.flow(x_train, t_train, batch_size=batch_size),
                              epochs=epochs,
                              validation_data=(x_test, t_test))

訓練するパラメータがより増えるので、転移学習の際よりも学習に時間がかかります。

## 学習の推移
historyを使って、学習の推移を確認します。

In [None]:
import matplotlib.pyplot as plt

train_loss = history.history['loss']  # 訓練用データの誤差
train_acc = history.history['accuracy']  # 訓練用データの精度
val_loss = history.history['val_loss']  # 検証用データの誤差
val_acc = history.history['val_accuracy']  # 検証用データの精度

plt.plot(np.arange(len(train_loss)), train_loss, label='loss')
plt.plot(np.arange(len(val_loss)), val_loss, label='val_loss')
plt.legend()
plt.show()

plt.plot(np.arange(len(train_acc)), train_acc, label='acc')
plt.plot(np.arange(len(val_acc)), val_acc, label='val_acc')
plt.legend()
plt.show()

訓練済みのモデルの一部を追加で訓練することにより、高い精度で画像の分類ができるようになりました。