<a href="https://colab.research.google.com/github/yuu-eguci/flower-stuff-lab/blob/main/goodluckpenpen/sample.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
!nvidia-smi

In [1]:
# Google Drive をマウントします。
# NOTE: 左のトコをポチポチやってマウントすることも出来ますが、マウントすることを明示するほうが好みなのでしています。
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [None]:
# 17flowers dataset を取得します。
# NOTE: マイドライブに 17flowers.zip を置いてある必要があります。自分で用意してください。
#       /content は一時領域なので、数時間ごとに消滅します。
#       だからイチイチ、 unzip しています。
!unzip "/content/drive/MyDrive/datasets/17flowers.zip" -d "/content"

In [3]:
# 学習用画像が格納されているフォルダです。
TRAIN_DIR = '/content/17flowers/train_images'
# テスト用画像が格納されているフォルダです。
TEST_DIR = '/content/17flowers/test_images'

In [4]:
from keras.models import Model
from keras.layers import Dense, GlobalAveragePooling2D, Input
from keras.applications.vgg16 import VGG16
from keras.preprocessing.image import ImageDataGenerator
from keras.optimizers import SGD

In [None]:
# VGG16 のデフォルトである 224x224 でインプットを定義します。
# NOTE: <class 'keras.engine.keras_tensor.KerasTensor'>
# NOTE: Tensor は
#       > 線形的な量または線形的な幾何概念を一般化したもので、基底を選べば、多次元の配列として表現できるようなものである。
#       > (Wikipedia より)
#       です。(?)
input_tensor = Input(shape=(224, 224, 3))

# VGG16 をロードします。
# が、今回はフル結合3層をつけずにロードしています。
# NOTE: include_top=False がフル結合3層をつけないという指定です。
#       VGG16 は畳み込み13層とフル結合3層の計16層から成ります。
#       なので、いうなれば VGG13 になってるってこと。
#       (これは理解しやすいからそう書いているだけで誤解なきよう。)
# NOTE: <class 'keras.engine.functional.Functional'>
base_model = VGG16(weights='imagenet', include_top=False, input_tensor=input_tensor)

# 新たな層を追加しています。
# この output っていうのが現在の最後の13層目のことです。
# NOTE: <class 'keras.engine.keras_tensor.KerasTensor'>
x = base_model.output

# GlobalAveragePooling2D という層を足しています。(14層目)
# NOTE: さっき VGG13 だったのが VGG14 になるってこと。
#       (これは理解しやすいからそう書いているだけなので他所で言わないように。)
# NOTE: Dense は時間がかかるが GlobalAveragePooling は高速だという話です。
x = GlobalAveragePooling2D()(x)

# Dense という層を足しています。(15層目)
x = Dense(1024, activation='relu')(x)

# ここが自分の追加したい層。(16層目)
y = Dense(17, activation='softmax')(x)

# 完成したこれが層のかたまり。
# NOTE: x とか y とかって変数名を使っているのは、このモデルの構築手順は数式で表せる(らしい)からです。
#       こんな感じに。こういうのって数式って言うの? 方程式じゃなくて?
#       y = Dense(Dense(GlobalAveragePooling2D(x)))
# NOTE: <class 'keras.engine.functional.Functional'>
model = Model(inputs=base_model.input, outputs=y)

# 構築した改造 VGG16 を閲覧します。
# VGG1 6の構造に加え、最後に層が追加されている事がわかります。
# NOTE: こういうのが増えてる
#       dense_1 (Dense)              (None, 17)                17425
#       たぶん17ってのが Dense(17... で追加した層だろう。
model.summary()

# VGG16 の全層の重みを固定しています。
# VGG16 側の層の重みは学習時に変更されません。
# base_model は最初に用意した13層のこと。
# これはもう学習終わってんのだから(imagenet で)、 train する必要なしです。
for layer in base_model.layers:
    layer.trainable = False

# モデルを作っただけだと線形の結果しか出ません。
# y = a * b * c * x みたいなものだからです。
# 係数を自分で変更させるように……
model.compile(
    optimizer=SGD(
        # NOTE: サンプルコードでは lr になっていたが、
        #       UserWarning: The `lr` argument is deprecated, use `learning_rate` instead.
        #       が出るので learning_rate へ変更しました。
        learning_rate=0.0001,
        momentum=0.9,
    ),
    # 右辺と左辺の差を小さくするためのもの。微分です。
    loss='categorical_crossentropy',
    metrics=['accuracy'],
)

# Training に使う画像を生成する ImageDataGenerator を作ります。
# NOTE: ImageDataGenerator は与えた画像をいじり、 training に使う画像パターンを増やします。
#       https://keras.io/ja/preprocessing/image/
# NOTE: <class 'keras.preprocessing.image.ImageDataGenerator'>
image_data_generator_to_train = ImageDataGenerator(
    rescale=1.0 / 255,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,
    rotation_range=10,
)

# 予測? 類推? 推測?(用語がわからん)テストに使う画像を生成する ImageDataGenerator を作ります。
# NOTE: どうして小さくしているのかというと、モデルは小数点で学習するからです。
#       どういうこと?
image_data_generator_to_test = ImageDataGenerator(
    rescale=1.0 / 255,
)

# ImageDataGenerator へ画像を与えます。
# NOTE: <class 'keras.preprocessing.image.DirectoryIterator'>
directory_iterator_for_training = image_data_generator_to_train.flow_from_directory(
    TRAIN_DIR,
    target_size=(224, 224),
    batch_size=16,
    class_mode='categorical',
    shuffle=True,
)

directory_iterator_for_test = image_data_generator_to_test.flow_from_directory(
    TEST_DIR,
    target_size=(224, 224),
    batch_size=16,
    class_mode='categorical',
    shuffle=True,
)

# ここで学習を行います。なので時間かかります。
# fit は学習のメソッドです。
# NOTE: サンプルコードでは Model.fit_generator になっていたが、
#       UserWarning: `Model.fit_generator` is deprecated and
#                    will be removed in a future version.
#                    Please use `Model.fit`, which supports generators.
#       が出るため model.fit に変更しました。
# NOTE: <class 'keras.callbacks.History'>
history = model.fit(
    directory_iterator_for_training,
    # NOTE: 1190 はトレーニング用の枚数です。 70*17=1190
    steps_per_epoch=1190 // 16,
    epochs=100,
    verbose=1,
    validation_data=directory_iterator_for_test,
    # NOTE: 170 はテスト用の枚数です。 10*17=170
    validation_steps=170 // 16,
)
print(type(history))

# 保存したものを予測にしか使わないなら include_optimizer=False を設定しておくと、サイズが半分以下になるそうだ。
# NOTE: 保存したファイルを利用するのは別ファイルです。
model.save('17flowers.hdf5')

In [10]:
from keras.applications.vgg16 import VGG16
from keras.models import Model
from keras.layers import Input, GlobalAveragePooling2D, Dense
from keras.preprocessing import image
import numpy

In [11]:
CLASSES_FOR_17FLOWERS = [
    'Tulip', 'Snowdrop', 'LilyValley', 'Bluebell', 'Crocus',
    'Iris', 'Tigerlily', 'Daffodil', 'Fritillary', 'Sunflower',
    'Daisy', 'ColtsFoot', 'Dandelion', 'Cowslip', 'Buttercup',
    'Windflower', 'Pansy',
]

In [12]:
# test_vgg16.py で行っているのと同じように、
# 引数で与えられた画像を、予測へまわせる形式へ変換します。
# <class 'PIL.Image.Image'>
#       -> 3次元テンソル <class 'numpy.ndarray'>
#       -> 4次元テンソル <class 'numpy.ndarray'>
image_pil = image.load_img('/content/drive/MyDrive/keras-vgg16-lab/test-images/sunflower.jpg', target_size=(224, 224))
image_array_3dim = image.img_to_array(image_pil)
image_array_4dim = numpy.expand_dims(image_array_3dim, axis=0)

# 学習時(fine_tuning_17flowers.py)において、 ImageDataGenerator の rescale で正規化したので同じ処理が必要。
# XXX: ……らしいですよくわかんないです。
# これを忘れると結果がおかしくなる。
# XXX: ……らしいですよくわかんないです。
# NOTE: どうおかしくなるのかわからなかったのでこれをやらないで試しました。
#       やって sunflower.jpg 試した場合↓
#           ('Cowslip', 0.14450616)
#           ('Sunflower', 0.08813832)
#           ('Tigerlily', 0.07421722)
#       やらないで試した場合↓
#           ('Cowslip', 0.9992175)
#           ('Tigerlily', 0.0007754794)
#           ('Buttercup', 6.109471e-06)
image_array_4dim = image_array_4dim / 255.0

# fine_tuning_17flowers.py で一番最初に作っているのと同じ、 VGG13(仮) + 自作3層 を用意します。
# NOTE: Fine tuning 関連の記事ではよく Sequential が使われているけどまずこれでいく。
input_tensor = Input(shape=(224, 224, 3))
base_model = VGG16(weights='imagenet', include_top=False, input_tensor=input_tensor)
x = base_model.output
x = GlobalAveragePooling2D()(x)
x = Dense(1024, activation='relu')(x)
y = Dense(17, activation='softmax')(x)
model = Model(inputs=base_model.input, outputs=y)

# Fine tuning ではこのあと重み固定(layer.trainable = False)とかをしています。
# 今回は学習を行う必要がありません。 Weight file はすでにあるので。
model.load_weights('/content/17flowers.hdf5')

# NOTE: predict 前に model.compile する必要はありますか?
#       試しました。
#       やって sunflower.jpg 試した場合↓
#           ('Cowslip', 0.14450616)
#           ('Sunflower', 0.08813832)
#           ('Tigerlily', 0.07421722)
#       やらないで試した場合。あ、変わらないじゃん。やらないでいいみたい。
#           ('Cowslip', 0.14450616)
#           ('Sunflower', 0.08813832)
#           ('Tigerlily', 0.07421722)

# 予測を行います。
# NOTE: test_vgg16 では
#       predictions = vgg16.predict(preprocess_input(image_array_4dim))
#       top_5_predictions = decode_predictions(predictions, top=5)[0]
#       でしたね。どういうことやねん。
# NOTE: test_vgg16.py では preprocess_input を使っていたのにどうしてこっちでは使わないのだろう?
#       と思ったので使って試しました。
#       使わず sunflower.jpg 試した場合↓
#           ('Cowslip', 0.14450616)
#           ('Sunflower', 0.08813832)
#           ('Tigerlily', 0.07421722)
#       使って試した場合。 Sunflower が消えた。
#           ('Iris', 0.16075435)
#           ('Tulip', 0.15425675)
#           ('Fritillary', 0.13122706)
prediction = model.predict(image_array_4dim)[0]
top_indices = prediction.argsort()[-5:][::-1]
result = [(CLASSES_FOR_17FLOWERS[i], prediction[i]) for i in top_indices]
for x in result:
    print(x)

('Cowslip', 0.27655578)
('Sunflower', 0.09722084)
('Tigerlily', 0.09410678)
('Pansy', 0.068630874)
('Snowdrop', 0.062643126)
