In [0]:
import os

In [2]:
# 今回使用するレポジトリをGoogle Colabの環境にクローン
!git clone https://github.com/s0yamazaki/WallClassification.git

Cloning into 'WallClassification'...
remote: Counting objects: 31398, done.[K
remote: Total 31398 (delta 0), reused 0 (delta 0), pack-reused 31398[K
Receiving objects: 100% (31398/31398), 331.74 MiB | 40.30 MiB/s, done.
Resolving deltas: 100% (40/40), done.


In [3]:
# メインスクリプトである`model.py`の使用方法を表示
!python model.py -h

python3: can't open file 'model.py': [Errno 2] No such file or directory


In [4]:
# メインスクリプトの格納ディレクトリに移動
os.chdir('WallClassification')
!ls

classes_extractor.py  googleImageDownloader.json  resize.py
continue_fit.py       model.py			  semi-teching.py
crop.py		      resized_cleaned		  WallClassification.ipynb
erase_duplicates.py   resized_val


In [0]:
# メインスクリプトを実行
# !python model.py testmodel

In [5]:
# 生成されたファイルとディレクトリを表示
print('* カレントディレクトリ')
!ls .
print('\n* testmodel ディレクトリ')
!ls ./testmodel

* カレントディレクトリ
classes_extractor.py  googleImageDownloader.json  resize.py
continue_fit.py       model.py			  semi-teching.py
crop.py		      resized_cleaned		  WallClassification.ipynb
erase_duplicates.py   resized_val

* testmodel ディレクトリ
ls: cannot access './testmodel': No such file or directory


In [6]:
"""
サンプルのモデルの定義と訓練を行うモジュール
vgg16をベースにした転移学習モデルとなっている。
"""
from keras.models import Model,Sequential
import tensorflow as tf
from keras.layers.convolutional import Conv2D
from keras.layers import Activation, Dense, GlobalAveragePooling2D, Input, InputLayer, Lambda, Dropout, BatchNormalization,LeakyReLU
from keras.backend import sigmoid
from keras.applications.vgg16 import VGG16, preprocess_input
from keras.preprocessing.image import ImageDataGenerator
from keras.optimizers import SGD, Adam
from keras.callbacks import CSVLogger
from keras.callbacks import TensorBoard, EarlyStopping
import sys
import numpy as np
from collections import Counter
import continue_fit as cf
from keras.utils import multi_gpu_model
from keras import regularizers
from keras.layers.advanced_activations import LeakyReLU
from keras import backend as K

# Swishの定義
# http://yusuke-ujitoko.hatenablog.com/entry/2017/10/21/131232
# https://qiita.com/kiakiraki/items/2ec24f13ee870e13a0fb
def swish(x):
    return x * K.sigmoid(x)

def vgg_based_model(input_shape, n_categories, fulltraining = False):
    """
    VGG16をベースにした転移学習モデルを生成する。
    fulltraining: Trueにすると、ベースモデルも含めて訓練可能にする。訓練速度が非常に遅くなる。
    """
    base_model=VGG16(weights='imagenet',include_top=False,
                    input_tensor=Input(shape=input_shape))

    #add new layers instead of FC networks
    x=base_model.output
    x=GlobalAveragePooling2D()(x)
    x=Dense(1024)(x)
    x=BatchNormalization()(x)
    x=Activation(swish)(x)
    x=Dropout(0.6)(x)
    x=Dense(1024)(x)
    x=BatchNormalization()(x)
    x=Activation(swish)(x)
    x=Dropout(0.6)(x)
    prediction=Dense(n_categories,activation='softmax')(x)
    model=Model(inputs=base_model.input,outputs=prediction)

    if not fulltraining:
        # fix weights before VGG16 14layers
        for layer in base_model.layers[:15]:
            layer.trainable=False
    return model


Using TensorFlow backend.


In [8]:
# コマンドライン引数の定義/評価
batch_size=32
input_shape = (224,224,3)
#  parser = argparse.ArgumentParser()
# parser.add_argument("model_name", help="保存するモデルファイルの名前、兼tensorBoardのログディレクトリ名")
# parser.add_argument("-t", "--train_dir", default='resized_cleaned', help="トレーニングデータセットが入っているディレクトリ")
# parser.add_argument("-v","--validation_dir",default='resized_val', help ="バリデーションデータセットが入っているディレクトリ")
# args = parser.parse_args()


file_name = 'test09' #args.model_name
train_dir= 'resized_cleaned' # args.train_dir
validation_dir= 'resized_val' # args.validation_dir

#訓練データの読み込み及びデータ拡張を行うための画像ジェネレータを生成。
#VGG16用の前処理及び平行移動、回転、左右反転、シアー変換をランダムにかける。
train_datagen=ImageDataGenerator(
    preprocessing_function=preprocess_input, #VGG16の前処理
    height_shift_range=0.02,
    width_shift_range=0.02,
    shear_range=0.05,
    zoom_range=0.05,
    rotation_range=5,
    horizontal_flip=True,
    )
train_generator=train_datagen.flow_from_directory(
    train_dir,
    target_size=input_shape[0:2],
    batch_size=batch_size,
    class_mode='categorical',
    shuffle=True
    )


n_categories=len(train_generator.class_indices)
#サンプルの多いクラスに予測が集中しないように、少ないサンプルのクラスほど重くなるように重みづけ
class_weight ={ clss: len(train_generator.classes) / len(train_generator.class_indices) / count
                 for (clss,count) in Counter(train_generator.classes).most_common() }
print("classes:",train_generator.class_indices)
print("class weight:",class_weight)

#バリデーションデータの画像読み込み処理を行うジェネレータを生成
validation_datagen=ImageDataGenerator(
    preprocessing_function=preprocess_input,
    )
validation_generator=validation_datagen.flow_from_directory(
    validation_dir,
    target_size=input_shape[0:2],
    batch_size=batch_size,
    class_mode='categorical',
    shuffle=True
)

model = vgg_based_model(input_shape, n_categories)
# parallel_model = multi_gpu_model(model, gpus=2)   #マルチGPUを使うときはこちら

model.compile(optimizer=Adam(lr=1e-3),
            loss='categorical_crossentropy',
            metrics=['accuracy'])

#訓練(中断しても続きから継続できる)
hist=model.fit_generator(
    train_generator,
    epochs=100,
    #initial_epoch=cf.load_epoch_init(file_name), # 同じモデル名でも結果を引き継がないようにコメントアウト
    # use_multiprocessing=True,
    verbose=1,
    workers=8,
    validation_data=validation_generator,
    class_weight=class_weight,
    callbacks=[
        CSVLogger(file_name+'.csv'),
        TensorBoard(file_name),
        cf.early_stopping(model, file_name),
        ])

Found 5234 images belonging to 11 classes.
classes: {'ALC板': 0, 'ガラスカーテンウォール': 1, 'ガラスブロック': 2, 'コンクリートブロック': 3, 'コンクリート打ち放し': 4, 'スパンドレル': 5, 'スレート波板張り': 6, 'タイル張り': 7, '吹付タイル': 8, '押出成形セメント板': 9, '石張り': 10}
class weight: {7: 0.38527788001472213, 1: 0.48701963338606125, 3: 0.6000229278917804, 4: 0.8994672624162227, 5: 0.967110125646711, 0: 1.310793889306286, 2: 1.6295143212951433, 9: 2.0687747035573123, 8: 2.44009324009324, 10: 5.4070247933884295, 6: 11.895454545454545}
Found 1020 images belonging to 11 classes.
Epoch 1/100

Epoch 2/100
Epoch 3/100
Epoch 4/100
 11/164 [=>............................] - ETA: 53s - loss: 1.3349 - acc: 0.4858

Epoch 5/100
Epoch 6/100

Epoch 7/100
Epoch 8/100
Epoch 9/100
  9/164 [>.............................] - ETA: 53s - loss: 0.8170 - acc: 0.7083

Epoch 10/100
Epoch 11/100

Epoch 12/100
Epoch 13/100
Epoch 14/100
  7/164 [>.............................] - ETA: 54s - loss: 0.6613 - acc: 0.7232

Epoch 15/100
Epoch 16/100

Epoch 17/100
Epoch 18/100
Epoch 19/100
  7/164 [>.............................] - ETA: 53s - loss: 0.3349 - acc: 0.8438

Epoch 20/100
Epoch 21/100

Epoch 22/100
Epoch 23/100
Epoch 24/100
  7/164 [>.............................] - ETA: 53s - loss: 0.2666 - acc: 0.9107

Epoch 25/100
Epoch 26/100

Epoch 27/100
Epoch 28/100
Epoch 29/100
  7/164 [>.............................] - ETA: 53s - loss: 0.1376 - acc: 0.9598

Epoch 30/100
Epoch 31/100

Epoch 32/100
Epoch 33/100
Epoch 34/100
  7/164 [>.............................] - ETA: 53s - loss: 0.0705 - acc: 0.9688

Epoch 35/100
Epoch 36/100

Epoch 37/100
Epoch 38/100
Epoch 39/100
  7/164 [>.............................] - ETA: 53s - loss: 0.0660 - acc: 0.9554

Epoch 40/100
Epoch 41/100

Epoch 42/100
Epoch 43/100
Epoch 44/100
  7/164 [>.............................] - ETA: 53s - loss: 0.1114 - acc: 0.9643

Epoch 45/100
Epoch 46/100

Epoch 47/100
Epoch 48/100
Epoch 49/100
  7/164 [>.............................] - ETA: 54s - loss: 0.0428 - acc: 0.9866

Epoch 50/100
Epoch 51/100

Epoch 52/100
Epoch 53/100
Epoch 54/100
  7/164 [>.............................] - ETA: 54s - loss: 0.0774 - acc: 0.9643

Epoch 55/100
Epoch 56/100

Epoch 57/100
Epoch 58/100
Epoch 59/100
  7/164 [>.............................] - ETA: 53s - loss: 0.0559 - acc: 0.9732

Epoch 60/100
Epoch 61/100

Epoch 62/100
Epoch 63/100
Epoch 64/100
  7/164 [>.............................] - ETA: 54s - loss: 0.0714 - acc: 0.9777

Epoch 65/100
Epoch 66/100

Epoch 67/100
Epoch 68/100
Epoch 69/100
  7/164 [>.............................] - ETA: 54s - loss: 0.0303 - acc: 0.9732

Epoch 70/100
Epoch 71/100

Epoch 72/100
Epoch 73/100
Epoch 74/100
  7/164 [>.............................] - ETA: 53s - loss: 0.0390 - acc: 0.9911

Epoch 75/100
Epoch 76/100

Epoch 77/100
Epoch 78/100
Epoch 79/100
  7/164 [>.............................] - ETA: 54s - loss: 0.3854 - acc: 0.8884

Epoch 80/100
Epoch 81/100

Epoch 82/100
Epoch 83/100
Epoch 84/100
  7/164 [>.............................] - ETA: 53s - loss: 0.0183 - acc: 0.9821

Epoch 85/100
Epoch 86/100

Epoch 87/100
Epoch 88/100
Epoch 89/100
  7/164 [>.............................] - ETA: 54s - loss: 0.0158 - acc: 0.9911

Epoch 90/100
Epoch 91/100

Epoch 92/100
Epoch 93/100
Epoch 94/100
  7/164 [>.............................] - ETA: 53s - loss: 0.0887 - acc: 0.9777

Epoch 95/100
Epoch 96/100

Epoch 97/100
Epoch 98/100
Epoch 99/100
  7/164 [>.............................] - ETA: 53s - loss: 0.0107 - acc: 0.9911

Epoch 100/100


In [0]:
"""
サンプルのモデルの定義と訓練を行うモジュール
vgg16をベースにした転移学習モデルとなっている。
"""
from keras.models import Model,Sequential
import tensorflow as tf
from keras.layers.convolutional import Conv2D
from keras.layers import Activation, Dense, GlobalAveragePooling2D, Input, InputLayer, Lambda, Dropout, BatchNormalization,LeakyReLU
from keras.backend import sigmoid
from keras.applications.vgg16 import VGG16, preprocess_input
from keras.preprocessing.image import ImageDataGenerator
from keras.optimizers import SGD, Adam
from keras.callbacks import CSVLogger
from keras.callbacks import TensorBoard, EarlyStopping
import sys
import numpy as np
from collections import Counter
import continue_fit as cf
from keras.utils import multi_gpu_model
from keras import regularizers
from keras.layers.advanced_activations import LeakyReLU

def vgg_based_model(input_shape, n_categories, fulltraining = False):
    """
    VGG16をベースにした転移学習モデルを生成する。
    fulltraining: Trueにすると、ベースモデルも含めて訓練可能にする。訓練速度が非常に遅くなる。
    """
    base_model=VGG16(weights='imagenet',include_top=False,
                    input_tensor=Input(shape=input_shape))

    #add new layers instead of FC networks
    x=base_model.output
    x=GlobalAveragePooling2D()(x)
    x=Dense(1024)(x)
    x=BatchNormalization()(x)
    x=Activation(LeakyReLU())(x)
    x=Dropout(0.6)(x)
    x=Dense(1024)(x)
    x=BatchNormalization()(x)
    x=Activation(LeakyReLU())(x)
    x=Dropout(0.6)(x)
    prediction=Dense(n_categories,activation='softmax')(x)
    model=Model(inputs=base_model.input,outputs=prediction)

    if not fulltraining:
        # fix weights before VGG16 14layers
        for layer in base_model.layers[:15]:
            layer.trainable=False
    return model


In [13]:
# コマンドライン引数の定義/評価
batch_size=32
input_shape = (224,224,3)
#  parser = argparse.ArgumentParser()
# parser.add_argument("model_name", help="保存するモデルファイルの名前、兼tensorBoardのログディレクトリ名")
# parser.add_argument("-t", "--train_dir", default='resized_cleaned', help="トレーニングデータセットが入っているディレクトリ")
# parser.add_argument("-v","--validation_dir",default='resized_val', help ="バリデーションデータセットが入っているディレクトリ")
# args = parser.parse_args()


file_name = 'test10' #args.model_name
train_dir= 'resized_cleaned' # args.train_dir
validation_dir= 'resized_val' # args.validation_dir

#訓練データの読み込み及びデータ拡張を行うための画像ジェネレータを生成。
#VGG16用の前処理及び平行移動、回転、左右反転、シアー変換をランダムにかける。
train_datagen=ImageDataGenerator(
    preprocessing_function=preprocess_input, #VGG16の前処理
    height_shift_range=5,
    width_shift_range=5,
    shear_range=0.05,
    zoom_range=0.95,
    rotation_range=7,
    horizontal_flip=True,
    )
train_generator=train_datagen.flow_from_directory(
    train_dir,
    target_size=input_shape[0:2],
    batch_size=batch_size,
    class_mode='categorical',
    shuffle=True
    )


n_categories=len(train_generator.class_indices)
#サンプルの多いクラスに予測が集中しないように、少ないサンプルのクラスほど重くなるように重みづけ
class_weight ={ clss: len(train_generator.classes) / len(train_generator.class_indices) / count
                 for (clss,count) in Counter(train_generator.classes).most_common() }
print("classes:",train_generator.class_indices)
print("class weight:",class_weight)

#バリデーションデータの画像読み込み処理を行うジェネレータを生成
validation_datagen=ImageDataGenerator(
    preprocessing_function=preprocess_input,
    )
validation_generator=validation_datagen.flow_from_directory(
    validation_dir,
    target_size=input_shape[0:2],
    batch_size=batch_size,
    class_mode='categorical',
    shuffle=True
)

model = vgg_based_model(input_shape, n_categories)
# parallel_model = multi_gpu_model(model, gpus=2)   #マルチGPUを使うときはこちら

model.compile(optimizer=Adam(lr=1e-3),
            loss='categorical_crossentropy',
            metrics=['accuracy'])

#訓練(中断しても続きから継続できる)
hist=model.fit_generator(
    train_generator,
    epochs=100,
    #initial_epoch=cf.load_epoch_init(file_name), # 同じモデル名でも結果を引き継がないようにコメントアウト
    # use_multiprocessing=True,
    verbose=1,
    workers=8,
    validation_data=validation_generator,
    class_weight=class_weight,
    callbacks=[
        CSVLogger(file_name+'.csv'),
        TensorBoard(file_name),
        # cf.early_stopping(model, file_name),
        ])

Found 5234 images belonging to 11 classes.
classes: {'ALC板': 0, 'ガラスカーテンウォール': 1, 'ガラスブロック': 2, 'コンクリートブロック': 3, 'コンクリート打ち放し': 4, 'スパンドレル': 5, 'スレート波板張り': 6, 'タイル張り': 7, '吹付タイル': 8, '押出成形セメント板': 9, '石張り': 10}
class weight: {7: 0.38527788001472213, 1: 0.48701963338606125, 3: 0.6000229278917804, 4: 0.8994672624162227, 5: 0.967110125646711, 0: 1.310793889306286, 2: 1.6295143212951433, 9: 2.0687747035573123, 8: 2.44009324009324, 10: 5.4070247933884295, 6: 11.895454545454545}
Found 1020 images belonging to 11 classes.


  identifier=identifier.__class__.__name__))


Epoch 1/100
Epoch 2/100
Epoch 3/100

Epoch 4/100
Epoch 5/100
Epoch 6/100
  6/164 [>.............................] - ETA: 55s - loss: 1.7584 - acc: 0.3542

Epoch 7/100
Epoch 8/100

Epoch 9/100
Epoch 10/100
Epoch 11/100
  8/164 [>.............................] - ETA: 54s - loss: 1.8313 - acc: 0.4414

Epoch 12/100
Epoch 13/100

Epoch 14/100
Epoch 15/100
Epoch 16/100
  7/164 [>.............................] - ETA: 54s - loss: 1.3389 - acc: 0.5402

Epoch 17/100
Epoch 18/100

Epoch 19/100
Epoch 20/100
Epoch 21/100
  7/164 [>.............................] - ETA: 54s - loss: 1.3004 - acc: 0.5605

Epoch 22/100
Epoch 23/100

Epoch 24/100
Epoch 25/100
Epoch 26/100
  7/164 [>.............................] - ETA: 54s - loss: 1.3646 - acc: 0.5491

Epoch 27/100
Epoch 28/100

Epoch 29/100
Epoch 30/100
Epoch 31/100
  7/164 [>.............................] - ETA: 55s - loss: 1.0413 - acc: 0.6071

Epoch 32/100
Epoch 33/100

Epoch 34/100
Epoch 35/100
Epoch 36/100
  7/164 [>.............................] - ETA: 55s - loss: 1.0276 - acc: 0.6607

Epoch 37/100
Epoch 38/100

Epoch 39/100
Epoch 40/100
Epoch 41/100
  7/164 [>.............................] - ETA: 54s - loss: 0.8849 - acc: 0.6652

Epoch 42/100
Epoch 43/100

Epoch 44/100
Epoch 45/100
Epoch 46/100
  7/164 [>.............................] - ETA: 54s - loss: 0.8873 - acc: 0.6518

Epoch 47/100
Epoch 48/100

Epoch 49/100
Epoch 50/100
Epoch 51/100
  7/164 [>.............................] - ETA: 54s - loss: 0.5121 - acc: 0.7589

Epoch 52/100
Epoch 53/100

Epoch 54/100
Epoch 55/100
Epoch 56/100
  7/164 [>.............................] - ETA: 54s - loss: 0.7881 - acc: 0.7634

Epoch 57/100
Epoch 58/100

Epoch 59/100
Epoch 60/100
Epoch 61/100
  7/164 [>.............................] - ETA: 54s - loss: 0.9767 - acc: 0.6518

Epoch 62/100
Epoch 63/100

Epoch 64/100
Epoch 65/100
Epoch 66/100
  7/164 [>.............................] - ETA: 54s - loss: 0.9381 - acc: 0.7143

Epoch 67/100
Epoch 68/100

Epoch 69/100
Epoch 70/100
Epoch 71/100
  7/164 [>.............................] - ETA: 54s - loss: 0.5634 - acc: 0.7455

Epoch 72/100
Epoch 73/100

Epoch 74/100
Epoch 75/100
Epoch 76/100
  7/164 [>.............................] - ETA: 54s - loss: 0.6310 - acc: 0.7902

Epoch 77/100
Epoch 78/100

Epoch 79/100
Epoch 80/100
Epoch 81/100
  7/164 [>.............................] - ETA: 54s - loss: 0.4803 - acc: 0.7321

Epoch 82/100
Epoch 83/100

Epoch 84/100
Epoch 85/100
Epoch 86/100
  7/164 [>.............................] - ETA: 54s - loss: 0.5744 - acc: 0.7723

Epoch 87/100
Epoch 88/100

Epoch 89/100
Epoch 90/100
Epoch 91/100
  7/164 [>.............................] - ETA: 54s - loss: 0.5478 - acc: 0.7946

Epoch 92/100
Epoch 93/100

Epoch 94/100
Epoch 95/100
Epoch 96/100
  7/164 [>.............................] - ETA: 54s - loss: 0.4565 - acc: 0.8036

Epoch 97/100
Epoch 98/100

Epoch 99/100
Epoch 100/100
