# 画像分類
## 〜 猫と犬の2クラス分類モデルの作成 〜
  

---
## 分類モデルの学習に必要なもの
＜学習環境＞
   * プログラム言語: python
   * 画像処理ライブラリ: opencv
   * 機械学習用フレームワーク: keras     
   * テキストエディタ: jupyter notebook   ...etc
  
  
＜学習データ＞  ※水増し後(水増し前)
* 猫: 5005枚（2505枚） 
    * 訓練データ: 4000枚（2000枚）
    * 検証データ: 1000枚（500枚）
    * テストデータ: 5枚 
* 犬: 5005枚（2505枚）
    * 訓練データ: 4000枚（2000枚）
    * 検証データ: 1000枚（500枚）
    * テストデータ: 5枚 

※ 訓練(train)データ: 機械学習モデル自体を学習するためのデータ  
※ 検証(validation)データ: 訓練中に定期的に学習の結果を評価するためのデータ  
※ テスト(test)データ: モデル作成後、モデルの最終的な精度を評価するためのデータ  

---
## 学習手順
1. 学習データの前処理
    * データの水増し
    * データの形式変換（機械学習用フレームワークに合わせるため）

  
2. モデルの設計
      

3. ハイパーパラメータの調整
    * 調整することが多いパラメータ
        * 学習率: 重みの更新幅（大きくしすぎると過学習しやすく、小さくしすぎると誤差の収束に時間がかかる）  
        * batch size: 訓練データをサブセットに分けた時のサブセットのデータ数  
        * epoch: 学習回数（訓練データを繰り返し学習させる回数）  
  
  
4. 学習開始

---
## 学習データの前処理用プログラム

In [None]:
import cv2
import numpy as np
import matplotlib.pyplot as plt
from keras.preprocessing import image
from keras.preprocessing.image import ImageDataGenerator

In [None]:
# 画像サイズ
img_size = 64

# 訓練用データセットの水増し設定
train_datagen = ImageDataGenerator(
    rescale = 1. / 255,             # 画像の値を0-1に正規化
    horizontal_flip = True,       # 左右反転: 画像をランダムに左右反転させる (True, False)
    vertical_flip = False,          # 上下反転:　画像をランダムに上下反転させる (True, False)
    rotation_range = 0,          # 回転: 画像を指定した範囲内でランダムに回転させる　（-90~90）
    width_shift_range = 0,    # 水平シフト: 画像を指定した範囲内でランダムに水平移動する (0~1) ← 横幅に対する割合
    height_shift_range = 0,  # 垂直シフト: 画像を指定した範囲内でランダムに垂直移動する (0~1) ← 縦幅に対する割合
    shear_range = 0,              # シアー強度: 画像を指定した範囲内でランダムにシアー変換する (-90~90) 
    zoom_range = 0,             # ズーム: 画像を指定した範囲内でランダムにズームする (0~1) 
)

# 検証用データセットの水増し設定
valid_datagen = ImageDataGenerator(
    rescale = 1. / 255,
    horizontal_flip = True,
    vertical_flip = False, 
    rotation_range = 0,
    width_shift_range = 0,
    height_shift_range = 0,
    shear_range = 0,
    zoom_range = 0
)

# 訓練用データセットの読み込み
train_generator = train_datagen.flow_from_directory(
    'data/train/',                                         # 訓練データセットの格納ディレクトリ
    target_size = (img_size, img_size),  # 64×64にリサイズ
    batch_size = 128,                                # batch sizeの指定
    class_mode = 'categorical')                   

# 検証用データセットの読み込み
validation_generator = valid_datagen.flow_from_directory(
    'data/valid/', 
    target_size = (img_size, img_size),
    batch_size = 128,
    class_mode = 'categorical')

### ＜おまけ＞ データ拡張(Data Augmentation)後の画像を表示する

In [None]:
def show_imgs(imgs, row, col):
    if len(imgs) != (row * col):
        raise ValueError("Invalid imgs len:{} col:{} row:{}".format(len(imgs), row, col))

    for i, img in enumerate(imgs):
        # 画像の貼り付け箇所
        plot_num = i + 1
        # サブプロットの作成
        plt.subplot(row, col, plot_num)
        # ラベル, 軸の削除
        plt.tick_params(bottom=False, left=False, right=False, top=False)
        plt.tick_params(labelbottom=False, labelleft=False, labelright=False, labeltop=False) 
        # 貼り付け
        plt.imshow(img)
    # 表示
    plt.show()

    
# 画像を読み込み
img = cv2.imread("data/train/dog/dog.348.jpg")
# BGR → RGB
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
# 画像をnumpyのndarray形式に変換
x = np.asarray(img)
# # (height, width, 3) -> (1, height, width, 3)
x = x.reshape((1,) + x.shape)

# 表示枚数
max_img_num = 9
# imgsリスト: 水増しした画像を格納するためのリスト
imgs = []

# 水増しした画像をimgsに格納
for d in train_datagen.flow(x, batch_size=1):
    # ndarrayをPIL形式に変換して保存する
    imgs.append(image.array_to_img(d[0], scale=True))
    # 必要な枚数取得できたらループを抜ける
    if (len(imgs) % max_img_num) == 0:
        break
        
# show_imgs関数の呼び出し
show_imgs(imgs, row=3, col=3)


---
## 学習用プログラム

In [None]:
import keras
from keras.layers import Activation, Conv2D, Dense, GlobalAveragePooling2D, Flatten, MaxPooling2D, Dropout, BatchNormalization
from keras.models import Sequential
from keras.utils.np_utils import to_categorical
from keras import optimizers
from keras.optimizers import Adam

In [None]:
# モデルの設計
model = Sequential()
# 畳み込み1層目
model.add(Conv2D(32, (3,3), activation="relu", input_shape=(img_size, img_size, 3)))
model.add(BatchNormalization())
model.add(MaxPooling2D((2, 2)))
 # 畳み込み2層目
model.add(Conv2D(64, (3, 3), activation="relu"))
model.add(BatchNormalization())
model.add(MaxPooling2D((2, 2)))
 # 畳み込み3層目
model.add(Conv2D(128, (3, 3), activation="relu"))
model.add(BatchNormalization())
model.add(MaxPooling2D((2, 2)))
#  全結合層
model.add(Flatten())
model.add(Dropout(0.5))
model.add(Dense(256, activation="relu"))
model.add(BatchNormalization())
model.add(Dense(2))                     
model.add(Activation('softmax'))

# モデルの構造を出力
model.summary()

In [None]:
# *** ハイパーパラメータ ***

# 学習更新回数 epoch = iteration / (データ数 / バッチサイズ)
epochs = 10 
# バッチサイズ
batch_size = 128 
# 学習率
lr = 0.0001

In [None]:
# コンパイル
adam = Adam(lr, beta_1=0.9, beta_2=0.999, epsilon=1e-08) # 最適化手法: Adam
model.compile(optimizer=adam, loss='categorical_crossentropy', metrics=['accuracy'])

# 学習
history = model.fit_generator(train_generator,
                                                    steps_per_epoch = len(train_generator) * 2,  
                                                    validation_data = validation_generator, 
                                                    validation_steps = len(validation_generator) * 2, 
                                                    epochs = epochs, 
                                                    verbose=1)

# acc, val_accの図をプロット
plt.plot(history.history["acc"], label="acc", ls="-", marker="o")
plt.plot(history.history["val_acc"], label="val_acc", ls="-", marker="x")
plt.ylabel("accuracy")
plt.xlabel("epoch")
plt.ylim([0,1])
plt.legend(loc="best")
plt.show()

# loss, val_lossの図をプロット
plt.plot(history.history["loss"], label="loss", ls="-", marker="o")
plt.plot(history.history["val_loss"], label="val_loss", ls="-", marker="x")
plt.ylabel("loss")
plt.xlabel("epoch")
plt.ylim([0,1])
plt.legend(loc="best")
plt.show()

# モデルを保存
model.save("model/my_model.h5")

---
## 推論用プログラム
#### 作成したモデルで実際に分類してみましょう！

In [None]:
from keras.models import  load_model
import sys
import glob

In [None]:
# クラス名を定義
name = ["cat", "dog"]

# モデルの読み込み
model = load_model('model/my_model.h5')

#　画像ファイルのpathを取得
path = "data/test/"
files = sorted(glob.glob(path + "/*.jpg")) 

#　各画像の形式を変換
for f in files:
    img = cv2.imread(f) #　画像を読み込む
    img = cv2.resize(img, (img_size, img_size)) #　画像を64×64にリサイズ

    # 画像が見つからなかった場合、Not openを出力
    if img is None:
        print("Not open:")
    
    # 画像をモデルが読み込めるように変換
    data = cv2.resize(img, (img_size, img_size))
    x = np.asarray(data)
    x = x.reshape(-1, img_size, img_size, 3)
    x = x.astype("float32") / 255
    # 推論
    pre = model.predict([x])[0]
    idx = pre.argmax()
    # 結果を出力
    print(">> 予測結果↓\n" + name[0] + ": " + str(round(pre[0]*100, 2)) + "%\n" + name[1] + ": " + str(round(pre[1]*100, 2)) + "%\n")
    print(">> この画像は「" + name[idx].replace(",", "") + "」です。")

    # BGR → RGB
    img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
    
    # 画像の表示
    plt.imshow(img)
    plt.show()
    print("----------------------------------------------------")