# 画像分類
## 〜 ラブラドゥードルとフライドチキンを分類できるのか 〜
  
  
![dog-food-comparison-bagel-muffin-lookalike-teenybiscuit-karen-zack-5__700.jpg](attachment:dog-food-comparison-bagel-muffin-lookalike-teenybiscuit-karen-zack-5__700.jpg)

---
## 分類モデルの学習に必要なもの
＜学習環境＞
   * プログラム言語（python）　　
   * 画像処理ライブラリ（opencv）
   * 機械学習用フレームワーク（keras）     
   * テキストエディタ（jupyter notebook）   ...etc
  
  
＜学習データ＞  
* ラブラドゥードル: 1000枚  
    * 訓練データ: 796枚
    * 検証データ: 199枚 
    * テストデータ: 5枚 
* フライドチキン: 1000枚  
    * 訓練データ: 796枚
    * 検証データ: 199枚
    * テストデータ: 5枚 

※ 訓練(train)データ: 機械学習モデル自体を学習するためのデータ  
※ 検証(validation)データ: 定期的に学習の結果を評価するためのデータ  
※ テスト(test)データ: モデル作成後、モデルの最終的な精度を評価するためのデータ  

---
## 学習手順
1. 学習データの前処理
    * データの水増し
    * データの形式変換（フレームワークに合わせるため）

  
2. モデルの設計
    * 過学習しないように気をつける
    * モデル設計は経験が物を言う
      

3. ハイパーパラメータの調整
    * 調整することが多いパラメータ
        * バッチサイズ: 訓練データをサブセットに分けた時のサブセットのデータ数
        * epoch: 学習回数（訓練データを繰り返し学習させる回数）
        * 学習率: 重みの更新幅（大きくしすぎると過学習しやすく、小さくしすぎると誤差の収束に時間がかかる）
  
  
4. 実行

---
## 学習データの前処理用プログラム

In [1]:
import cv2
import numpy as np
import os, glob, random

In [2]:
# クラス名を定義
name = ["labradoodle", "friedchicken"]

In [3]:
# 保存ファイル名
outfile = "labradoodle-or-friedchicken.npz"

image_size = 64 # 画像のサイズ
x = [] #　画像データのリストを用意
y = [] #　ラベルデータのリストを用意

def main():
    for i in range(len(name)):
        glob_files("training_set/" + name[i], i) # glob_files()関数の読み込み

    #　ファイルを保存
    np.savez(outfile, x=x, y=y) #　xとyがnumpyのリストとして与えられる
    print("保存しました：" + outfile, len(x))
    
    
#　各画像をkerasで読み込める形式に変換
def glob_files(path, label):
    files = glob.glob(path + "/*.jpg") #　path以下の画像を読み込む
    random.shuffle(files) # 画像の順番をシャッフルする
    
    num = 0 # カウンタ
    
    #　各画像の形式を変換
    for f in files:
        num += 1 # カウントアップ
        img = cv2.imread(f) #　画像を読み込む
        img = cv2.resize(img, (image_size, image_size )) #　画像を64×64にリサイズ
        img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) # RGB → BGRに変換
        img = np.asarray(img) # np.array形式に変換
        x.append(img) # 画像データのリストに追加
        y.append(label) # ラベルデータのリストに追加
        
    print(num) # 何枚の画像を処理したのか出力

if __name__=="__main__":
    # main()関数の読み込み
    main()

0
0
保存しました：labradoodle-or-friedchicken.npz 0


---
## 学習用プログラム

In [None]:
import keras
from keras.layers import Activation, Conv2D, Dense, GlobalAveragePooling2D, Flatten, MaxPooling2D, Dropout, BatchNormalization
from keras.models import Sequential
from keras.utils.np_utils import to_categorical
from keras import optimizers
from keras.optimizers import Adam
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split

In [None]:
# 学習データファイルの読み込み
image = np.load("labradoodle-or-friedchicken.npz")
x = image["x"] # 画像データ
y = image["y"] # ラベルデータ

#　読み込んだデータを三次元配列に変換
x = x.reshape(-1, 64, 64, 3)
x = x.astype("float32") / 255
#　ラベルデータをone-hotベクトルに直す
y = keras.utils.np_utils.to_categorical(y.astype("int32"), 2)
#　学習用と検証用に分ける
X_train, X_valid, y_train, y_valid = train_test_split(x, y, train_size=0.8)

# 学習用とテスト用のデータ数を確認
print(len(X_train))
print(len(y_train))
print(len(X_valid))
print(len(y_valid))

In [None]:
# モデルの設計
model = Sequential()
# 畳み込み1層
model.add(Conv2D(input_shape=(64, 64, 3), filters=32, kernel_size=(3, 3), strides=(1, 1), padding="same"))
model.add(BatchNormalization())
model.add(Activation("relu"))
model.add(MaxPooling2D(pool_size=(2, 2)))
# 畳み込み2層
model.add(Conv2D(filters=64, kernel_size=(3, 3), strides=(1, 1), padding="same"))
model.add(BatchNormalization())
model.add(Activation("relu"))
model.add(MaxPooling2D(pool_size=(2, 2)))
#  全結合層
model.add(GlobalAveragePooling2D())
model.add(Dense(256))
model.add(Activation("sigmoid"))
model.add(Dropout(0.5))
model.add(Dense(2))
model.add(Activation('softmax'))

In [None]:
# モデルの構造を出力
model.summary()

In [None]:
# コンパイル
adam = Adam(lr=0.001, beta_1=0.9, beta_2=0.999, epsilon=1e-08) # 最適化手法: Adam
model.compile(optimizer=adam,
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# 学習
history = model.fit(X_train, y_train, batch_size=128, 
                    epochs=7, verbose=1, validation_data=(X_valid, y_valid))

# 汎化制度の評価・表示
score = model.evaluate(X_valid, y_valid, batch_size=128, verbose=0)
print('validation loss:{0[0]}\nvalidation accuracy:{0[1]}'.format(score))

# acc, val_accの図をプロット
plt.plot(history.history["acc"], label="acc", ls="-", marker="o")
plt.plot(history.history["val_acc"], label="val_acc", ls="-", marker="x")
plt.ylabel("accuracy")
plt.xlabel("epoch")
plt.ylim([0,1])
plt.legend(loc="best")
plt.show()

# loss, val_lossの図をプロット
plt.plot(history.history["loss"], label="loss", ls="-", marker="o")
plt.plot(history.history["val_loss"], label="val_loss", ls="-", marker="x")
plt.ylabel("loss")
plt.xlabel("epoch")
plt.ylim([0,1])
plt.legend(loc="best")
plt.show()

# モデルを保存
model.save("model/my_model.h5")

---
## 推論用プログラム
#### 作成したモデルで実際に分類してみましょう！

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import cv2
from keras.models import  load_model
import sys

In [None]:
# モデルの読み込み
model = load_model('model/my_model.h5')

# 画像の読み込み
img = cv2.imread("predict/chicken_0002.jpg")

# 画像が見つからなかった場合、Not openを出力
if img is None:
    print("Not open:")

# RGB → BGR
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

# 画像の表示
plt.imshow(img)
plt.show()

# 画像をモデルが読み込めるように変換
img = cv2.resize(img, (64, 64))
x = np.asarray(img)
x = x.reshape(-1, 64, 64, 3)
x = x.astype("float32") / 255

# 推論
pre = model.predict([x])[0]
idx = pre.argmax()

# 結果を出力
print(">> 予測結果↓\n" + name[0] + ": " + str(round(pre[0]*100, 2)) + "%\n" + name[1] + ": " + str(round(pre[1]*100, 2)) + "%\n")
print(">> この画像は「" + name[idx].replace(",", "") + "」です。")