<a href="https://colab.research.google.com/github/daiju0722/Deeplearning2022Late/blob/main/%E5%8F%8E%E9%9B%86%E7%94%BB%E5%83%8F%E3%81%A7%E5%AD%A6%E7%BF%92%E3%81%A8%E5%88%86%E9%A1%9E.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 収集した画像をColabにUPして学習させ、それをもとに分類させる

### ファイルのフォルダを準備する

In [None]:
import os
os.makedirs('sample', exist_ok=True) # 分類対象の画像のフォルダを作成
os.makedirs('output/dog/sample', exist_ok=True) # 犬と判定された時の置き場所
os.makedirs('output/cat/sample', exist_ok=True) # 猫と判定されたS時の置き場所
os.makedirs('img/deep_learning/dog', exist_ok=True) # 犬の学習用の収集画像
os.makedirs('img/deep_learning/cat', exist_ok=True) # 猫の学習用の収集画像


## 必要なライブラリをimport

In [None]:
import cv2
import numpy as np
import glob as glob
from sklearn.model_selection import train_test_split
from keras.utils import np_utils

### 分類（クラス）の名前をフォルダ名（dog, cat）から引用する

In [None]:
path ="img/deep_learning" # dogとcatフォルダがある場所
folders = os.listdir(path)
# 2つのパスからフォルダ名を抜き出す
classes = [f for f in folders if os.path.isdir(os.path.join(path, f))]
print(classes)
n_classes = len(classes)
print(n_classes)

['cat', 'dog']
2


### 画像を読み込みサイズ、整形する

In [None]:
# 画像とラベルのための配列
X = [] # 画像（学習データ用の配列）
Y = [] # ラベル（正解用の配列）
# 画像を読み込みつつリサイズする
for label, class_name in enumerate(classes):
  files = glob.glob(path + "/" + class_name + "/*jpg")
  for file in files:
    img = cv2.imread(file)
    img = cv2.resize(img, dsize=(244, 244))
    X.append(img)
    Y.append(label)
    # 内部ループ終わり
# 外部ループ終わり

## 0～255のビットデータ値を、学習のために0～1に変換（正規化）学習精度を上げる

In [None]:
X = np.array(X) # 配列XをNumpy配列に変換
X = X.astype('float32') # 小数型に変換
X /=255.0
# ラベルもnumpyの配列に変換
Y = np.array(Y) # 配列YをNumpy配列に変換
Y = np_utils.to_categorical(Y, n_classes)

### 整形したデータを学習用とテスト用に振り分ける

In [None]:
# 学習データ２割、テスト検証用が２割に分ける
X_train,X_test,Y_train, Y_test = train_test_split(X, Y, test_size=0.2)
# 学習用データ８割(画像問題データ)
print(X_train.shape)
# テストデータ２割(画像問題データ)
print(X_test.shape)
# 学習性データ８割（正解ラベル）
print(Y_train.shape)
# テストデータ２割（正解ラベル）
print(Y_test.shape)

ValueError: ignored

## 準備したデータを学習させていく

### 学習に必要なライブラリをimport

In [None]:
from keras.applications.vgg16 import VGG16
from keras.models import Sequential
from keras.models import model_from_json
from keras.models import Model
from keras.layers import Input, Activation, Dense, Flatten, Dropout
from keras.optimizers import Adam

## モデルのVGG16をアレンジしていく

In [None]:
# VGG16 入力層を用意する(定義する)
input_tensor = Input(shape=(244, 244, 3))
# VGG16のインスタンスを作る(最後のsoftmaxの1000層を無効にして省く)
base_model = VGG16(weights='imagenet', input_tensor=input_tensor, include_top=False)

### 1000分類のsoftmaxを外した代わりに、２つに分類するsoftmax層を追加する

In [None]:
# 追加する層の作成
top_model = Sequential() # ラッピングする層
top_model.add(Flatten(input_shape=base_model.output_shape[1:]))
top_model.add(Dense(n_classes, activation='softmax'))

### 最後のSOFTMAXを外したモデル（basemodel）と追加用の２つに分類するSOFTMAX層のモデル（top_model）をつなげる

In [None]:
model = Model(inputs=base_model.input, outputs=top_model(base_model.output))

### 時間短縮のために、１５層までを外す

In [None]:
# ループしながら１５層までを無効にする
for layer in model.layers[:15]:
  layer.trainable = False # 15層までは学習しない
  # ループ終わり
  print('# layers=', len(model.layers)) # モデルの層の数を表示
  

## 学習モデルをコンパイルする


In [None]:
# 損失はクロスエントロピー法で算出、最適化はADAM、指標は精度で見る
model.compile(loss='categorical_crossentropy',
               optimizer='adam', metrics=['accuracy'])

### コンパイルしたモデルを表示

In [None]:
model.summary()

## コンパイルしたモデルで収集した画像データを学習させる

In [None]:
model.fit(X_train, Y_train, epochs=20, batch_size=16)

## 学習の成果を指標（accuracy）で確認

In [None]:
score = model.evaluate(X_test, Y_test, batch_size=16)

### 作成した学習モデルとクラス分類名を保存

In [None]:
import pickle
# vクラス分類の保存
pickle.dump(classes, open('classes.sav', 'wb')) # オブジェクトをバイナリファイルに保存
# 学習モデルの保存
model.save('cnn.h5')

## 保存したクラスト学習モデルを読み込んで使う

In [None]:
# ライブラリのimport
from keras.models import load_model
import pickle
import cv2
import glob 

# ファイルを読み込んでオブジェっとしてよみがえらせる

In [None]:
model = load_model('cnn.h5')
pickle.load(open('classes.sav', 'rb'))

### sample画像を読み込む

In [8]:
files = glob.glob('sample/*')
print(files)

[]


## ファイルパスから画像を読み込み、学習モデルに判定させ、該当するoutputフォルダにコピーを書き込む

In [9]:
for file in files: # ファイルの数だけループ
  img = cv2.imread(file) # 画像データを読み込み
  # 判定のためにimgを加工したimg2を作る
  img2 = cv2.resize(img, dsize=(224,224)) # （224, 224）にリサイズ
  img2.astype('float32')
  img2 = img/225.0 # 0～225.0だったデータを０～１．０に変換
  img2 = img2[None, ...] # 1次元配列に変換
  # 正規化したデータを判定
  result = model.predict(img2)
  print(result) # 画面に生で出力
  # 確率が高いクラスを取得
  pred = result.argmax()
  print(pred + "=" + str(classes[pred]))
  # 判定したクラス分類のフォルダのほうに、画像データを書き込む
  cv2.imwrite('output/' + str(classes[pred]) + '/' + file, img)
# ループ終わり