<a href="https://colab.research.google.com/github/SU-sumico/dlj/blob/main/3_cnn_cats_vs_dogs.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

目的
* ネコとイヌの画像データと畳み込みニューラルネットワーク（CNN）を用いて分類を行う。

準備
* GPUを用いて処理を行うために、上部のメニューバーの「ランタイム」→「ランタイムのタイプを変更」からハードウェアアクセラレータをGPUにしてください。

使用するデータセット
* データセットは、RGBカラーの画像、ネコとイヌのクラスに分類されています。
https://www.kaggle.com/datasets/karakaggle/kaggle-cat-vs-dog-dataset?resource=download

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
from keras.preprocessing.image import ImageDataGenerator

img_w, img_h = 150, 150        # 画像をリサイズするときのサイズ
batch_size = 32                # ミニバッチのサイズ

# 訓練データを読み込んで加工するジェネレータを生成
train_datagen = ImageDataGenerator(
    rescale=1.0 / 255,         # RGB値を0～1の範囲に変換
    rotation_range=15,         # 15度の範囲でランダムに回転させる
    zoom_range=0.2,            # ランダムに拡大
    horizontal_flip=True       # 水平方向にランダムに反転
    )

# テストデータを読み込むジェネレータを生成
test_datagen = ImageDataGenerator(rescale=1.0 / 255)

# 訓練データをミニバッチの数だけ生成
train_generator = train_datagen.flow_from_directory(
    '/content/drive/MyDrive/Deep learning/3data/train',               # 訓練データのフォルダ
    target_size=(img_w, img_h), # 画像をリサイズ
    batch_size=batch_size,      # ミニバッチのサイズ
    class_mode='binary')        # 二値分類なのでbinaryを指定

# テストデータをミニバッチの数だけ生成
validation_generator = test_datagen.flow_from_directory(
    '/content/drive/MyDrive/Deep learning/3data/validation',          # テストデータのフォルダ
    target_size=(img_w, img_h), # 画像をリサイズ
    batch_size=batch_size,      # ミニバッチのサイズ
    class_mode='binary')        # 二値分類なのでbinaryを指定

Found 2000 images belonging to 2 classes.
Found 800 images belonging to 2 classes.


ImageDataGenerator: https://keras.io/ja/preprocessing/image/
* リアルタイムにデータ拡張しながらテンソル画像データのバッチを生成します。また、このジェネレータはデータを無限にループするので、無限にバッチを生成します。

ImageDataGeneratorメソッド

flow_from_directory: https://keras.io/ja/preprocessing/image/
* ディレクトリへのパスを受け取り、拡張/正規化したデータのバッチを生成します。

画像のラベルと番号を確認する方法
* ラベルは、flow_from_directoryで指定したディレクトリにある、フォルダの名前が割り当てられます。
* ディレクトリに「dog」と「cat」というフォルダがあれば、ラベルは、[dog, cat]になります。
* そのラベルには番号が割り振られています。
* それを確認するのが、class_indicesの機能です。
* label:番号で保存されています。

In [None]:
# 正解ラベルを確認
print(train_generator.class_indices)
print(validation_generator.class_indices)

{'cats': 0, 'dogs': 1}
{'cats': 0, 'dogs': 1}


Sequentialモデル: https://keras.io/ja/getting-started/sequential-model-guide/
* Kerasでモデルを作成するにはSequentialモデル https://keras.io/ja/getting-started/sequential-model-guide/) を用いる方法とFunctionalAPI (https://keras.io/ja/getting-started/functional-api-guide/) を用いる2つの方法があります。
* Sequentialモデルでは、はじめにSequentialクラスのインスタンスを作成します。
* そしてaddメソッドを用いてレイヤ(全結合層やCNN層、プーリング層など)を追加していきます。

In [None]:
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D, Dropout, Flatten, Dense
from keras import optimizers

# モデルを構築/Seqentialモデルのインスタンスを作成
model = Sequential()

# （第1層）畳み込み層/addメソッドでレイヤを追加
model.add(
    Conv2D(
        filters=32,                # フィルターの数は32
        kernel_size=(3, 3),        # 3×3のフィルターを使用
        input_shape=(150, 150, 3), # 入力データの形状
        padding='same',            # ゼロパディングを行う
        activation='relu'          # 活性化関数はReLU
        ))
# （第2層）プーリング層
model.add(
    MaxPooling2D(pool_size=(2, 2))
)
# ドロップアウト25％
model.add(Dropout(0.25))

# （第3層）畳み込み層
model.add(
    Conv2D(
        filters=32,            # フィルターの数は32
        kernel_size=(3, 3),    # 3×3のフィルターを使用
        activation='relu'      # 活性化関数はReLU
        ))
# （第4層）プーリング層
model.add(
    MaxPooling2D(pool_size=(2, 2))
)
# ドロップアウト25％
model.add(Dropout(0.25))

# （第5層）畳み込み層
model.add(
    Conv2D(filters=64,         # フィルターの数は64
           kernel_size=(3, 3), # 3×3のフィルターを使用
           activation='relu'   # 活性化関数はReLU
          ))
# （第6層）プーリング層
model.add(
    MaxPooling2D(pool_size=(2, 2)))
# ドロップアウト25％
model.add(Dropout(0.25))

# 出力層への入力を4階テンソルから2階テンソルに変換する
model.add(Flatten())

# （第7層）全結合層
model.add(
    Dense(64,                  # ニューロン数は64
          activation='relu'))  # 活性化関数はReLU
# ドロップアウト50％
model.add(Dropout(0.5))

# （第8層）出力層
model.add(
    Dense(
        1,                     # ニューロン数は1個
        activation='sigmoid')) # 活性化関数はsigmoid

# モデルのコンパイル
model.compile(
    loss='binary_crossentropy', # バイナリ用の交差エントロピー誤差
    metrics=['accuracy'],       # 学習評価として正解率を指定
    # Adamアルゴリズムで最適化
    optimizer=optimizers.Adam(),
)

# モデルのサマリを表示
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d (Conv2D)             (None, 150, 150, 32)      896       
                                                                 
 max_pooling2d (MaxPooling2  (None, 75, 75, 32)        0         
 D)                                                              
                                                                 
 dropout (Dropout)           (None, 75, 75, 32)        0         
                                                                 
 conv2d_1 (Conv2D)           (None, 73, 73, 32)        9248      
                                                                 
 max_pooling2d_1 (MaxPoolin  (None, 36, 36, 32)        0         
 g2D)                                                            
                                                                 
 dropout_1 (Dropout)         (None, 36, 36, 32)        0

Sequentialモデルのメソッド: https://keras.io/ja/models/sequential/

ImageDataGeneratorを使った学習
* ImageDataGeneratorを利用して学習を行うには、model.fit_generator()を使います。
* fit_generator: https://keras.io/ja/models/model/

In [None]:
epochs = 60             # 学習回数
batch_size = batch_size # 設定済みのミニバッチのサイズ

# 学習を行う
history = model.fit_generator(
    train_generator,    # 訓練データ
    epochs=epochs,      # 学習回数
    verbose=1,          # 学習の進捗状況を出力する
    # テストデータ
    validation_data=validation_generator,
)

  history = model.fit_generator(


Epoch 1/60
Epoch 2/60
Epoch 3/60
Epoch 4/60
Epoch 5/60
Epoch 6/60
Epoch 7/60
Epoch 8/60
Epoch 9/60
Epoch 10/60
Epoch 11/60
Epoch 12/60
Epoch 13/60
Epoch 14/60
Epoch 15/60
Epoch 16/60
Epoch 17/60
Epoch 18/60
Epoch 19/60
Epoch 20/60
Epoch 21/60
Epoch 22/60
Epoch 23/60
Epoch 24/60
Epoch 25/60
Epoch 26/60
Epoch 27/60
Epoch 28/60
Epoch 29/60
Epoch 30/60
Epoch 31/60
Epoch 32/60
Epoch 33/60
Epoch 34/60
Epoch 35/60
Epoch 36/60
Epoch 37/60
Epoch 38/60
Epoch 39/60
Epoch 40/60
Epoch 41/60
Epoch 42/60
Epoch 43/60
Epoch 44/60
Epoch 45/60
Epoch 46/60
Epoch 47/60
Epoch 48/60
Epoch 49/60
Epoch 50/60
Epoch 51/60
Epoch 52/60
Epoch 53/60
Epoch 54/60
Epoch 55/60
Epoch 56/60
Epoch 57/60
Epoch 58/60
Epoch 59/60
Epoch 60/60


テストデータによるネコとイヌの識別は、正解率が76.6%。データ拡張しても精度は低い。