In [1]:
# CIFAR-10を読み込んで標準化を含めた前処理を行う
import numpy as np
from keras.datasets import cifar10
from keras.utils import np_utils

# CIFAR-10データを読み込む
(x_train, y_train), (x_test, y_test) = cifar10.load_data()
# 画像データをfloat32(浮動小数点数)型に変換
x_train = x_train.astype('float32')
x_test = x_test.astype('float32')

# 訓練用とテスト用の画像データを標準化する
# 4次元テンソルのすべての軸方向に対して平均、標準偏差を求めるので
# axis=(0,1,2,3)は省略してもよい
mean = np.mean(x_train, axis=(0,1,2,3))
std = np.std(x_train, axis=(0,1,2,3))
# 標準化する際に標準偏差に極小値を加える
x_train = (x_train-mean)/(std+1e-7)
x_test = (x_test-mean)/(std+1e-7)

# 分類先のクラスの数
num_classes = 10
# 正解ラベルをワンホット表現に変換
y_train = np_utils.to_categorical(y_train,num_classes)
y_test = np_utils.to_categorical(y_test,num_classes)

Using TensorFlow backend.


In [3]:
from keras.models import Sequential
from keras.layers import Dense, Activation, Flatten, Dropout, BatchNormalization
from keras.layers import Conv2D, MaxPooling2D
from keras import regularizers
from keras.callbacks import LearningRateScheduler
from keras.optimizers import RMSprop

# ハイパーパラメーターの値を設定
weight_decay = 1e-4

# CNNを構築
model = Sequential()

# (第1層)畳み込み層1 正則化を行う
model.add(
    Conv2D(
        filters=32,                    # フィルターの数は32
        kernel_size=(3,3),             # 3×3のフィルターを使用
        input_shape=x_train.shape[1:], # 入力データの形状
        padding='same',                # ゼロパディングを行う 
        kernel_regularizer=regularizers.l2(weight_decay),
        activation='relu'              # 活性化関数はReLU
        ))
# 正規化
model.add(BatchNormalization())

# (第2層)畳み込み層2　正則化を行う
model.add(
    Conv2D(filters=32,                 # フィルターの数は32
           kernel_size=(3,3),          # 3×3のフィルターを使用
           padding='same',             # ゼロパディングを行う 
           kernel_regularizer=regularizers.l2(weight_decay),
           activation='relu'           # 活性化関数はReLU
           ))
# 正規化
model.add(BatchNormalization())

# (第3層)プーリング層1：ウィンドウサイズは2×2
model.add(
    MaxPooling2D(pool_size=(2,2)))
# ドロップアウト1：ドロップアウトは20％
model.add(Dropout(0.2))
 
# (第4層)畳み込み層3　正則化を行う
model.add(
    Conv2D(filters=64,                 # フィルターの数は64
           kernel_size=(3,3),          # 3×3のフィルターを使用
           padding='same',             # ゼロパディングを行う 
           kernel_regularizer=regularizers.l2(weight_decay),
           activation='relu'           # 活性化関数はReLU
           ))

# 正規化
model.add(BatchNormalization())

# (第5層)畳み込み層3　正則化を行う
model.add(
    Conv2D(filters=32,                 # フィルターの数は32
           kernel_size=(3,3),          # 3×3のフィルターを使用
           padding='same',             # ゼロパディングを行う 
           kernel_regularizer=regularizers.l2(weight_decay),
           activation='relu'           # 活性化関数はReLU
           ))
# 正規化
model.add(BatchNormalization())

# (第6層)プーリング層2：ウィンドウサイズは2×2
model.add(
    MaxPooling2D(pool_size=(2,2)))
# ドロップアウト2：ドロップアウトは30％
model.add(Dropout(0.3))
 
# (第6層)畳み込み層4　正則化を行う
model.add(
    Conv2D(filters=128,                # フィルターの数は128
           kernel_size=(3,3),          # 3×3のフィルターを使用
           padding='same',             # ゼロパディングを行う 
           kernel_regularizer=regularizers.l2(weight_decay),
           activation='relu'           # 活性化関数はReLU
          ))
# 正規化
model.add(BatchNormalization())

# (第7層)畳み込み層5　正則化を行う
model.add(
    Conv2D(filters=128,                # フィルターの数は128
           kernel_size=(3,3),          # 3×3のフィルターを使用
           padding='same',             # ゼロパディングを行う 
           kernel_regularizer=regularizers.l2(weight_decay),
           activation='relu'           # 活性化関数はReLU
          ))
# 正規化
model.add(BatchNormalization())

# (第8層)プーリング層3：ウィンドウサイズは2×2
model.add(
    MaxPooling2D(pool_size=(2,2)))
# ドロップアウト2：ドロップアウトは40％
model.add(Dropout(0.4))
 
# Flatten層　4階テンソルから2階テンソルに変換
model.add(Flatten())

# （第9層）出力層
model.add(
    Dense(num_classes,           # 出力層のニューロン数はnum_classes
          activation='softmax')) # 活性化関数はソフトマックス

# Sequentialオブジェクトのコンパイル
model.compile(
    loss='categorical_crossentropy', # 損失の基準は交差エントロピー誤差
    # 最適化アルゴリズムにCNNと相性の良いRMSpropアルゴリズムを使用
    optimizer=RMSprop(lr=0.001, decay=1e-6),
    metrics=['accuracy'] # 学習評価として正解率を指定
)

In [5]:
# 拡張データを使って学習を行う
from keras.preprocessing.image import ImageDataGenerator

# 学習率をスケジューリングする
def lr_schedule(epoch):
    lrate = 0.001      # 1～75回の学習率
    if epoch > 75:
        lrate = 0.0005 # 76～100回の学習率
    elif epoch > 100:
        lrate = 0.0003 # 101回以降の学習率
    return lrate
 
# データ拡張
datagen = ImageDataGenerator(
    rotation_range=15,      # 15度の範囲でランダムに回転させる
    width_shift_range=0.1,  # 横サイズの0.1の割合でランダムに水平移動
    height_shift_range=0.1, # 縦サイズの0.1の割合でランダムに垂直移動
    horizontal_flip=True,   # 水平方向にランダムに反転、左右の入れ替え
    zoom_range=0.2,         # ランダムに拡大
    )
 
# ミニバッチのサイズ
batch_size = 64
# 学習回数
epochs = 130

# 学習を行う
history = model.fit_generator(
    # 拡張データをミニバッチの数だけ生成
    datagen.flow(x_train,
                 y_train,
                 batch_size=batch_size),
    # 1回の学習におけるステップ数
    # 画像の枚数をミニバッチのサイズで割った整数値
    steps_per_epoch=x_train.shape[0] // batch_size,
    epochs=epochs, # 学習回数
    verbose=1,     # 学習の進捗状況を出力する
    # テストデータ
    validation_data=(x_test,y_test),
    # 学習率のスケジューラーとしてlr_schedule()を呼ぶ
    callbacks=[LearningRateScheduler(lr_schedule)]
)

Epoch 1/130
Epoch 2/130
Epoch 3/130
Epoch 4/130
Epoch 5/130
Epoch 6/130
Epoch 7/130
Epoch 8/130
Epoch 9/130
Epoch 10/130
Epoch 11/130
Epoch 12/130
Epoch 13/130
Epoch 14/130
Epoch 15/130
Epoch 16/130
Epoch 17/130
Epoch 18/130
Epoch 19/130
Epoch 20/130
Epoch 21/130
Epoch 22/130
Epoch 23/130
Epoch 24/130
Epoch 25/130
Epoch 26/130
Epoch 27/130
Epoch 28/130
Epoch 29/130
Epoch 30/130
Epoch 31/130
Epoch 32/130
Epoch 33/130
Epoch 34/130
Epoch 35/130
Epoch 36/130
Epoch 37/130
Epoch 38/130
Epoch 39/130
Epoch 40/130
Epoch 41/130
Epoch 42/130
Epoch 43/130
Epoch 44/130
Epoch 45/130
Epoch 46/130
Epoch 47/130
Epoch 48/130
Epoch 49/130
Epoch 50/130
Epoch 51/130
Epoch 52/130
Epoch 53/130
Epoch 54/130
Epoch 55/130
Epoch 56/130
Epoch 57/130
Epoch 58/130
Epoch 59/130
Epoch 60/130


Epoch 61/130
Epoch 62/130
Epoch 63/130
Epoch 64/130
Epoch 65/130
Epoch 66/130
Epoch 67/130
Epoch 68/130
Epoch 69/130
Epoch 70/130
Epoch 71/130
Epoch 72/130
Epoch 73/130
Epoch 74/130
Epoch 75/130
Epoch 76/130
Epoch 77/130
Epoch 78/130
Epoch 79/130
Epoch 80/130
Epoch 81/130
Epoch 82/130
Epoch 83/130
Epoch 84/130
Epoch 85/130
Epoch 86/130
Epoch 87/130
Epoch 88/130
Epoch 89/130
Epoch 90/130
Epoch 91/130
Epoch 92/130
Epoch 93/130
Epoch 94/130
Epoch 95/130
Epoch 96/130
Epoch 97/130
Epoch 98/130
Epoch 99/130
Epoch 100/130
Epoch 101/130
Epoch 102/130
Epoch 103/130
Epoch 104/130
Epoch 105/130
Epoch 106/130
Epoch 107/130
Epoch 108/130
Epoch 109/130
Epoch 110/130
Epoch 111/130
Epoch 112/130
Epoch 113/130
Epoch 114/130
Epoch 115/130
Epoch 116/130
Epoch 117/130
Epoch 118/130
Epoch 119/130


Epoch 120/130
Epoch 121/130
Epoch 122/130
Epoch 123/130
Epoch 124/130
Epoch 125/130
Epoch 126/130
Epoch 127/130
Epoch 128/130
Epoch 129/130
Epoch 130/130


In [None]:
# 学習回数ごとの精度と損失の変化をグラフにする

%matplotlib inline
import matplotlib.pyplot as plt

def plot_history(history):
    # 精度の履歴をプロット
    plt.plot(history.history['acc'],"-",label="accuracy")
    plt.plot(history.history['val_acc'],"-",label="val_acc")
    plt.title('model accuracy')
    plt.xlabel('epoch')
    plt.ylabel('accuracy')
    plt.legend(loc="lower right")
    plt.show()

    # 損失の履歴をプロット
    plt.plot(history.history['loss'],"-",label="loss",)
    plt.plot(history.history['val_loss'],"-",label="val_loss")
    plt.title('model loss')
    plt.xlabel('epoch')
    plt.ylabel('loss')
    plt.legend(loc='upper right')
    plt.show()
# modelに学習させた時の変化の様子をplot
plot_history(history)