<a href="https://colab.research.google.com/github/keng-oh/colab/blob/master/neural_network_problem.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# ニューラルネットワークの諸問題

In [0]:
# EarlyStoppingのインスタンスを生成
from keras.callbacks import EarlyStopping
es = EarlyStopping(monitor='val_loss', patience=10, verbose=0, mode='min')

# 学習の際にEarlyStoppingを適用
model.fit(X_train, Y_train, batch_size=batch_size,epochs=n_epoch,
          validation_data=(X_validation, y_valiation),
          callbacks=[es]) # EarlyStoppingを適用

In [0]:
# ModelCheckpointのインスタンスを生成
from keras.callbacks import ModelCheckpoint
mc = ModelCheckpoint(filepath='./dl4', monitor='val_loss', verbose=1, save_best_only=True, mode='min')

# 学習の履歴を残す形で学習を実行
history = moldel.fit(X_train, Y_train, batch_size=batch_size,epochs=n_epoch,
          validation_data=(X_validation, y_valiation),
          callbacks=[mc]) # ModelCheckpointを適用

# Dropout

In [0]:
# 不要な警告を非表示にする
import warnings
warnings.filterwarnings('ignore')

import keras
from keras.models import Sequential
from keras.layers import Dense, Activation, Dropout
from keras.layers.convolutional import Conv2D
from keras.layers.pooling import MaxPool2D
from keras.layers import Flatten
import tensorflow as tf

# CNNモデルの定義
model = Sequential()

model.add(Conv2D(64, input_shape=(32, 32, 3),
                 kernel_size=(4, 4),
                 strides=(1, 1),
                 padding='same'))

model.add(MaxPool2D(pool_size=(2, 2)))
model.add(Activation('relu'))

model.add(Conv2D(128,
                 kernel_size=(4, 4),
                 strides=(1, 1),
                 padding='same'))
model.add(MaxPool2D(pool_size=(2, 2)))
model.add(Activation('relu'))

model.add(Conv2D(128,
                 kernel_size=(4, 4),
                 strides=(1, 1),
                 padding='same'))
model.add(MaxPool2D(pool_size=(2, 2)))
model.add(Activation('relu'))

model.add(Flatten())
model.add(Dense(512))
model.add(Activation('relu'))
# 無効化比率0.5のDropout
model.add(Dropout(rate=0.5))
# 最終層は無効化しない
model.add(Dense(5))
model.add(Activation('softmax'))

# バッチ正規化

In [0]:
from keras.layers import Flatten
from keras.layers.normalization import BatchNormalization

# CNNモデルの定義
model = Sequential()

model.add(Conv2D(64, input_shape=(32, 32, 3),
                 kernel_size=(4, 4),
                 strides=(1, 1),
                 padding='same'))
# 畳み込み後バッチ正則化
model.add(BatchNormalization())
model.add(MaxPool2D(pool_size=(2, 2)))
model.add(Activation('relu'))

model.add(Conv2D(128,
                 kernel_size=(4, 4),
                 strides=(1, 1),
                 padding='same'))
model.add(BatchNormalization())
model.add(MaxPool2D(pool_size=(2, 2)))
model.add(Activation('relu'))

model.add(Conv2D(128,
                 kernel_size=(4, 4),
                 strides=(1, 1),
                 padding='same'))
model.add(BatchNormalization())
model.add(MaxPool2D(pool_size=(2, 2)))
model.add(Activation('relu'))


model.add(Flatten())
model.add(Dense(512))
model.add(Activation('relu'))
model.add(Dense(5))
model.add(Activation('softmax'))

# 活性化関数の変更

In [0]:
# ニューラルネットワークの定義
# 4層のDeep Neural Network

model = Sequential()
model.add(Dense(900, input_dim=784))
# シグモイド関数を利用する場合
model.add(Activation('sigmoid'))

model.add(Dense(1000))
# ReLUを利用する場合
model.add(Activation('relu'))

model.add(Dense(500))
# ReLUを利用する場合
model.add(Activation('relu'))

model.add(Dense(10))
model.add(Activation('softmax'))

# 最適化アルゴリズムの選択

In [0]:
from keras import optimizers

In [0]:
# SGDを利用
# lr: 0以上の浮動小数点数．学習率
optimizer_1 = optimizers.SGD(lr=0.01) 

# MomentumSGDを利用
# lr: 0以上の浮動小数点数．学習率．
# momentum: 0以上の浮動小数点数．慣性項の係数
optimizer_2 = optimizers.SGD(lr=0.01, momentum=0.9)

# NesterovSGD
# lr: 0以上の浮動小数点数．学習率．
# momentum: 0以上の浮動小数点数．慣性項の係数
# nesterov: 真理値. Nesterov momentumを適用するかどうか．
optimizer_3 = optimizers.SGD(lr=0.01, momentum=0.9, nesterov=True)

# AdaGradを利用
# lr: 0以上の浮動小数点数．学習率の初期値．
# epsilon: 0以上の浮動小数点数．分母を0にしないための定数. （NoneならばデフォルトでK.epsilon（）。K.epsilon（）はKeras側で定義されている微小量）
optimizer_4 = optimizers.Adagrad(lr=0.001, epsilon=1e-08)

# RMSPropを利用
# lr: 0以上の浮動小数点数．学習率の初期値．
# rho: 0以上の浮動小数点数．指数移動平均のバランス. 上の式でのα.
# epsilon: 0以上の浮動小数点数．分母を0にしないための定数.（NoneならばデフォルトでK.epsilon（））
optimizer_5 = optimizers.RMSprop(lr=0.01, rho=0.99, epsilon=1e-08)

# AdaDeltaを利用
# lr: 0以上の浮動小数点数．学習率． デフォルト値を推奨します．
# rho: 0以上の浮動小数点数．指数移動平均のバランス.
# epsilon: 0以上の浮動小数点数．分母を0にしないための定数.（NoneならばデフォルトでK.epsilon（））
optimizer_6 = optimizers.Adadelta(rho=0.95, epsilon=1e-06)

# Adamを利用
# lr: 0以上の浮動小数点数．学習率．
# beta_1: 浮動小数点数, 慣性項の係数. 0 < beta < 1. 一般的に1に近い値です．
# beta_2: 浮動小数点数, 指数移動平均のバランス. 0 < beta < 1. 一般的に1に近い値です．
# epsilon: 0以上の浮動小数点数．分母を0にしないための定数.（NoneならばデフォルトでK.epsilon（））
optimizer_7 = optimizers.Adam(lr=0.001, beta_1=0.9, beta_2=0.999, epsilon=1e-08)