# 11章　実用的なディープラーニングを目指して

In [None]:
# Tensorflow/Kerasの導入
!pip install tensorflow
!pip install keras

In [None]:
# 必要ライブラリの宣言
import numpy as np
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings('ignore')

### 11.1 KerasによるNeural Network

In [None]:
# データ準備

# 変数定義

# D: 入力ノード数
D = 784

# H: 隠れ層のノード数
H = 128

# 分類クラス数
num_classes = 10

# Kerasの関数でデータの読み込み
from keras.datasets import mnist
(x_train_org, y_train), (x_test_org, y_test) \
 = mnist.load_data()

# 入力データの加工 (次元を1次元に)
x_train = x_train_org.reshape(-1, D) / 255.0
x_test = x_test_org.reshape((-1, D)) / 255.0

# 正解データの加工 (One Hot Vectorに)
from keras.utils import to_categorical

y_train_ohe = to_categorical(y_train, num_classes)
y_test_ohe = to_categorical(y_test, num_classes)


In [None]:
# モデルの定義

# 必要ライブラリのロード
from keras.models import Sequential
from keras.layers import Dense

# Sequentialモデルの定義
model = Sequential()

# 隠れ層1の定義
model.add(Dense(H, activation='relu', input_shape=(D,)))

# 隠れ層2の定義
model.add(Dense(H, activation='relu'))

# 出力層
model.add(Dense(num_classes, activation='softmax'))

# モデルのコンパイル
model.compile(loss = 'categorical_crossentropy',
              optimizer = 'sgd',
              metrics=['accuracy'])

In [None]:
# 学習

# 学習の単位
batch_size = 512

# 繰り返し回数
nb_epoch = 50

# モデルの学習
history1 = model.fit(
    x_train,
    y_train_ohe,
    batch_size = batch_size,
    epochs = nb_epoch,
    verbose = 1,
    validation_data = (x_test, y_test_ohe))

## 11.4 数値微分

In [None]:
import numpy as np

#  ネイピア数を底とする指数関数の定義
def f(x):
    return np.exp(x)

# 微少な数 hの定義
h = 0.001

# f'(0)の近似計算
# f'(0) = f(0) = 1に近い値になるはず
diff = (f(0 + h) - f(0 - h))/(2 * h)

# 結果の確認
print(diff)

## 11.5 高度な学習法

### SGD

In [None]:
# 必要ライブラリのロード
from keras.models import Sequential
from keras.layers import Dense

# 学習の単位
batch_size = 512

# 繰り返し回数
nb_epoch = 50

In [None]:
# Sequentialモデルの定義
model = Sequential()

# 隠れ層1の定義
model.add(Dense(H, activation='relu', kernel_initializer='he_normal', input_shape=(D,)))

# 隠れ層2の定義
model.add(Dense(H, activation='relu', kernel_initializer='he_normal'))

# 出力層
model.add(Dense(num_classes, activation='softmax', kernel_initializer='he_normal'))

In [None]:
# モデルのコンパイル
model.compile(loss = 'categorical_crossentropy',
              optimizer = 'sgd',
              metrics=['accuracy'])

# モデルの学習
history1 = model.fit(
    x_train,
    y_train_ohe,
    batch_size = batch_size,
    epochs = nb_epoch,
    verbose = 1,
    validation_data = (x_test, y_test_ohe))

### RmsProp

In [None]:
# Sequentialモデルの定義
model = Sequential()

# 隠れ層1の定義
model.add(Dense(H, activation='relu', kernel_initializer='he_normal', input_shape=(D,)))

# 隠れ層2の定義
model.add(Dense(H, activation='relu', kernel_initializer='he_normal'))

# 出力層
model.add(Dense(num_classes, activation='softmax', kernel_initializer='he_normal'))

In [None]:
# モデルのコンパイル
model.compile(loss = 'categorical_crossentropy',
              optimizer = 'rmsprop',
              metrics=['accuracy'])

# モデルの学習
history2 = model.fit(
    x_train,
    y_train_ohe,
    batch_size = batch_size,
    epochs = nb_epoch,
    verbose = 1,
    validation_data = (x_test, y_test_ohe))

### Momentum

In [None]:
# Sequentialモデルの定義
model = Sequential()

# 隠れ層1の定義
model.add(Dense(H, activation='relu', kernel_initializer='he_normal', input_shape=(D,)))

# 隠れ層2の定義
model.add(Dense(H, activation='relu', kernel_initializer='he_normal'))

# 出力層
model.add(Dense(num_classes, activation='softmax', kernel_initializer='he_normal'))

In [None]:
# モデルのコンパイル
from keras import optimizers
sgd = optimizers.SGD(momentum=0.9)
model.compile(loss = 'categorical_crossentropy',
              optimizer = sgd,
              metrics=['accuracy'])

# モデルの学習
history3 = model.fit(
    x_train,
    y_train_ohe,
    batch_size = batch_size,
    epochs = nb_epoch,
    verbose = 1,
    validation_data = (x_test, y_test_ohe))

### グラフ表示による比較

In [None]:
#import matplotlib.pyplot as plt

# 学習曲線の表示 (損失関数値)
plt.figure(figsize=(8,6))
plt.plot(history1.history['val_loss'],label='SGD', lw=3, c='k')
plt.plot(history2.history['val_loss'],label='rmsprop', lw=3, c='b')
plt.plot(history3.history['val_loss'],label='momentum', lw=3, c='k', linestyle='dashed')
plt.ylim(0,2)
plt.xticks(size=14)
plt.yticks(size=14)
plt.grid(lw=2)
plt.legend(fontsize=14)
plt.show()

In [None]:
import matplotlib.pyplot as plt

# 学習曲線の表示 (精度)
plt.figure(figsize=(8,6))
plt.plot(history1.history['val_accuracy'],label='SGD', lw=3, c='k')
plt.plot(history2.history['val_accuracy'],label='rmsprop', lw=3, c='b')
plt.plot(history3.history['val_accuracy'],label='momentum', lw=3, c='k', linestyle='dashed')
plt.ylim(0.8,1)
plt.xticks(size=14)
plt.yticks(size=14)
plt.grid(lw=2)
plt.legend(fontsize=14)
plt.show()

## 11.6 過学習対策 (正則化)

In [None]:
# 正解データのデータ数
div = 8

# 近似多項式の次元
dim = 8

# y = -x*4 + x**3 -3x**2 + 8x -7
p = [-1, 1, -3, 8, -7]

# xの定義域 [-2, 1]
xMin = -2
xMax = 1

$ f(x) = -x^4 + x^3 -3x^2 + 8x -7 + N(0,5) $

In [None]:
# x : xMin と xManの間をdiv個に分割したベクトル
x = np.linspace(xMin, xMax, num=div)

# xx : xを10倍細かい間隔で分割したベクトル
xx = np.linspace(xMin, xMax, num=div*10)

# y, yy: x, xxそれぞれのベクトルに対して多項式の値を計算したベクトル
y = np.polyval(p, x)
yy = np.polyval(p, xx)

# z: yに正規分布のノイズを加える。これを正解データとする
z = y + 5 * np.random.randn(div)

In [None]:
# ベクトル表示用関数
def print_fix(x):
    [print('{:.3f}'.format(n)) for n in x]

# モデルを引数として、多項式の係数を表示する関数
def print_fix_model(m):
    w = m.coef_.tolist()
    w[0] = m.intercept_
    print_fix(w)

In [None]:
# 多項式行列を作成し、モデルの入力変数とする

# x**nのベクトル計算用関数
def f(x) :
    return [x**i for i in range(dim)]

# X : xベクトルから多項式二次元配列を作ったもの
X = [f(x0) for x0 in x]

# XX : xxベクトル多項式二次元配列を作ったもの
XX = [f(x0) for x0 in xx]

In [None]:
# 線形モデルライブラリのロード
from sklearn.linear_model import LinearRegression

# モデルの初期化、学習
model = LinearRegression().fit(X, z)

# 予測値の取得
yy_pred = model.predict(XX)

In [None]:
# Ridgeモデルラブラリのロード
from sklearn.linear_model import Ridge

# モデルの生成、学習
#model2 = Ridge(alpha=5).fit(X, z)
model2 = Ridge(alpha=0.5).fit(X, z)

In [None]:
# 予測値の取得
yy_pred2 = model2.predict(XX)

In [None]:
# グラフ表示
plt.figure(figsize=(8,6))
plt.plot(xx, yy, label='polynomial', lw=1, c='k')
plt.scatter(x, z, label='observed', s=50, c='k')
plt.plot(xx, yy_pred, label='linear regression', lw=3, c='k')
plt.plot(xx, yy_pred2, label='L2 regularizer', lw=3, c='b')
plt.xlabel('X')
plt.ylabel('Y')
plt.xticks(size=14)
plt.yticks(size=14)
plt.grid(lw=2)
plt.legend(fontsize=14)
plt.show()