<a href="https://colab.research.google.com/github/MasahiroAraki/MLCourse/blob/master/Python/answer/08a_nn.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 第8章 ニューラルネットワーク

## 課題

活性化関数sigmoid、最適化器sgd（最急勾配法）で多階層ネットワークを構成し、勾配消失のために学習が進まないことを確認してください。次に、活性化関数を変更して、学習がうまくできることを確認してください。余力があれば、最適化器入れ替えの効果についても確認してください。

In [1]:
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf

## データの読み込み

In [2]:
(X_train, y_train), (X_test, y_test) = tf.keras.datasets.mnist.load_data()

入力値のとりうる範囲を0-255から0-1に変換します。

In [3]:
X_train = X_train / 255.0
X_test = X_test / 255.0

正解をone-hotベクトルに変換します。

In [4]:
y_train = tf.keras.utils.to_categorical(y_train)
y_test = tf.keras.utils.to_categorical(y_test)

## ニューラルネットワークの構造と学習時のハイパーパラメータの設定

3層のフィードフォワード方で学習します。

In [5]:
af = 'sigmoid'
model = tf.keras.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(128, activation=af),
    tf.keras.layers.Dense(128, activation=af),
    tf.keras.layers.Dense(128, activation=af),
    tf.keras.layers.Dense(128, activation=af),
    tf.keras.layers.Dense(10,  activation='softmax')
])
model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
flatten (Flatten)            (None, 784)               0         
_________________________________________________________________
dense (Dense)                (None, 128)               100480    
_________________________________________________________________
dense_1 (Dense)              (None, 128)               16512     
_________________________________________________________________
dense_2 (Dense)              (None, 128)               16512     
_________________________________________________________________
dense_3 (Dense)              (None, 128)               16512     
_________________________________________________________________
dense_4 (Dense)              (None, 10)                1290      
Total params: 151,306
Trainable params: 151,306
Non-trainable params: 0
__________________________________________________

損失関数と最適化器を指定します。metricsは学習時に表示される数値で、学習が進んでいることを確認できるように設定します。

In [6]:
model.compile(loss='categorical_crossentropy', optimizer='sgd', metrics=['acc'])

ミニバッチのサイズと、繰り返し数を指定して学習を行います。

In [7]:
model.fit(X_train, y_train, batch_size=200, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x26670448d00>

評価用データで評価します。

In [8]:
score = model.evaluate(X_test, y_test)
print(f"Accuracy: {score[1]:.2}")

Accuracy: 0.11


10クラス問題で正解率が10%程度なので、まったく学習ができていないことがわかります。

活性化関数を変更します。

In [9]:
af = 'relu'

model2 = tf.keras.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(128, activation=af),
    tf.keras.layers.Dense(128, activation=af),
    tf.keras.layers.Dense(128, activation=af),
    tf.keras.layers.Dense(128, activation=af),
    tf.keras.layers.Dense(10,  activation='softmax')
])

In [10]:
model2.compile(loss='categorical_crossentropy', optimizer='sgd', metrics=['acc'])

In [11]:
model2.fit(X_train, y_train, batch_size=200, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x26672904cd0>

In [12]:
score = model2.evaluate(X_test, y_test)
print(f"Accuracy: {score[1]:.2}")

Accuracy: 0.91


もとのネットワークで、最適化器のみ変更してみます。

In [13]:
af = 'sigmoid'
model3 = tf.keras.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(128, activation=af),
    tf.keras.layers.Dense(128, activation=af),
    tf.keras.layers.Dense(128, activation=af),
    tf.keras.layers.Dense(128, activation=af),
    tf.keras.layers.Dense(10,  activation='softmax')
])

In [14]:
model3.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['acc'])

In [15]:
model3.fit(X_train, y_train, batch_size=200, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x26672d77cd0>

In [16]:
score = model3.evaluate(X_test, y_test)
print(f"Accuracy: {score[1]:.2}")

Accuracy: 0.96


活性化関数と最適化器の両方を変えてみます。

In [17]:
af = 'relu'

model4 = tf.keras.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(128, activation=af),
    tf.keras.layers.Dense(128, activation=af),
    tf.keras.layers.Dense(128, activation=af),
    tf.keras.layers.Dense(128, activation=af),
    tf.keras.layers.Dense(10,  activation='softmax')
])

In [18]:
model4.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['acc'])

In [19]:
model4.fit(X_train, y_train, batch_size=200, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x266730f1040>

In [20]:
score = model4.evaluate(X_test, y_test)
print(f"Accuracy: {score[1]:.2}")

Accuracy: 0.98


適切に設定を行うと、学習効率が上がることがわかります。