# Keras でのMNISTデータの読み込み

## MNISTデータを読み込む

In [1]:
from keras.datasets import mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

Using TensorFlow backend.


## 訓練データ（トレーニングセット）を調べてよう

In [2]:
train_images.shape

(60000, 28, 28)

In [3]:
len(train_labels)

60000

In [4]:
train_labels

array([5, 0, 4, ..., 5, 6, 8], dtype=uint8)

## テストデータ（テストセット）を調べてみよう

In [5]:
test_images.shape

(10000, 28, 28)

In [6]:
len(test_labels)

10000

In [7]:
test_labels

array([7, 2, 1, ..., 4, 5, 6], dtype=uint8)

作業の流れは以下の通りに行う：
- ニューラルネットワークモデルにトレーニングセット（train_imagesとtrain_labels）を供給する。
- ニューラルネットワークが画像とラベルの関連づけを学習する
- テストデータ（test_images）での予測値をニューラルネットワークに生成させ、tain_labelsのラベルと一致するか検証する。

In [8]:
from keras import models
from keras import layers

network = models.Sequential()
network.add(layers.Dense(512, activation='relu', input_shape=(28*28,)))
network.add(layers.Dense(10, activation='softmax'))

Instructions for updating:
Colocations handled automatically by placer.


このニューラルネットワークは２つの連続する密に結合された（Dense）層で構成されている。密に結合された層は密結合層、全結合層とも呼ばれる。

ニューラルネットワークを訓練するためには、次の３つの要素を指定しなければならない。

- 損失関数：ネットワークの性能を評価する方法を決める
- オプティマイザ：ネットワークと損失関数に基づいてネットワーク自信を更新するメカニズム
- トレーニングセットとテストセットを監視するための指標：ここでは正解率のみを考慮する

In [9]:
network.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])

データの前処理を行う。

トレーニングセットのデータは型がunit8, 形状が60000,28,28の配列。

これを型がfloat32, 形状が60000,28*28に変換

In [10]:
train_images=train_images.reshape(60000, 28*28)
train_images=train_images.astype('float32')/255
test_images = test_images.reshape(10000, 28*28)
test_images = test_images.astype('float32')/255

ラベルをカテゴリ値でエンコード

In [11]:
from keras.utils import to_categorical

train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)

Kerasでネットワークを訓練するには、ネットワークのfitエピソードを呼び出し、モデルをトレーニングセットに適合させる。

In [12]:
network.fit(train_images, train_labels, epochs=5, batch_size=128)

Instructions for updating:
Use tf.cast instead.
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x105e9ee48>

モデルの訓練中は損失率と正解率が表示される

In [13]:
test_loss, test_acc = network.evaluate(test_images,test_labels)
print('test_acc:', test_acc)

test_acc: 0.9785


もしトレーニングセットでの正解率とテストセットでの正解率に差がある場合はオーバーフィッティングであることを示している。