# 何はともあれ Keras を始めるぞい

ベースは[この](https://github.com/fchollet/keras/blob/master/examples/mnist_mlp.py)サンプルコード。
説明を簡略化するためにdropoutとかの処理を除いたりと、少し手を加えている。

とにかくインポートしないと何も始まらない。

In [1]:
import keras

Using TensorFlow backend.


MNISTデータセットをダウンロードするための専用モジュールが実装されているので、とりあえずそれを使おう。

In [2]:
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()

x_train = x_train.reshape(60000, 784).astype("float32")
x_test = x_test.reshape(10000, 784).astype("float32")

One-hot表現に変換する。
`keras.utils` に、よく使う処理が用意されていて匠の優しい心遣いを感じる。

In [3]:
# 最初は正しい数字がそのまま入ってる
print(y_train)

[5 0 4 ..., 5 6 8]


In [4]:
# One-hot に変換
y_train = keras.utils.to_categorical(y_train, 10)
y_test = keras.utils.to_categorical(y_test, 10)

In [5]:
print(y_train)

[[ 0.  0.  0. ...,  0.  0.  0.]
 [ 1.  0.  0. ...,  0.  0.  0.]
 [ 0.  0.  0. ...,  0.  0.  0.]
 ..., 
 [ 0.  0.  0. ...,  0.  0.  0.]
 [ 0.  0.  0. ...,  0.  0.  0.]
 [ 0.  0.  0. ...,  0.  1.  0.]]


各セルの色の濃さが0~255で表されているのを、スケーリングして0~1にする。
0~1の間に収まるようにスケーリングしたり、標準化（平均が 0、分散が1になるようなスケーリング）をすることが多い。

In [6]:
x_train /= 255
x_test /= 255

ネットワークの部分の実装はこれだけ！楽！

In [7]:
model = keras.models.Sequential()
model.add(keras.layers.Dense(128, activation='relu', input_shape=(784,)))
model.add(keras.layers.Dense(10, activation='softmax'))

どんなネットワークを作ったか見ることができて便利。
この機能はマジで素晴らしい。

In [8]:
model.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_1 (Dense)              (None, 128)               100480    
_________________________________________________________________
dense_2 (Dense)              (None, 10)                1290      
Total params: 101,770
Trainable params: 101,770
Non-trainable params: 0
_________________________________________________________________


損失関数と最適化手法に何を使うか、ここで指定している。

In [9]:
model.compile(
    loss='categorical_crossentropy',
    optimizer=keras.optimizers.Adam(lr=1e-3),
    metrics=['accuracy']
)

一通り終わったら `fit` メソッドを呼ぶだけ。

In [10]:
history = model.fit(
    x_train, y_train,
    batch_size=128,
    epochs=20,
    verbose=1,
    validation_data=(x_test, y_test)
)

Train on 60000 samples, validate on 10000 samples
Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20
