# Lesson1 手書き文字認識をしよう（ニューラルネットワーク入門）

## Homework
今Lessonで学んだMLPを用いて、FashionMNISTの高精度な分類器を実装してみましょう。 

モデルのレイヤーを変更してみるなどして精度の向上にチャンレンジして下さい。
精度上位者はリーダーボードに載ります。

## 目標値

Accuracy 90%

### ルール
- 訓練データは`x_train`、 `y_train`、テストデータは`x_test`で与えられます。
- 予測ラベルは **one_hot表現ではなく0~9のクラスラベル** で表してください。
- 下のセルで指定されているx_train、y_train以外の学習データは使わないでください。
- 次のレッスンでCNNを学習するので今回の宿題での利用は控えて下さい。

### 評価について

- テストデータ(x_test)に対する予測ラベルをcsvファイルで提出してください。
- ファイル名はsubmission.csvとしてください。
- 予測ラベルのy_testに対する精度 (F値)で評価します。
- 評価はテストデータに対する精度でおこないます。

### サンプルコード

**次のセルで指定されているx_train, y_trainのみを使って学習させてください。**

In [1]:
import numpy as np
import pandas as pd
import os

def load_mnist():

    # 学習データ
    x_train = np.load('/root/userspace/public/lesson1/data/x_train.npy')
    y_train = np.load('/root/userspace/public/lesson1/data/y_train.npy')
    
    # テストデータ
    x_test = np.load('/root/userspace/public/lesson1/data/x_test.npy')

    x_train = x_train.reshape(-1, 784).astype('float32') / 255
    x_test = x_test.reshape(-1, 784).astype('float32') / 255
    y_train = np.eye(10)[y_train.astype('int32').flatten()]

    return (x_train, x_test, y_train)

x_train, x_test, y_train = load_mnist()

In [2]:
from keras.models import Sequential
from keras.layers import Dense, Dropout
from keras import regularizers

model = Sequential()

model.add(Dense(512, input_shape=(784,), activation='relu', kernel_initializer='he_normal'))
model.add(Dense(256, activation='relu', kernel_initializer='he_normal'))
model.add(Dense(128, activation='relu', kernel_initializer='he_normal'))
model.add(Dropout(0.3))
model.add(Dense(64, activation='relu', kernel_initializer='he_normal'))
model.add(Dense(32, activation='relu', kernel_initializer='he_normal'))
model.add(Dense(10, activation='softmax'))

model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

Using TensorFlow backend.


In [None]:
from keras.callbacks import EarlyStopping

early_stopping = EarlyStopping(patience=3, verbose=2)

model.fit(x_train, y_train, batch_size=1000, verbose=2, epochs=1000, callbacks=[early_stopping])

Epoch 1/1000
 - 1s - loss: 0.8987 - acc: 0.6846




Epoch 2/1000
 - 1s - loss: 0.4624 - acc: 0.8374
Epoch 3/1000
 - 1s - loss: 0.3977 - acc: 0.8582
Epoch 4/1000
 - 1s - loss: 0.3652 - acc: 0.8698
Epoch 5/1000
 - 1s - loss: 0.3360 - acc: 0.8781
Epoch 6/1000
 - 1s - loss: 0.3199 - acc: 0.8835
Epoch 7/1000
 - 1s - loss: 0.3017 - acc: 0.8898
Epoch 8/1000
 - 1s - loss: 0.2890 - acc: 0.8943
Epoch 9/1000
 - 1s - loss: 0.2708 - acc: 0.9008
Epoch 10/1000
 - 1s - loss: 0.2670 - acc: 0.9021
Epoch 11/1000
 - 1s - loss: 0.2594 - acc: 0.9028
Epoch 12/1000
 - 1s - loss: 0.2482 - acc: 0.9072
Epoch 13/1000
 - 1s - loss: 0.2409 - acc: 0.9106
Epoch 14/1000
 - 1s - loss: 0.2284 - acc: 0.9150
Epoch 15/1000
 - 1s - loss: 0.2181 - acc: 0.9192
Epoch 16/1000
 - 1s - loss: 0.2156 - acc: 0.9201
Epoch 17/1000
 - 1s - loss: 0.2017 - acc: 0.9248
Epoch 18/1000
 - 1s - loss: 0.1992 - acc: 0.9260
Epoch 19/1000
 - 1s - loss: 0.1929 - acc: 0.9277
Epoch 20/1000
 - 1s - loss: 0.1894 - acc: 0.9293
Epoch 21/1000
 - 1s - loss: 0.1794 - acc: 0.9327
Epoch 22/1000
 - 1s - loss: 

In [None]:
pred_y = model.predict(x_test)
pred_y = np.argmax(pred_y, 1)

In [None]:
submission = pd.Series(pred_y, name='label')
submission.to_csv('/root/userspace/lesson1/blank/submission.csv', header=True, index_label='id')