<a href="https://colab.research.google.com/github/OtsukiTaisuke/Colab/blob/master/NA2_NN_DNN_mnist.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 概要

## NNを使ったmnistデータ識別

1. データの収集・整理：mnistデータセット
1. 前処理　　　　　　：最大値の調整
1. 評価法の設定　　　：分割法（訓練用とテスト用）
1. 学習　　　　　　　：DNN
1. 結果の可視化　　　：正答率（accuracy）

# 前準備


## 各パッケージのインポート
1. numpy: 行列計算用
1. TensorFlowなどの機械学習ライブラリを楽に扱うライブラリ

In [0]:
import numpy as np
import keras

Using TensorFlow backend.


# データセットの読み込み

## mnistデータセットの読み込み

+ 読み込んだデータセットをそれぞれ  
訓練に用いるデータ(X_train)＆正解ラベル(y_train)  
テストに用いるデータ(X_test)＆正解ラベル(y_test)  
に代入
+ 学習用データが60000枚，評価用が10000枚ある

In [0]:
from keras.datasets import mnist
(X_train, y_train), (X_test, y_test) = mnist.load_data()

Downloading data from https://s3.amazonaws.com/img-datasets/mnist.npz


# データの整理，前処理

## 入力データ（X_train, X_test）の処理

+ 使うデータ数を制限（訓練に10000枚，テストに1000枚）
+ 画素ごとのデータの値が0～255→0～1に変換

In [0]:
img_rows, img_cols = 28, 28

X_train = X_train.reshape(X_train.shape[0], img_rows * img_cols)[0:10000]
X_test = X_test.reshape(X_test.shape[0], img_rows * img_cols)[0:1000]

X_train = X_train.astype('float32')
X_test = X_test.astype('float32')
X_train /= 255
X_test /= 255

## ラベルデータ（y_train, y_test）の処理

+ 正解ラベル（y_train, y_test）をone-hotベクトル表現

In [0]:
from keras.utils import np_utils
Y_train = np_utils.to_categorical(y_train)[0:10000]
Y_test = np_utils.to_categorical(y_test)[0:1000]

# 多階層ニューラルネットワークの構成

## パッケージ読み込み

+ Sequential：階層状のネットワークの構成
+ Dense：ネットワークレイヤー
+ Activation：活性化関数の設定
+ SGD：確率的最急勾配法

In [0]:
from keras.models import Sequential
from keras.layers import Dense, Activation
from keras.optimizers import SGD

## 中間層が1層のモデル
### 構築するモデルのサイズの設定

+ 入力のサイズを訓練データから取得
+ 隠れ層のノード数を200に設定
+ 出力のサイズをラベルデータから取得

In [0]:
input_shape = X_train[0].shape
n_hidden = 200
n_out = len(Y_train[0])

### モデルの構築

+ 中間層での活性化関数：sigmoid
+ 出力層での活性化関数：softmax

In [0]:
model = Sequential()
model.add(Dense(n_hidden, input_shape=input_shape, activation='sigmoid'))
model.add(Dense(n_out, activation='sigmoid'))
model.summary()

Instructions for updating:
Colocations handled automatically by placer.
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_1 (Dense)              (None, 200)               157000    
_________________________________________________________________
dense_2 (Dense)              (None, 10)                2010      
Total params: 159,010
Trainable params: 159,010
Non-trainable params: 0
_________________________________________________________________


## 中間層を増やしてみたモデル

In [0]:
model = Sequential()
model.add(Dense(n_hidden, input_shape=input_shape, activation='sigmoid'))
model.add(Dense(n_hidden, input_shape=input_shape, activation='sigmoid'))
model.add(Dense(n_hidden, input_shape=input_shape, activation='sigmoid'))
model.add(Dense(n_hidden, input_shape=input_shape, activation='sigmoid'))
model.add(Dense(n_out, activation='sigmoid'))
model.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_13 (Dense)             (None, 200)               157000    
_________________________________________________________________
dense_14 (Dense)             (None, 200)               40200     
_________________________________________________________________
dense_15 (Dense)             (None, 200)               40200     
_________________________________________________________________
dense_16 (Dense)             (None, 200)               40200     
_________________________________________________________________
dense_17 (Dense)             (None, 10)                2010      
Total params: 279,610
Trainable params: 279,610
Non-trainable params: 0
_________________________________________________________________


### モデルのコンパイル

+ 損失関数：クロスエントロピー
+ 最適化アルゴリズム：SGD
+ 評価基準：正答率（accuracy）

In [0]:
model.compile(loss='mean_squared_error', optimizer=SGD(lr=0.1),
             metrics = ['accuracy'])

# 学習

## fitメソッドによる学習

+ epochs：繰り返し回数
+ batch_size：バッチサイズ

In [0]:
model.fit(X_train, Y_train, epochs=10, batch_size=128)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x7f4ef3fbd940>

# 結果の可視化

## evaluateメソッドによる評価

+ 損失値（Loss）と正答率（accuracy）を表示

In [0]:
score = model.evaluate(X_test, Y_test, verbose=0)
print('Test loss:', score[0])
print('Test accuracy:', score[1])

Test loss: 0.08994105863571167
Test accuracy: 0.126
