# Keras 初心者ハンズオン
# MNISTデータセットへのアクセス

ここでは、MNISTと呼ばれる、よく知られる手書き文字データ・セットによって、ニューラルネットワークの流れを体感していただきましょう。

## ページ内目次

<ul>
<li><a href="#MNISTデータセットを読み込む">MNISTデータセットを読み込む</a></li>
<li><a href="#MNISTデータセットの確認‐型と要素数‐(1/5)">MNISTデータセットの確認‐型と要素数‐(1/5)</a></li>
<li><a href="#MNISTデータセットの確認（2/5）">MNISTデータセットの確認（2/5）</a></li>
<li><a href="#MNISTデータセットの確認（3/5）">MNISTデータセットの確認（3/5）</a></li>
<li><a href="#MNISTデータセットの確認（4/5）">MNISTデータセットの確認（4/5）</a></li>
<li><a href="#MNISTデータセットの確認（5/5）">MNISTデータセットの確認（5/5）</a></li>
<li><a href="#ユーティリティ関数">ユーティリティ関数</a></li>
</ul>

<hr>

<div style="border: 1px solid; padding: 10px">

<p>MNIST（正式名称 THE MNIST DATABASE of handwritten digits) は、以下のURLで公開されている手書き持ちのデータ・セットです。</p>

<p><a href="http://yann.lecun.com/exdb/mnist/">http://yann.lecun.com/exdb/mnist/</a></p>
    
<p>このデータセットには、下記のものが含まれます。</p>

<ul>
<li>学習用の手書き文字 60,000 サンプル</li>
<li>評価用の手書き文字 10,000 サンプル</li>
</ul>

<p>各手書き文字サンプルは、 タテ28ドット、ヨコ28ドット、合計784ドットで構成されています。また各手書き文字画像がどの文字であるかを示す「ラベル」が付けられています。ラベルは、学習時の教師信号として利用できるほか、評価時には得られた結果が目的値であるかを確認するために利用できます。</p>

<p>まずは、MNISTデータセットをロードして、内容を確認してみましょう。</p>
</div>

<hr>

# MNISTデータセットを読み込む

使用するモジュールをインポート

In [None]:
import numpy as np

import matplotlib.pyplot as plt
import matplotlib.cm as cm

from keras.datasets import mnist
from keras.utils import np_utils

MNISTデータセット（訓練用、評価用）をロード

In [None]:
(x_train, y_train), (x_test, y_test) = mnist.load_data()

<div style="border: 1px solid; padding: 10px">
※ MNISTデータがローカルにキャッシュされていない場合はらダウンロードに時間がかかります
</div>

<hr>

##  MNISTデータセットの確認‐型と要素数‐(1/5) 

In [None]:
type(x_train)

train変数の形式を確認。 

In [None]:
x_train.shape

### 演習：test オブジェクトに含まれるタプルの数を確認
まず、実行する前に確認データ総数から答えを考えてみてください。

In [None]:
y_train.shape

<hr>

## MNISTデータセットの確認 - 格納データ -（2/5）

<div style="border: 1px solid; padding: 10px">

<p>Kerasで取得した各サンプルデータは、以下の意味を持ちます。</p>

<ul>
<li>x_train : 訓練用画像データを格納します。これらを答えへの傾向として使います。</li>
<li>y_train : 訓練用クラスラベルを格納します。これらを答えとして使います。</li>
<li>x_test  : 確認用画像データを格納します。</li>
<li>y_test  : 確認用クラスラベルを格納します。</li>
</ul>
train系の画像データは2次元のピクセルの集合です。
plt.imshow() 関数で表示します。
</div>

In [None]:
img_1d = x_train[0]
img_1d.shape

訓練データをmatplotlibを用いて画像として表示

In [None]:
%matplotlib inline
plt.imshow(x_train[0])

さらに一手間かけてモノクロ表示化

In [None]:
%matplotlib inline
plt.imshow(x_train[0], cmap=cm.gray, vmin=0, vmax=255)

これと対になっている目標値（クラスラベル）を表示する。

In [None]:
y_train[0]

<div style="border: 1px solid; padding: 10px">
目標値（クラスラベル）と画像の内容が一致していることを確認してください。
</div>

<hr>

## MNISTデータセットの確認 - 値 -（3/5）

<div style="border: 1px solid; padding: 10px">
<p>Kerasで取得した各サンプルデータは、以下のデータを格納しています。</p>

<ul>
<li>画像データ: 28x28ピクセルの明度値（0～255）</li>
<li>ラベル: その画像データがどの数字かを、 0～9 の整数値として持つ</li>
</ul>
</div>

訓練用データセット [123] (124番目)を表示

In [None]:
x_train[123]

テスト用データセット [456] (457番目)を表示

In [None]:
x_test[456]

<hr>

## MNISTデータセットの確認 - 変形 -（4/5）

## 次元数の変更

このモデルは画像データを画像（二次元配列）として見る必要はありません。  
むしろ、28x28行列を入力単位とすると扱いにくいので、1x784次元データに変換します。

In [None]:
d1_x_train = x_train.reshape(60000, 784)
d1_x_train.shape

### 演習：テスト用データを表現変換する

In [None]:
d1_x_test = x_test.reshape(10000, 784)
d1_x_test.shape

## 値の正規化

訓練データの明度値（0～255）を0.0～1.0に正規化します。

In [None]:
d1_x_train = d1_x_train.astype('float32')
d1_x_train /= 255.0

確認データの明度値（0～255）を0.0～0.1に正規化します。

In [None]:
d1_x_test = d1_x_test.astype('float32')
d1_x_test /= 255.0

<hr>

## MNISTデータセットの確認 - 変換データ -（5/5）

<div style="border: 1px solid; padding: 10px">
<p>以下のふたつの関数を定義します。</p>

<ul>
<li>ConvertMnist(sample, result): 計算用データと群を引数にとり、mnist8bit画像を返す</li>
<li>ary2img(ary): サンプルデータを引数に取り、画像データを復元して返す</li>
<li>show_img(sample, result, ref_no): 計算データと結果、それらの配列番号を取って、該当する画像と目標値を表示する</li>
</ul>

<p>のちに訓練の説明をする場合も、訓練結果を確認するためにこれらの関数を利用します。</p>
※これらの関数群が必要になる辺り、KerasよりChainerのクラス設計の方が便利です。
</div>

## 変形・正規化関数

目標値をone-hot vectorで表現します。  
classesを省略してもnp_utils.to_categorical関数は与えられたリストからクラス数を推定してくれます。  
ただし、与えたリスト内のデータが0～9の10個という保証がないので、10を与えておくことが安全です。

In [None]:
def ConvertMnist(samples, results):
    """
    画像データ28x28を一次元化、値を正規化(0.00～1.00)します。
    結果データをone-hotエンコーディングする。
    samples: (SAMPLES, ROW, COLUMN)のMNISTの傾向データ
    results: MNIST訓練結果を格納するリスト
    """
    max_data = 255.0
    classes = 10
    normalized_samples = samples.reshape(len(samples), samples.shape[1]*samples.shape[2])
    normalized_samples = normalized_samples.astype('float32') / max_data
    one_hot_encoding = np_utils.to_categorical(results, classes)
    return (normalized_samples, one_hot_encoding)

In [None]:
(d1_x_train, d1_y_train)= ConvertMinist(x_train, y_train)

In [None]:
print(d1_x_train.shape)
print(d1_x_train)

## 復元関数

In [None]:
import PIL.Image as Image
def ary2img(d):
    """
    与えられた手書き文字サンプルデータのうち、画像部分を(28, 28)画像に変換して返します
    入力値は 0.00~1.00 にスケーリングされていますが、これを 0 ~ 255 の整数をスケーリングし
    一般的な8ビットのモノクロ画像に変換します
    """
    # (1, 28, 28) の次元数の画像（0.00~1.00)を次元数(28, 28)に変換します
    # 明るさを0~255にスケーリングします
    img_2d = d.reshape(28, 28) * 255
    
    # 配列を8ビットに整数に変換し、Imageオブジェクトに変換します
    img_2d_u8 = img_2d.astype(np.uint8)
    return Image.fromarray(img_2d_u8)

In [None]:
ary2img(d1_x_train[100])

# 表示関数

In [None]:
from IPython.display import display
def show(x,y,no):
    actual_class = y[no]
    d1_image = ary2img(x[no])
    
    print(actual_class)
    display(d1_image)

In [None]:
show(d1_x_train, y_train, 350)

<hr>

## 演習

テスト用データセットから1234番目、 5678番目のサンプルを表示してみてください。

In [None]:
samples = [ 1234, 5678 ]
for no in samples:
    show(d1_x_test, y_test, no)



In [None]:
samples = range(10,20)
for no in samples:
    show(d1_x_train, y_train, no)