# 学習の準備
本セクションではCNNを使って手書き文字の認識を行いますが、今回はそのための準備を行います。  
使用する手書き文字のデータセット、および構築するネットワークについて解説します。

## ●手書き文字のデータセット
手書き文字のデータセットですが、前のセクションと同じくscikit-learnのdatasetsから入手します。  
このデータセットには、0から9までの手書き数字の画像が多数含まれています。  
また、それらの画像がどの数値を表しているのか示す正解値も一緒になっています。    

以下は、scikit-learnのdatasetsから手書き文字のデータセットを取得し、画像データの形状及び最初の画像を表示するコードです。

In [None]:
import matplotlib.pyplot as plt 
from sklearn import datasets

digits = datasets.load_digits()
print(digits.data.shape)

plt.imshow(digits.data[0].reshape(8, 8), cmap="gray")
plt.show() 

datasetsの`load_digits()`により手書き文字画像のデータセットが読み込まれます。  
画像データの形状は`digits.data.shape`により取得できます。  
この形状をprintします。  

画像データは64個のピクセルが直線上に格納されています。  
画像のサイズは8x8ピクセルなので、`reshape(8, 8)`した上でmatplotlibにより表示します。  

このコードを実行すると、64個のピクセルが1797個格納されていることが分かります。   
また、8x8ピクセルのモノクロで、手書き数字の0が描かれた画像が表示されました。  
データセットにはこのような画像データが1797個格納されています。  

また、`digits.target`には各画像に対応する数値が用意されています。  
以下のコードは、`digits.target`の形状と、最初の50個の数値を表示します。

In [None]:
print(digits.target.shape)
print(digits.target[:50])

数値の数は1797個で、対応する画像の数と同じですね。  
また、`digits.target`には0から9までの数値が含まれていることが分かります。  

それでは、他の画像を見てみましょう。  
以下の図はデータセットに含まれる0から9までの画像です。  
画像の上には対応する数値が表示されています。

<img src="images/mnist.png">


このような画像と数値のセットを用いてCNNを訓練し、CNNが手書き数字を認識できるようにします。

## ●構築するネットワーク
今回は、以下に図でで示すCNNを構築します。

<img src="images/cnn_network.png">

入力層の後に畳み込み層が続き、プーリング層、中間層を経て出力層につながります。   
出力層には10個の出力があり、それぞれの出力は対応する数値に分類される確率となります。  

その他の主なネットワークと学習の設定は以下の通りです。

|||
|:-:|:-:|
| 畳み込み層の活性化関数 | ReLU |
| 中間層の活性化関数 | ReLU |
| 出力層の活性化関数 | ソフトマックス関数 |
| 損失関数 | 交差エントロピー誤差 |
| 最適化アルゴリズム | AdaGrad |
| バッチサイズ | 8 |
|||