# PyTorch 初心者ハンズオン

## MNISTデータセットへのアクセス

ここでは、MNISTと呼ばれる、よく知られる手書き文字データ・セットによって、ニューラルネットワークの流れを体感していただきましょう。

## ページ内目次

<ul>
<li><a href="#MNISTデータセットを読み込む">MNISTデータセットを読み込む</a></li>
<li><a href="#MNISTデータセットの確認（1/5）">MNISTデータセットの確認（1/5）</a></li>
<li><a href="#MNISTデータセットの確認（2/5）">MNISTデータセットの確認（2/5）</a></li>
<li><a href="#MNISTデータセットの確認（3/5）">MNISTデータセットの確認（3/5）</a></li>
<li><a href="#MNISTデータセットの確認（4/5）">MNISTデータセットの確認（4/5）</a></li>
<li><a href="#MNISTデータセットの確認（5/5）">MNISTデータセットの確認（5/5）</a></li>
</ul>

<hr>

<div style="border: 1px solid; padding: 10px">

<p>MNIST（正式名称 THE MNIST DATABASE of handwritten digits) は、以下のURLで公開されている手書き持ちのデータ・セットです。</p>

<p><a href="http://yann.lecun.com/exdb/mnist/">http://yann.lecun.com/exdb/mnist/</a></p>
    
<p>このデータセットには、下記のものが含まれます。</p>

<ul>
<li>学習用の手書き文字 60,000 サンプル</li>
<li>評価用の手書き文字 10,000 サンプル</li>
</ul>

<p>各手書き文字サンプルは、 タテ28ドット、ヨコ28ドット、合計784ドットで構成されています。また各手書き文字画像がどの文字であるかを示す「ラベル」が付けられています。ラベルは、学習時の教師信号として利用できるほか、評価時には得られた結果が目的値であるかを確認するために利用できます。</p>

<p>まずは、MNISTデータセットをロードして、内容を確認してみましょう。</p>
</div>

<hr>

<hr>

# MNISTデータセットを読み込む

使用するモジュールをインポート

In [None]:
import torch
import torchvision as tv

MNISTに対して行うpreprocessを定義しておきます。

In [None]:
 preprocess = tv.transforms.Compose([
                                  tv.transforms.ToTensor(),
                                  tv.transforms.Normalize((0.5, ), (0.5, ))])

MNISTデータセット（訓練用、評価用）をそれぞれダウンロード。  
パスは`/content/data`にしておきます。

In [None]:
trainset = tv.datasets.MNIST(root='./data', 
                                           train=True,
                                           download=True,
                                           transform=preprocess)

In [None]:
testset = tv.datasets.MNIST(root='./data', 
                                         train=False, 
                                         download=True, 
                                         transform=preprocess)

<div style="border: 1px solid; padding: 10px">
※ MNISTデータがローカルにキャッシュされていない場合はダウンロードに時間がかかります
</div>

<hr>

## MNISTデータセットの確認（1/5）

trainsetオブジェクトの型を確認する。

In [None]:
type(trainset)

MNISTオブジェクトは特殊メソッド`__len__`を持っているので、組み込み関数`len`で要素数を取得できます。

In [None]:
len(trainset)

### 演習　: testset インスタンスの要素数を確認

テスト用データセット testset の長さが 10,000 であることを確認してください



In [None]:
len(testset)

<hr>

## MNISTデータセットの確認（2/5）

訓練用データセット [123] (124番目)を表示

In [None]:
trainset[123]

テスト用データセット [456] (457番目)を表示

In [None]:
testset[456]

torchvision.datasets.MNIST による得られる各サンプルデータは、以下の構造になっています。

<p>(画像データ, ラベル)</p>

- 画像データ: （28x28 合計784ピクセルの明るさを -1.00 ~ 1.00 にスケールしたもの)
- ラベル: その画像データがどの数字かを、 0~9 の整数値として持つ

> 普通、「明るさ」は0～1.0にスケールすることが多いんですが、-1～1にスケールしている意味はよく分かりません。  
> 例えば、Chainerライブラリだと0～1でスケールされたデータが取得できます。 

訓練用サンプル [123] の目標値（クラスラベル）を確認

In [None]:
trainset[123][1]

訓練用サンプル [123] の画像データ (784) を確認

In [None]:
trainset[123][0]

<hr>

## MNISTデータセットの確認（3/5）

作業なし

<hr>

## MNISTデータセットの確認（4/5）

作業なし

<hr>

## MNISTデータセットの確認（5/5）

trainsetに含まれている画像データの型と形を見てみましょう。

In [None]:
type(trainset[0][0])

In [None]:
trainset[0][0].shape

torch型はCPUデバイスに乗っている場合はNumpyとほぼ互換するので構いません。  
ただし、３次元データでは画像として出力することができないので、成形しましょう。

0次元目にはCHデータが入っていますが、そのデータが邪魔なので単純に28x28次元に変換します。

In [None]:
data = trainset[0][0].reshape(28,28)

出力処理自体は`matplotlib`を使います。

In [None]:
import matplotlib.pyplot as plt
%matplotlib inline

In [None]:
plt.imshow(data)
plt.show()

さらに一手間かけてモノクロ表示化


In [None]:
plt.imshow(data, cmap='gray', vmin=0, vmax=1)

クラスラベル目標値の表示

In [None]:
trainset[0][1]

<div style="border: 1px solid; padding: 10px">
目標値（クラスラベル）と画像の内容が一致していることを確認してください。
</div>