# 第1章 とにかくDeep Learningを体験！

## Google Colaboratory上で，TensorFlow+Kerasで文字認識（MNISTデータ）をやってみよう．

## 1 Google Colaboratoryを立ち上げる
[Google Colaboratory](https://colab.research.google.com/notebooks/welcome.ipynb)にアクセスする．  
（セキュリティの関係で自動的に別タブ・別ウィンドウには飛ばないようになっている（Tabnabbing対策））  
（右クリックで，新しいタブで開いてください）  
googleアカウントを持っていれば，以下のようなページにアクセスできる．  

<img width="1337" alt="colab" src="https://user-images.githubusercontent.com/1255664/72673004-1be28180-3aa7-11ea-958e-4d04ed612c49.png">

## 2 新しいノートブックを作る

左上の「ファイル」から「Python3の新しいノートブック」をクリックして，プログラムを入力するためのノートブックを作成する．

<img width="1320" alt="colab2" src="https://user-images.githubusercontent.com/1255664/72673087-b7282680-3aa8-11ea-8242-7131f18107db.png">

## 3 プログラムを入力する

新しいノートブックができたら，「セル」と呼ばれる四角い窓に，プログラムを入力する．

<img width="935" alt="colab3" src="https://user-images.githubusercontent.com/1255664/72673096-d8891280-3aa8-11ea-951f-ba068ea68eba.png">

下のプログラムは，[TensowrFlowのチュートリアル](https://www.tensorflow.org/tutorials/quickstart/beginner?hl=ja)と同じプログラムである．  
（ただし，中間層のパラメータを128から8に変えてある．）  
次に示すコードが文字（MNIST)を学習して推論するプログラムである．  
これをコピー＆ペーストする．

```python
from __future__ import absolute_import, division, print_function, unicode_literals

try:
  # %tensorflow_version は Colab 上でのみ利用可能
  %tensorflow_version 2.x
except Exception:
  pass

import tensorflow as tf


# MNISTをロードして準備します．サンプルを整数から浮動小数点数に変換します．
# サンプルを整数から浮動小数点数に変換します．
mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

# 層を積み重ねてtf.keras.Sequentialモデルを構築します．
# 訓練のためにオプティマイザと損失関数を選びます．
model = tf.keras.models.Sequential([
  tf.keras.layers.Flatten(input_shape=(28, 28)),
  tf.keras.layers.Dense(8, activation='relu'),
  tf.keras.layers.Dropout(0.2),
  tf.keras.layers.Dense(10, activation='softmax')
])

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

# モデルを学習させる
model.fit(x_train, y_train, epochs=5)
model.evaluate(x_test,  y_test, verbose=2)
```

下の図のような感じになる．
<img width="1179" alt="colab4" src="https://user-images.githubusercontent.com/1255664/72675169-a76a0b80-3ac3-11ea-9240-2255408ecf50.png">

## 4 実行させる

左側にある矢印をクリックするか，「ランタイム」から「すべてのセルを実行」をクリックする．
<img width="1184" alt="colab5" src="https://user-images.githubusercontent.com/1255664/72673732-ebecab80-3ab1-11ea-992b-8a613d92531c.png">

図のように学習し，そして推論結果が出力される．  
この場合，正答率が0.9156であった．

## 5 パラメータを変えてみる

次のプログラムの8という数値を128に変更してみると，正答率が変化する．  
この数値は，ニューラルネットワークの中間層のニューロン数の個数である．  
これを多くすると学習性能が向上する．その反面，過学習を起こしやすくなり，学習時間も増加する．

```
  tf.keras.layers.Dense(8, activation='relu'),
```
↓

```
  tf.keras.layers.Dense(128, activation='relu'),
```

<img width="1173" alt="colab6" src="https://user-images.githubusercontent.com/1255664/72673840-d1670200-3ab2-11ea-9f3f-42d1c1b0ce99.png">

中間ニューロンの数を8から128に増やすと，正答率が0.9780まであがる．  
一方，学習時間が各エポックで1秒多くかかっている．

## 6 どんな文字が正解なのか確認してみる

TensorFlowのチュートリアルはここまでの説明しかない．  
しかし，どんな文字が認識されているのか確認してみたい人も多いと思う．  
そこで，確認してみよう．  

先程入力したプログラムに以下のプログラムを追加する．  
先程のプログラムは学習する部分で，以下のプログラムは未知データを予測する部分である．  

追加するとき，新しいコードセルを下に追加して，そこにコピー&ペーストする．
<img width="1204" alt="スクリーンショット 2020-01-25 14 56 23" src="https://user-images.githubusercontent.com/1255664/73117042-68d0c700-3f83-11ea-84cb-a9101e90ceec.png">

```Python
# 未知データを入力する（ここでは，評価に使ったx_testを入れる）
output = model.predict_classes(x_test[0:12])

# 4つずつ出力
for i,v in enumerate(output):
  print(v, end="")
  if (i+1)%4==0:
    print()

# MNISTのテスト画像を表示する
# mnistの画像を表示する
import matplotlib.pyplot as plt

W = 4  # 横に並べる個数
H = 3  # 縦に並べる個数
fig = plt.figure(figsize=(H, W))
fig.subplots_adjust(left=0, right=1, bottom=0, top=1.0, hspace=0.05, wspace=0.05)
for i in range(W*H):
    ax = fig.add_subplot(H, W, i + 1, xticks=[], yticks=[])
    ax.imshow(x_test[i].reshape((28, 28)), cmap='gray')

plt.show()
```

以下のような手書き文字が，正しく認識されていることがわかる．

<img width="302" alt="スクリーンショット 2020-01-26 13 38 32" src="https://user-images.githubusercontent.com/1255664/73130724-31c0eb00-4041-11ea-8bdc-fb6a02fa5759.png">

## 7 GPUを使ってみる（階層型ニューラルネットワーク）
GPUも無料に利用できる（利用制限はある）  
「ランタイム」から「ランタイムのタイプを変更」を選択

<img width="1168" alt="colab7" src="https://user-images.githubusercontent.com/1255664/72674985-375a8600-3ac1-11ea-8c9b-4e787210a495.png">

「ハードウェア アクセラレータ」を「GPU」を選択
<img width="1178" alt="colab8" src="https://user-images.githubusercontent.com/1255664/72674992-59ec9f00-3ac1-11ea-9158-3a95508f634b.png">

これで，GPUを利用できる．

もう一度，実行してみると，学習速度がNONE（CPU）と比べて早くなっていることがわかる．  
（モデル（階層型ニューラルネットワーク）が大規模ではないので，それほどGPUの恩恵を感じないが...）

## 8 GPUでもやってみる（CNN）
階層型ニューラルネットワークをCNN(Convolutional Neural Network)に変更したプログラムで試してみよう．  
まず，「ハードウェア アクセラレータ」を「None」に戻す．  
以下のプログラムを，新しいコードセルに追加してみよう．  

CNNのプログラムは，先程行った階層型ニューラルネットワークよりもかなり計算に時間がかかることがわかる．  
CPUの場合，5epochの学習に14分くらいかかる．  

では，GPUではどうだろうか．  
GPUのときで，どれくらい計算速度に差が出るか体感してみよう．  
GPUの場合，同じ5epochの学習に32秒で完了する．  
圧倒的に高速に計算が可能であることがわかる．  

```python
from __future__ import absolute_import, division, print_function, unicode_literals

try:
  # %tensorflow_version は Colab 上でのみ利用可能
  %tensorflow_version 2.x
except Exception:
  pass

import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout, Flatten, Conv2D, MaxPooling2D, Reshape

# MNISTをロードして準備します．サンプルを整数から浮動小数点数に変換します．
# サンプルを整数から浮動小数点数に変換します．
mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0


# 畳み込みNNモデルを定義します
model = Sequential([
    Reshape((28, 28, 1), input_shape=(28, 28)),
    Conv2D(50, (5, 5), activation='relu'),
    Conv2D(50, (3, 3), activation='relu'),
    MaxPooling2D(pool_size=(2, 2)),
    Flatten(),
    Dropout(0.2),
    Dense(100, activation='relu'),
    Dropout(0.4),
    Dense(10, activation='softmax')
])

# モデルをcompileします
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

# 学習します
model.fit(x_train, y_train, validation_split=0.1, epochs=5, verbose=1)

# テストデータの予測精度を計算します
model.evaluate(x_test, y_test)
```

GPUがなぜこんなに早いかは，以下の動画を見るとわかりやすい．  
[Mythbusters Demo GPU versus CPU](https://www.youtube.com/watch?v=-P28LKWTzrI)

## 9 Webアプリで遊んでみよう！

これは私が作成したページではないのだが，面白いページがあったので，アクセスしていろいろな文字を書いて認識させて遊んでみよう．  
内部で動いているのは同様のTensorFlowである．  
[Webデモ](https://ml-demo.zukucode.com/mnist)  
[解説](https://zukucode.com/2019/08/tensorflow-vue-mnist.html)