# ディープラーニングをやってみよう！

## shift+Enterでセル（枠で囲まれた部分）を実行できます。

[機械学習の基本的な流れ](https://qiita.com/takus69/items/16de1635d8aef43043a9)

### まず使うライブラリ達を読み込みます。

In [None]:
#numpyは多次元配列における数値計算を得意とするライブラリです。
import numpy as np
#matplotlibは可視化のためのライブラリです。
import matplotlib.pyplot as plt
%matplotlib inline

#kerasはdeep learning向けのフレームワークです。
#今回使うのはkerasというフレームワークでシンプルな記述が特徴です。
import keras
from keras.models import Sequential
#モデルを構成するときの道具を得ます。
from keras.layers import Dense, Activation, Flatten
from keras.optimizers import SGD

#one-hot-encodingを使うためのライブラリを読み込む
from keras.utils import np_utils

#画像処理のための道具(open cv)を読み込む
import cv2

[numpyの解説](https://qiita.com/jyori112/items/a15658d1dd17c421e1e2)
[matplotlibの解説](http://bicycle1885.hatenablog.com/entry/2014/02/14/023734)
##### 「% matplotlib inline」はグラフを描画の際に指定する記述です。
[open cvの解説](http://gihyo.jp/dev/feature/01/opencv/0002)




 [ライブラリとは](https://www.nttpc.co.jp/yougo/%E3%83%A9%E3%82%A4%E3%83%96%E3%83%A9%E3%83%AA.html)

### ではさっそく使うデータを読み込みます。

In [None]:
#keras内のMNISTデータセットをimport します。
#kerasにはもともとMNISTデータが入っているため、自分でデータを集めるという行程を今回は省くことができます。
from keras.datasets import mnist

# MNISTデータをロードしてX_train, y_train, X_test, y_testに入れます。
(X_train, y_train), (X_test, y_test) = mnist.load_data()

### 今回使うデータは「mnist」という有名な画像データ集です。
### 黒い背景に白い文字で数字が書かれている手書き数字画像で ↓こんな感じ

![MNIST](mnist.png)

# データの前処理
## データの前処理をするにはまず、どんなデータを使っているかを調べる必要があります。

In [None]:
#.shapeでデータの形式を確認します。
print(X_train.shape)
print(y_train.shape)
print(X_test.shape)
print(y_test.shape)

### ↑でわかるように、X_trainには28×28の画像が60000枚, y_trainにはX_trainの画像それぞれに対応するラベルが入っています。
### 同様にX_testには28×28の画像が10000枚, y_testにはX_testの画像それぞれに対応するラベルが入っています。

### 例えば

![](five.jpeg)

### がX_trainの1番目の画像だとしたら、y_trainの1番目は「５」というラベルです。

In [None]:
# データ型をdtypeで調べます。
print(X_train.dtype)
print(X_test.dtype)

### unit8は符号なし8ビット整数型を表しています。つまり、0 ～ 255までの整数で表現されています。

### 正規化（数値を0~1の範囲に収めること）すると精度が上がるので、正規化します。正規化するには、画素１つあたりに割り振られている数値の最大値（255）で数値を割れば良いのですが、255で割るとその値は整数ではなくなりuint8では表現しきれなくなります。
[feature scalingについて](https://qiita.com/ttskng/items/2a33c1ca925e4501e609)
### よって↓これで、小数も表せるようにします。

In [None]:
#.astypeでデータ型を変形できます。「f」はfloat　不動小数点を表しています。
X_train = X_train.astype('f')
X_test = X_test.astype('f')

#### [astypeの解説](https://note.nkmk.me/python-numpy-dtype-astype/)

In [None]:
#データ型をdtypeで調べます。
print(X_train.dtype)
print(X_test.dtype)

### ちゃんと小数点も表せるようになってますね。

### 小数も表せるようになったので、正規化します。

In [None]:
# 画素を0.0-1.0の範囲に正規化
X_train /= 255
X_test /= 255

In [None]:
#例えばX_trainの１番目の画像の一行目の1列目に対応する画素は0.0という値を持つようになりました。
print(X_train[0][0][0])

In [None]:
#同様にラベルが入ってるデータ集のほうのデータ形式を確認します。
print(y_train.dtype)
print(y_test.dtype)

In [None]:
#データの形を確認します。
print(y_train.shape)
print(y_test.shape)

### 今、1と書かれた画像のラベルは1に、5と書かれた画像のラベルは5となっています。これだと、数字が書かれた画像を比較した時にそこには大小関係は存在しないのに、まるで大小関係が存在するかのようになってしまいます。よってこれをone hot encofingという方法を用いて直します。

![MNIST](one-hot.png)

In [None]:
#np_utils.to_categoricalでOne hot表現に変換できる
Y_train = np_utils.to_categorical(y_train, num_classes=10)
Y_test = np_utils.to_categorical(y_test, num_classes=10)

In [None]:
print(Y_train.shape)
print(Y_test.shape)

### これで前処理は終了です。

## 次にデータを学習するモデルを構成します。（モデル組み方は様々なので、各自工夫してみてください。）

### ディープラーニングとはいえどやっていることは数式処理なので、値を関数に代入し新たな値を出すという作業を何度も何度も繰り返しています。

### keras（deep learning用のフレームワーク）ではaddで層を積み上げていくイメージでモデルを構成します。
### kerasには２つの利用可能なモデルがあるのですが、そのうちの１つのSequentialモデルを今回は利用します。

In [None]:
#まずSequentialでやるよ、modelの上に積み上げるよって教えてあげます。（正確にはインスタンスを作ったということ）
model = Sequential()  

# .addでmodel　に層を積み上げていきます。

# Flattenは下記参照
# input_shapeで入力する画像のサイズを指定。
model.add(Flatten(input_shape=(28, 28)))

# Denseで二層目の指定をしている。ここでは出力を800にしている。
model.add(Dense(800))

# Activation:で活性化関数を定義する。今回はrelu関数を使います。
model.add(Activation('relu'))

model.add(Dense(1500))
model.add(Activation('relu'))

model.add(Dense(300))
model.add(Activation('relu'))

# ↓10にしたのは今回分類したいクラスは0~9の10個だからです。
model.add(Dense(10))
model.add(Activation('softmax'))

### flattenで以下のように画像行列をベクトルに変える。今回は28×28　→　784×1　にする。（学習につかう画像のサイズは28×28）


![flatten](flatten.png)

![MNIST](model.png)

### 次の層のノードの１つ１つがもつ値は前のノード達がもつ値を活性化関数(reluやsoftmax)に代入して出力された値です。
#### [活性化関数のグラフ](https://qiita.com/ohisama@github/items/a35979502067e3289850)

In [None]:
#compileで学習の際の設定をする。
model.compile(loss='categorical_crossentropy',optimizer=SGD(),metrics=['accuracy'])    

### lossで誤差関数を、optimizerで最適化手法を、metricsで評価基準を指定しました。

## 以上でモデルの構成が終わりました。

## 作ったモデルとデータで学習します。

In [None]:
# 学習は.fitと打つだけでできる！
hist = model.fit(X_train,Y_train,epochs=2,validation_data=(X_test, Y_test),verbose=1,batch_size=128)


## 学習が終わりました。精度は9割を超えていますね。

##### validationとは英語で「検証」の意味
#### verbose=1とすることで学習の状況ををリアルタムに表示してくれるからみてて楽しい。
#### batch_sizeはハイパーパラメータの一種、2の累乗数にするのが王道らしい。今回は32だと96%、64だと93.9%、128だと96.7%だった。
#### batch_sizeは一回の処理で何件のデータを処理するかを表している。epoch数は全データを何回回すか？を指定している。例えばbatch_sizeが32でエポック数が200の時、3200個のデータがあったとすると一周に100回分かかり、それを200回繰り返すということを表してる。batch_sizeが小さいと、また、epochsが大きいと時間がかかる。

[わかりやすいサイト](http://aidiary.hatenablog.com/entry/20160328/1459174455)

### 因みにですが、データの前処理の段階で正規化をしましたが、もしも正規化をしていないと精度は↓こんな感じでした。

![MNIST](no_normalization.png)

### 精度が低いですね...





## では学習済みモデルを使って実際に予測してみましょう！！！

## 自分で黒いマッキーで白い紙に数字を太く書いて写真をとり、数字が中央に大きくくるように、また形が正方形になるようにトリミングしてください。試してみたい画像をPCに入れて、このファイル（Deeplearning_text.ipynb）と同じ階層においてください。（前回と同様にアップロードすれば良いです、）
## 0とかがおすすめです（わかりやすいから）

### ↓ここにその画像ファイルの名前を入れてください。''は残しておいてください。


In [None]:
 #cv2.imreadで試してみたい画像をimgに代入する。
img = cv2.imread('試したい画像ファイルの名前')

In [None]:
#試したい画像を一旦表示してみます。
plt.imshow(img)

In [None]:
#試したい画像の形を表示します。
print(img.shape)

### 上で（a,b,3）と表示されたなら、サイズがa×bでカラーであることを意味します、(a,b）と表示されたなら、サイズがa×bで白黒であることを意味します。

### 我々が作ったモデルはサイズが28×28で白黒の画像（背景が黒で文字が白い）で学習させたので試したい画像も同じようにしなければいけません。

In [None]:
#まずサイズを28×28にします
resized = cv2.resize(img, (28, 28))

In [None]:
#28×28となっていることを確認してください。
print(resized.shape)

In [None]:
#matplotlibを使う
plt.imshow(resized)

In [None]:
#次に白黒にします。print(img.shape)で（a,b)となった人は不要です。
grayed = cv2.cvtColor(resized, cv2.COLOR_RGB2GRAY)

In [None]:
#３番目の引数がなくなっていることを確認してください。
print(grayed.shape)

In [None]:
plt.gray()
plt.imshow(grayed)

In [None]:
#白と黒を入れ替えて、黒背景で白文字となるようにします。
inv = cv2.bitwise_not(grayed)

In [None]:
plt.gray()
plt.imshow(inv)

In [None]:
pred = model.predict(inv.reshape(1, 28, 28)).argmax()
print('この画像の数字はズバリ ', pred, 'でしょう！！')


### 参考

#### この教材の作り方
#### [マークダウンの記述](https://qiita.com/tbpgr/items/989c6badefff69377da7)   　　　     [jupyter notebookでのマークダウン](https://deepage.net/machine_learning/2016/12/13/jupyter_notebook.html)

#### 発展（時間が余ったら）

#### 画像データの集め方が知りたい人は[このnote](https://note.mu/barabara/n/n717a2b481c34)の冒頭をみてください。ちょいちょい間に入れてた補足のサイトをみて理解を深めたり、わからないところをググるのも良いかもしれませんね。
