# 機械学習総復習 - 演習用

## 様々な手法による画像認識

本演習では画像認識を題材として、様々な機械学習の手法を復習していきます。  
画像認識の題材としては、お馴染みのMNISTデータを用いて、手書き文字の認識を行なっていきます。  
はじめに、scikit-learnを用いた、古典的機械学習手法による画像認識手法を、そして次にKerasを用いたDNN・CNNを用いたモデル構築を行なっていきます。  
また、これらのモデル間の予測精度の比較を行なっていきます。

![IMNIST](https://drive.google.com/uc?export=view&id=1EbrnXK-A99d4_m_fyMO9UHP9rUeRJlTh) 

##  古典的機械学習による画像認識

ここでは、古典的機械学習の手法として、ロジスティック回帰モデルを実装していきます。  
はじめに、必要ライブラリのimportをしていきます。

### 必要ライブラリのimport

In [None]:
from matplotlib import pyplot as plt
%matplotlib inline
from matplotlib import cm
from pandas import DataFrame
from sklearn import linear_model
from sklearn.datasets import load_digits
from sklearn.cross_validation import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import classification_report
from sklearn.metrics import confusion_matrix
from sklearn.neighbors import KNeighborsClassifier
from keras.datasets import mnist

### 手書き文字データのロード

In [None]:
(X_train, y_train), (X_test, y_test) = mnist.load_data()

### 画像データの確認

ここで、今回用いるデータセットの具体的な画像について確認をしていきます。

In [None]:
# 画像のindexを0~59999の中から任意の数字を選んでください
# Write me
idx_iamge = 

# X_trainから、idx_iamge番目の画像を取り出し、変数iamgeにセットしてください
# Write me
image = 

# y_trainから、idx_iamge番目のラベルを取り出し、変数labelにセットしてください
# Write me
label = 

# 画像を表示してください
plt.imshow(image, cmap=plt.cm.gray_r, interpolation='nearest')
print("label: ", label)

データセットの中身は確認できたでしょうか？  
idx_iamgeを様々な値に変更することで、データセットの中身をさらに確認してください。

### 学習用データ・テスト用データの前処理

ロジスティック回帰モデルの入力は、各データが1次元で表されていなければなりません。  
`reshape`関数を用いて、データを適切な次元に加工してください。

In [None]:
# Write Me
X_train = 
X_test = 

In [None]:
# X_train, y_train, X_test, y_testの次元数を確認して下さい
# Write Me
print("X_train:", )
print("y_train:", )
print("X_test:", )
print("y_test:", )

In [None]:
# 今回は学習時間の都合上、データを一部、間引いて用います
X_train = X_train[:12000]
y_train = y_train[:12000]
X_test = X_test[:2000]
y_test = y_test[:2000]

In [None]:
# 画像データの正規化を行います。
# 通常0~255の値をとる画素値を0~1の範囲に変換してください

X_train = X_train.astype('float32')
X_test = X_test.astype('float32')

# Write Me
X_train =
X_test =

### ロジスティック回帰モデルによる学習

In [None]:
# ロジスティック回帰モデルを初期化して下さい
# Write me
clf = 

# 学習用データを用いて、ロジスティック回帰モデルを学習して下さい


In [None]:
# テストデータのラベルを予測してください
# Write me
y_pred = 

### 精度評価

In [None]:
# classification_reportによって、各種精度指標を確認して下さい
# Write me


In [None]:
# 混合行列を出力して下さい
# また、混合行列を観察することで、分かることを述べて下さい

# Write me


## DNNを用いた画像認識

次に、深層学習の手法として、DNNモデルを実装していきます。  
はじめに、必要ライブラリのimportをしていきます。

### 必要ライブラリのimport

In [None]:
import keras
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense, Dropout, Activation
from keras.optimizers import SGD, Adam
import matplotlib.pyplot as plt
import seaborn as sns

%matplotlib inline

### データの整形

In [None]:
# ロジスティック回帰モデルによる学習と同様に、画像データのロードと、前処理を行います
(X_train, y_train), (X_test, y_test) = mnist.load_data()

X_train = X_train.reshape(60000, 28*28)
X_test = X_test.reshape(10000, 28*28)

X_train = X_train.astype('float32')
X_test = X_test.astype('float32')
X_train /= 255
X_test /= 255

X_train = X_train[:12000]
y_train = y_train[:12000]
X_test = X_test[:2000]
y_test = y_test[:2000]

クラス分類タスクでは、正解ラベルをOne-hot Label形式で表現します。
kerasでは，`keras.utils.to_categorical`関数で変換できます。

In [None]:
# y_train, y_testをカテゴリカル変数へ変換して下さい
# Write Me
y_train = 
y_test = 

In [None]:
# X_train, y_train, X_test, y_testの次元数を確認して下さい
# Write Me
print("X_train:", )
print("y_train:", )
print("X_test:", )
print("y_test:", )

### モデル構築

- SequentialモデルでDNNを構築します．`model = Sequential()`でSequentialモデルを宣言します．
- 一つのレイヤーは`Dense`レイヤーを追加することで実装できます．`Dense`では，ユニット数と活性化を指定できます．
- 一番初めの層だけは`input_shape`引数が必要です．入力の次元を指定します．

In [None]:
# モデルの構築
model = Sequential()

# 自由にモデル構築をしてみましょう
# Write Me


- `model.summary()`関数で，構築したモデルの概要が確認できます．

In [None]:
model.summary()

- 構築したモデルをコンパイルします。コンパイルには、損失関数，最適化手法と評価関数が設定できます。
- 損失関数は次のものが使用できます: https://keras.io/ja/losses/
- 最適化手法は次のものが使用できます: https://keras.io/ja/optimizers/
- 評価関数は，未指定の場合はlossが採用されます。その他いくつか使用可能なものがありますが、一般にはaccuracyを用いると良いでしょう。

In [None]:
# loss関数にcategorical_crossentropyを、最適化アルゴリズムとしてSGDを、精度評価の指標として正答率を指定してモデルをコンパイルして下さい
# Write Me 
model.compile(
)

In [None]:
# バッチサイズ
batch_size = 128

# エポック数
epochs =50

さて、モデルの学習を実行します。  
モデルの学習は、`model.fit（）`を実行することで、行うことができます。  
ここでは、学習結果の途中記録を残すために、変数`hist`に学習経過を保存します。

In [None]:
# フィッティング(学習)
# 学習を実行して下さい
# Write Me 
hist = model.fit(
)

In [None]:
# テストスコアの計算・表示
# Write Me 
score = 
print('Test loss:', score[0])
print('Test accuracy:', score[1])

### モデルの評価

さて、構築されたモデルの評価を行います。  
はじめに、テストデータに対して、モデルの評価指標となるloss、accuracyを取得しましょう。
モデルの評価は、`model.evaluate()`を実行することで行うことができます。

In [None]:
# テストスコアの計算・表示
# Write Me 

score = 
print('test loss:', score[0])
print('test acc:', score[1])

In [None]:
# エポック毎のAccuracyの可視化
plt.plot(hist.history['acc'])
plt.plot(hist.history['val_acc'])
plt.ylabel('accuracy')
plt.xlabel('epoch')
plt.legend(['train_accuracy', 'valid_accuracy'], loc='best')
plt.show()

In [None]:
# エポック毎のLossの可視化
plt.plot(hist.history['loss'])
plt.plot(hist.history['val_loss'])
plt.ylabel('Loss')
plt.xlabel('epoch')
plt.legend(['train_loss', 'valid_loss'], loc='best')
plt.show()

## CNNを用いた画像認識

最後に、CNNモデルを用いた画像認識を実装します。  
はじめに、必要ライブラリのimportをしていきます。

### 必要ライブラリのimport

In [None]:
import keras
from keras.models import Sequential
from keras.layers import Dense, Dropout, Activation
from keras.optimizers import SGD, Adam
from keras.layers import Conv2D, MaxPooling2D, Flatten
import matplotlib.pyplot as plt
import seaborn as sns

%matplotlib inline

### 学習用データ・テスト用データのロードと前処理

In [None]:
(X_train, y_train), (X_test, y_test) = mnist.load_data()

ロードしたデータのshapeを確認し，学習に適した形式に変換します．
Kerasの畳み込み層`Conv2D`へは，2次元データの入力ができません．そのため，白黒画像を扱う場合には，
```
[データ数, Width, Height, 1]
```
という3次元形式に変換します．

In [None]:
print("X_train:", X_train.shape)
print("y_train:", y_train.shape)
print("X_test:", X_test.shape)
print("y_test:", y_test.shape)

In [None]:
# (データ数, 28, 28) の行列を (データ数, 28, 28, 1) の行列に変換してください 

X_train = 
X_test = 

In [None]:
X_train = X_train.astype('float32')
X_test = X_test.astype('float32')
X_train /= 255
X_test /= 255

X_train = X_train[:12000]
y_train = y_train[:12000]
X_test = X_test[:2000]
y_test = y_test[:2000]

In [None]:
print("X_train:", X_train.shape)
print("y_train:", y_train.shape)
print("X_test:", X_test.shape)
print("y_test:", y_test.shape)

クラス分類タスクでは、正解ラベルをOne-hot Label形式で表現します。
kerasでは，`keras.utils.to_categorical`関数で変換できます。

In [None]:
# y_train, y_testをカテゴリカル変数へ変換して下さい
# Write Me
y_train =
y_test = 

In [None]:
# X_train, y_train, X_test, y_testの次元数を確認して下さい
# Write Me
print("X_train:", )
print("y_train:", )
print("X_test:", )
print("y_test:", )

### モデル構築

- SequentialモデルでCNNを構築します。`model = Sequential()`でSequentialモデルを宣言します。
- 一番初めの層だけは`input_shape`引数が必要です。入力の次元を指定します。

- 畳み込み層は`Conv2D`レイヤーを追加することで実装できます。引数は、
```
Conv2D(ChannelNum, KernelSize)
```
となっています。

- オプション引数の`padding`では、パディングのタイプを選択できます。Kerasでは、入力と同じサイズの出力を保持する`same`と、パディングを行わない`valid`があります。
- 多くの場合、カーネルサイズは$3\times3$ ~ $5\times5$程度の，小さいサイズを指定します。
- チャンネル数は、DNNのユニット数と同様に考えると良いでしょう。
- そのほか，ストライドなどを指定することができます．詳細はリファレンスを参照してください: https://keras.io/ja/layers/convolutional/#conv2d

- プーリング層は`MaxPooling2D`レイヤーを追加することで実装できます。必須引数はありません．オプション引数の`pool_size`でプーリングを行う範囲を指定します。
- そのほか、ストライドなどを指定することができます．詳細はリファレンスを参照してください: https://keras.io/ja/layers/pooling/#maxpooling2d
- 多くの場合、プーリングサイズは$2\times2$程度の小さい範囲を指定します。

- 畳み込み→プーリングの層を作り終えたら、全結合層を構築します．全結合層への入力は1次元にしなければならないので，`Flatten`レイヤーを挿入します。
- 全結合層は、DNNと同じなので、`Dense`レイヤーを追加することで実装できます。

In [None]:
#モデル構築
# Write Me

model = Sequential()


In [None]:
model.summary()

- 構築したモデルをコンパイルします。コンパイルには、損失関数，最適化手法と評価関数が設定できます。
- 損失関数は次のものが使用できます: https://keras.io/ja/losses/
- 最適化手法は次のものが使用できます: https://keras.io/ja/optimizers/
- 評価関数は，未指定の場合はlossが採用されます。その他いくつか使用可能なものがありますが、一般にはaccuracyを用いると良いでしょう。

In [None]:
# loss関数にcategorical_crossentropyを、最適化アルゴリズムとしてAdamを、精度評価の指標として正答率を指定してモデルをコンパイルして下さい
# Write Me 

model.compile(
)

In [None]:
# バッチサイズ
batch_size = 128

# エポック数
epochs = 5

さて、モデルの学習を実行します。  
モデルの学習は、`model.fit（）`を実行することで、行うことができます。  
ここでは、学習結果の途中記録を残すために、変数`hist`に学習経過を保存します。

In [None]:
# フィッティング(学習)
# 学習を実行して下さい
# Write Me 

hist = model.fit(
)

### モデルの評価

さて、構築されたモデルの評価を行います。  
はじめに、テストデータに対して、モデルの評価指標となるloss、accuracyを取得しましょう。  
モデルの評価は、`model.evaluate()`を実行することで行うことができます。

In [None]:
# テストスコアの計算・表示
# Write Me 

score = 
print('test loss:', score[0])
print('test acc:', score[1])

In [None]:
# エポック毎のAccuracyの可視化
plt.plot(hist.history['acc'])
plt.plot(hist.history['val_acc'])
plt.ylabel('accuracy')
plt.xlabel('epoch')
plt.legend(['train_accuracy', 'valid_accuracy'], loc='best')
plt.show()

In [None]:
# エポック毎のLossの可視化
plt.plot(hist.history['loss'])
plt.plot(hist.history['val_loss'])
plt.ylabel('Loss')
plt.xlabel('epoch')
plt.legend(['train_loss', 'valid_loss'], loc='best')
plt.show()

## まとめ

それぞれのモデルの予測精度はどのようでしたでしょうか？  
予測精度に差異が生じた理由について、考察をしてください。