# Scikit-Learn のニューラルネットワーク (2)

Scikit-Learn の2層ニューラルネットワークでMNISTデータセットを分類。

### MNISTデータセット

In [None]:
import numpy as np
from sklearn.datasets import fetch_openml
from sklearn.model_selection import train_test_split

X, Y_str = fetch_openml('mnist_784', version=1, return_X_y=True, as_frame=False)

# 正規化（最小値: 0, 最大値: 1）
# - もとデータは 最小値: 0, 最大値: 255
X_scale = X / 255.
# - 最小値: -1, 最大値: 1 とする場合
#X_scale = ((X / 255.) - .5) * 2

# 正解ラベルは文字列で渡されるため数値に変換
Y = Y_str.astype('int')

# 教師データとテストデータに分割
# - データ数が多くCVやグリッドサーチでは時間がかかるので、ここではホールドアウト法を用いる
X_train, X_test, Y_train, Y_test = train_test_split(X_scale, Y, test_size=0.3, random_state=1)

### ニューラルネットワークの作成・学習

- 指定された繰り返し数に達しても十分にコストが収束していない場合、警告 ConvergenceWarning が表示される。

In [None]:
from sklearn.neural_network import MLPClassifier
# Multi-layer Perceptron classifier
# - max_iter: 50（処理時間を短くするため繰り返しを小さくしている）
# - hidden_layer_sizes: 隠れ層のニューロン数、多層にする場合は各層のニューロン数を指定 eg. [4, 4]
# - learning_rate: 'adaptive' （学習率を適応的に変更）
model = MLPClassifier(max_iter=50, hidden_layer_sizes=[100], learning_rate='adaptive')

# 学習
model.fit(X_train, Y_train)

### 分類精度

- 正確度の表示
- 混同行列の可視化

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.metrics import classification_report, confusion_matrix

# テストデータについてモデルからの予測値を計算
Y_predict = model.predict(X_test)

# 結果の表示
print(classification_report(Y_test, Y_predict, digits=3))

# 混同行列の可視化
plt.figure(figsize=(12, 10))
sns.heatmap(confusion_matrix(Y_test, Y_predict),
            square=True, cbar=True, annot=True, cmap='Blues')
plt.xlabel('Predicted Class')
plt.ylabel('True Class')
plt.show()