# MLPClassifier
scikit-learn の MLPClassifier クラスは、多層パーセプトロン(MLP)方式で実装されている。
* パラメータ
    * hidden_layer_sizes: 隠れ層の層の数とニューロンの数
    * activation: 活性化関数 "identify"、"logistic"、"tanh"、"relu"
    * solver: 最適化手法 "lbfgs"、"sgd"、"adam"
    * alpha: L2正則化のパラメータ
    * learning_rate_unit: 重みの学習率の初期値
    * learning_rate: 重みの学習率の更新方法 "constant"、"invscaling"、"adaptive"
    * max_iter: 試行回数の最大値
    * shuffle: 学習を反復するごとに学習データをシャッフルするかどうか
    * random_state: 乱数のシード値
    * warm_start: 2回目のfit関数を呼ぶ際、学習済みの重みを引き継ぐか否か

# ニューラルネットワークで iris を分類
MLPClassifier を使って、数値データに対するデータセットである irisデータセットを分類する。

In [114]:
from sklearn.datasets import load_iris
iris = load_iris()
x = iris.data
y = iris.target

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(x, y, test_size=0.3, random_state=0)

In [115]:
from sklearn.neural_network import MLPClassifier
mlpc = MLPClassifier()
mlpc.fit(X_train, y_train)



MLPClassifier(activation='relu', alpha=0.0001, batch_size='auto', beta_1=0.9,
       beta_2=0.999, early_stopping=False, epsilon=1e-08,
       hidden_layer_sizes=(100,), learning_rate='constant',
       learning_rate_init=0.001, max_iter=200, momentum=0.9,
       nesterovs_momentum=True, power_t=0.5, random_state=None,
       shuffle=True, solver='adam', tol=0.0001, validation_fraction=0.1,
       verbose=False, warm_start=False)

In [116]:
pred = mlpc.predict(X_test)

import numpy as np
np.mean(pred == y_test)

0.9333333333333333

正解率が低いようなので、Warning が出ていた max_iter の回数を増やして正解率向上を確認する。

In [117]:
mlpc = MLPClassifier(max_iter=1000)
mlpc.fit(X_train, y_train)
pred = mlpc.predict(X_test)

import numpy as np
np.mean(pred == y_test)

0.9777777777777777

# ニューラルネットワークで 簡易手書き数字データの認識
digits データを読み込み、動作を確認する。

In [118]:
from sklearn.datasets import load_digits
digits = load_digits()

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(digits["data"], digits["target"], test_size=0.3, random_state=0)

In [119]:
from sklearn.neural_network import MLPClassifier
mlpc = MLPClassifier(max_iter=1000)
mlpc.fit(X_train, y_train)

MLPClassifier(activation='relu', alpha=0.0001, batch_size='auto', beta_1=0.9,
       beta_2=0.999, early_stopping=False, epsilon=1e-08,
       hidden_layer_sizes=(100,), learning_rate='constant',
       learning_rate_init=0.001, max_iter=1000, momentum=0.9,
       nesterovs_momentum=True, power_t=0.5, random_state=None,
       shuffle=True, solver='adam', tol=0.0001, validation_fraction=0.1,
       verbose=False, warm_start=False)

In [120]:
pred = mlpc.predict(X_test)
import numpy as np
np.mean(pred == y_test)

0.9703703703703703

他のアルゴリズムより若干成績が良い気がするので  
どのように分類したのか、数字ごとに確認する。

In [121]:
from pandas_ml import ConfusionMatrix

ConfusionMatrix(y_test, pred, labels=digits["target_names"])

Predicted   0   1   2   3   4   5   6   7   8   9  __all__
Actual                                                    
0          45   0   0   0   0   0   0   0   0   0       45
1           0  49   0   0   0   0   1   0   1   1       52
2           0   1  52   0   0   0   0   0   0   0       53
3           0   0   0  53   0   0   0   0   1   0       54
4           0   0   0   0  48   0   0   0   0   0       48
5           0   0   0   1   0  54   1   0   0   1       57
6           0   1   0   0   0   0  59   0   0   0       60
7           0   0   0   0   0   0   0  53   0   0       53
8           0   1   0   1   0   1   1   0  57   0       61
9           0   0   0   2   0   0   0   0   1  54       57
__all__    45  52  52  57  48  55  62  53  60  56      540