05 評価基準を用いたモデル選択
========================

* これまでにさまざなま評価基準と実際の値とモデルが与えられた際に適用する方法を詳細に述べた

* AUCのような基準を、`GridSearchCV`や`cross_val_score`によるモデル選択で用いたいという場合も多い

    * scikit-learnではこれを簡単に実現できる
    
* `GridSearchCV`や`cross_val_score`にもある`scoring`という引数を用いる

    * 利用したい評価基準を文字列で与えるだけで良い
    
    * 例)digitsデータセットの「9 vs. 9以外」タスクでのVMクラス分類器を、AUCスコアで評価したいとする
    
    * デフォルトの基準(精度)からAUCに変更するには、`roc_auc`を`scoring`パラメータに与えれば良い

In [1]:
from sklearn.model_selection import cross_val_score
from sklearn.datasets import load_digits
from sklearn.svm import SVC
digits = load_digits()

# デフォルトのクラス分類スコアは精度
print("Default scoring: {}".format(
    cross_val_score(SVC(), digits.data, digits.target == 9, cv=5)))
# scoring="accuracy"としても結果は変わらない
explicit_accuracy =  cross_val_score(SVC(), digits.data, digits.target == 9,
                                     scoring="accuracy", cv=5)
print("Explicit accuracy scoring: {}".format(explicit_accuracy))
roc_auc =  cross_val_score(SVC(), digits.data, digits.target == 9,
                           scoring="roc_auc", cv=5)
print("AUC scoring: {}".format(roc_auc))



Default scoring: [0.9        0.9        0.89972145 0.89972145 0.89972145]




Explicit accuracy scoring: [0.9        0.9        0.89972145 0.89972145 0.89972145]




AUC scoring: [0.99674211 0.99725652 0.99552804 0.99836601 0.99165807]


* 同様に、`GridSearchCV`で最良のパラメータを見つける際の基準も変更することができる

In [2]:
from sklearn.model_selection import train_test_split
from sklearn.model_selection import GridSearchCV
from sklearn.metrics import roc_auc_score

X_train, X_test, y_train, y_test = train_test_split(
    digits.data, digits.target == 9, random_state=0)

# 説明の都合上、あまり良くないグリッドを与える
param_grid = {'gamma': [0.0001, 0.01, 0.1, 1, 10]}
# デフォルトのスコア法である精度で評価
grid = GridSearchCV(SVC(), param_grid=param_grid)
grid.fit(X_train, y_train)
print("Grid-Search with accuracy")
print("Best parameters:", grid.best_params_)
print("Best cross-validation score (accuracy)): {:.3f}".format(grid.best_score_))
print("Test set AUC: {:.3f}".format(
    roc_auc_score(y_test, grid.decision_function(X_test))))
print("Test set accuracy: {:.3f}".format(grid.score(X_test, y_test)))



Grid-Search with accuracy
Best parameters: {'gamma': 0.0001}
Best cross-validation score (accuracy)): 0.970
Test set AUC: 0.992
Test set accuracy: 0.973


In [3]:
# AUCをスコアに用いる
grid = GridSearchCV(SVC(), param_grid=param_grid, scoring="roc_auc")
grid.fit(X_train, y_train)
print("\nGrid-Search with AUC")
print("Best parameters:", grid.best_params_)
print("Best cross-validation score (AUC): {:.3f}".format(grid.best_score_))
print("Test set AUC: {:.3f}".format(
    roc_auc_score(y_test, grid.decision_function(X_test))))
print("Test set accuracy: {:.3f}".format(grid.score(X_test, y_test)))




Grid-Search with AUC
Best parameters: {'gamma': 0.01}
Best cross-validation score (AUC): 0.997
Test set AUC: 1.000
Test set accuracy: 1.000


* 精度を用いると、`gamma=0.0001`が選択されるが、AUCを用いると`gamma=0.01`が選択される

    * いずれの場合も、交差検証精度はテストセット精度と整合している
    
    * しかしAUCを用いて見つけたパラメータの方が、AUCだけでなく、精度の面でも良いスコアを示している

* クラス分類における`scoring`パラメータの値として重要なものとしては、

    * `accuracy`(デフォルト)
    
    * `roc_auc`(ROCカーブのカーブ下領域：AUC)
    
    * `average_precision(適合率-再現率カーブのカーブ下領域)
    
    * `f1`
    
    * `f1_macro`
    
    * `f1_micro`
    
    * `f1_weighted`(2クラス分類の$f_1$-値と、$f_1$-値の様々な重みつけ平均)
    
* 回帰でよく用いられるのは、`r2`($R^2$スコア)`mean_squared_error`(平均二乗誤差)、`mean_absolute_error`(平均絶対誤差)


* `metrics.scorer`モジュールに定義されている`SORERS`ディクショナリには、サポートされいてる引数の値のリストが表示される

In [4]:
from sklearn.metrics.scorer import SCORERS
print("Available scorers:")
print(sorted(SCORERS.keys()))

Available scorers:
['accuracy', 'adjusted_mutual_info_score', 'adjusted_rand_score', 'average_precision', 'balanced_accuracy', 'brier_score_loss', 'completeness_score', 'explained_variance', 'f1', 'f1_macro', 'f1_micro', 'f1_samples', 'f1_weighted', 'fowlkes_mallows_score', 'homogeneity_score', 'mutual_info_score', 'neg_log_loss', 'neg_mean_absolute_error', 'neg_mean_squared_error', 'neg_mean_squared_log_error', 'neg_median_absolute_error', 'normalized_mutual_info_score', 'precision', 'precision_macro', 'precision_micro', 'precision_samples', 'precision_weighted', 'r2', 'recall', 'recall_macro', 'recall_micro', 'recall_samples', 'recall_weighted', 'roc_auc', 'v_measure_score']


| 版   | 年/月/日   |
| ---- | ---------- |
| 初版 | 2019/03/30 |