# 11章　モデルの評価 
## レシピ11.1　交差検証 


In [None]:
# ライブラリをロード
from sklearn import datasets
from sklearn import metrics
from sklearn.model_selection import KFold, cross_val_score
from sklearn.pipeline import make_pipeline
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler

# 数字データセットをロード
digits = datasets.load_digits()

# 特徴量行列を作成
features = digits.data

# ターゲットベクトルを作成
target = digits.target

# 標準化器を作成
standardizer = StandardScaler()

# ロジスティック回帰器を作成
logit = LogisticRegression()

# 標準化を行い、ロジスティック回帰を実行するパイプラインを作成
pipeline = make_pipeline(standardizer, logit)

# k-分割交差検証器を作成
kf = KFold(n_splits=5, shuffle=True, random_state=0)

# k-分割交差検証を実行
cv_results = cross_val_score(pipeline,    # パイプライン
                             features,    # 特徴量行列
                             target,      # ターゲットベクトル
                             cv=kf,       # 交差検証手法
                             scoring="accuracy", # スコア関数
                             n_jobs=-1)   # すべてのCPUを利用

# 平均値を計算
cv_results.mean()


In [None]:
# 5回行った評価のスコアを表示
cv_results

In [None]:
# ライブラリをロード
from sklearn.model_selection import train_test_split

# 訓練セットとテストセットに分割
features_train, features_test, target_train, target_test = train_test_split(
    features, target, test_size=0.1, random_state=1)

# 標準化器を訓練セットだけで訓練
standardizer.fit(features_train)

# 訓練した標準化器を訓練セットとテストセットに適用
features_train_std = standardizer.transform(features_train)
features_test_std = standardizer.transform(features_test)

In [None]:
# パイプラインを作成
pipeline = make_pipeline(standardizer, logit)

# k-分割交差検証を実行
cv_results = cross_val_score(pipeline, # パイプライン
                             features, # 特徴量行列
                             target,   # ターゲットベクトル
                             cv=kf,    # 交差検証手法
                             scoring="accuracy", # スコア関数
                             n_jobs=-1) # すべてのコアを利用

## レシピ11.2　ベースライン回帰モデルの作成 


In [None]:
# ライブラリをロード
from sklearn.datasets import load_wine
from sklearn.dummy import DummyRegressor
from sklearn.model_selection import train_test_split

# データをロード
wine = load_wine()

# 特徴量を作成
features, target = wine.data, wine.target

# 訓練セットとテストセットに分割
features_train, features_test, target_train, target_test = train_test_split(
    features, target, random_state=0)

# ダミー回帰器を作成
dummy = DummyRegressor(strategy='mean')

# ダミー回帰器を「訓練」
dummy.fit(features_train, target_train)

# R^2スコアを取得
dummy.score(features_test, target_test)

In [None]:
# ライブラリをロード
from sklearn.linear_model import LinearRegression

# 単純な線形回帰モデルを訓練
ols = LinearRegression()
ols.fit(features_train, target_train)

# R^2スコアを取得
ols.score(features_test, target_test)

In [None]:
# 常に1と予測するダミー回帰モデルを作成
clf = DummyRegressor(strategy='constant', constant=1)
clf.fit(features_train, target_train)

# スコアを評価
clf.score(features_test, target_test)

## レシピ11.3　ベースラインクラス分類モデルの作成 


In [None]:
# ライブラリをロード
from sklearn.datasets import load_iris
from sklearn.dummy import DummyClassifier
from sklearn.model_selection import train_test_split

# データをロード
iris = load_iris()

# ターゲットベクトルと特徴量行列を作成
features, target = iris.data, iris.target

# 訓練セットとテストセットに分割
features_train, features_test, target_train, target_test = train_test_split(
    features, target, random_state=0)

# ダミークラス分類器を作成
dummy = DummyClassifier(strategy='uniform', random_state=1)

# モデルを「訓練」
dummy.fit(features_train, target_train)

# 精度スコアを計算
dummy.score(features_test, target_test)

In [None]:
# ライブラリをロード
from sklearn.ensemble import RandomForestClassifier

# クラス分類器を作成
classifier = RandomForestClassifier()

# モデルを訓練
classifier.fit(features_train, target_train)

# 精度スコアを計算
classifier.score(features_test, target_test)

## レシピ11.4　2クラス分類器の評価 


In [None]:
# ライブラリをロード
from sklearn.model_selection import cross_val_score
from sklearn.linear_model import LogisticRegression
from sklearn.datasets import make_classification

# 特徴量行列とターゲットベクトルを作成
X, y = make_classification(n_samples = 10000,
                           n_features = 3,
                           n_informative = 3,
                           n_redundant = 0,
                           n_classes = 2,
                           random_state = 1)

# ロジスティック回帰器を作成
logit = LogisticRegression()

# 精度をスコアとして交差検証
cross_val_score(logit, X, y, scoring="accuracy")

In [None]:
# 適合率（precision）を用いて交差検証
cross_val_score(logit, X, y, scoring="precision")

In [None]:
# 再現率（recall）を用いて交差検証
cross_val_score(logit, X, y, scoring="recall")

In [None]:
# F1を用いて交差検証
cross_val_score(logit, X, y, scoring="f1")

In [None]:
# ライブラリをロード
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 訓練セットとテストセットに分割
X_train, X_test, y_train, y_test = train_test_split(X,
                                                    y,
                                                    test_size=0.1,
                                                    random_state=1)

# テストターゲットベクトルに対して予測
y_hat = logit.fit(X_train, y_train).predict(X_test)

# 精度を計算
accuracy_score(y_test, y_hat)

## レシピ11.5　2クラス分類器閾値の評価 


In [None]:
# ライブラリをロード
import matplotlib.pyplot as plt
from sklearn.datasets import make_classification
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import roc_curve, roc_auc_score
from sklearn.model_selection import train_test_split

# 特徴量行列とターゲットベクトルを作成
features, target = make_classification(n_samples=10000,
                                       n_features=10,
                                       n_classes=2,
                                       n_informative=3,
                                       random_state=3)

# 訓練セットとテストセットに分割
features_train, features_test, target_train, target_test = train_test_split(
    features, target, test_size=0.1, random_state=1)

# クラス分類器の作成
logit = LogisticRegression()

# モデルの訓練
logit.fit(features_train, target_train)

# 予測確率の取得
target_probabilities = logit.predict_proba(features_test)[:,1]

# 真陽性率と偽陽性率を計算
false_positive_rate, true_positive_rate, threshold = roc_curve(target_test,
target_probabilities)

# ROCカーブをプロット
plt.title("Receiver Operating Characteristic")
plt.plot(false_positive_rate, true_positive_rate)
plt.plot([0, 1], ls="--")
plt.plot([0, 0], [1, 0] , c=".7"), plt.plot([1, 1] , c=".7")
plt.ylabel("True Positive Rate")
plt.xlabel("False Positive Rate")
plt.show()


In [None]:
# 予測確率の取得
logit.predict_proba(features_test)[0:1]

In [None]:
logit.classes_

In [None]:
print("閾値:", threshold[124])
print("真陽性率:", true_positive_rate[124])
print("偽陽性率:", false_positive_rate[124])

In [None]:
print("閾値:", threshold[49])
print("真陽性率:", true_positive_rate[49])
print("偽陽性率:", false_positive_rate[49])

In [None]:
# AUC（カーブの下の面積）を計算
roc_auc_score(target_test, target_probabilities)

## レシピ11.6　多クラス分類器による予測の評価 


In [None]:
# ライブラリをロード
from sklearn.model_selection import cross_val_score
from sklearn.linear_model import LogisticRegression
from sklearn.datasets import make_classification

# ターゲットベクトルと特徴量行列を作成
features, target = make_classification(n_samples = 10000,
                                       n_features = 3,
                                       n_informative = 3,
                                       n_redundant = 0,
                                       n_classes = 3,
                                       random_state = 1)

# ロジスティック回帰器を作成
logit = LogisticRegression()

# 精度を用いて交差検証
cross_val_score(logit, features, target, scoring='accuracy')

In [None]:
# マクロ平均F1スコアを用いて交差検証
cross_val_score(logit, features, target, scoring='f1_macro')

## レシピ11.7　クラス分類器性能の可視化 


In [None]:
# ライブラリをロード
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn import datasets
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix
import pandas as pd

# データをロード
iris = datasets.load_iris()

# 特徴量行列を作成
features = iris.data

# ターゲットベクトルを作成
target = iris.target

# ターゲットクラス名のリストを作成
class_names = iris.target_names

# 訓練セットとテストセットに分割
features_train, features_test, target_train, target_test = train_test_split(
    features, target, random_state=2)

# ロジスティック回帰器を作成
classifier = LogisticRegression()

# モデルを訓練して予測
target_predicted = classifier.fit(features_train,
target_train).predict(features_test)

# 混同行列を作成
matrix = confusion_matrix(target_test, target_predicted)

# pandasのDataFrameを作成
dataframe = pd.DataFrame(matrix, index=class_names, columns=class_names)

# ヒートマップを作成
sns.heatmap(dataframe, annot=True, cbar=None, cmap="Blues")
plt.title("Confusion Matrix"), plt.tight_layout()
plt.ylabel("True Class"), plt.xlabel("Predicted Class")
plt.show()


## レシピ11.8　回帰モデルの評価 


In [None]:
# ライブラリをロード
from sklearn.datasets import make_regression
from sklearn.model_selection import cross_val_score
from sklearn.linear_model import LinearRegression

# ターゲットベクトルと特徴量行列を作成
features, target = make_regression(n_samples = 100,
                                   n_features = 3,
                                   n_informative = 3,
                                   n_targets = 1,
                                   noise = 50,
                                   coef = False,
                                   random_state = 1)

# 線形回帰器を作成
ols = LinearRegression()

# MSE（の符号を反転したもの）を用いて線形回帰器を交差検証
cross_val_score(ols, features, target, scoring='neg_mean_squared_error')

In [None]:
# R^2を用いて線形回帰器を交差検証
cross_val_score(ols, features, target, scoring='r2')

## レシピ11.9　クラスタリングモデルの評価 


In [None]:
# ライブラリをロード
import numpy as np
from sklearn.metrics import silhouette_score
from sklearn import datasets
from sklearn.cluster import KMeans
from sklearn.datasets import make_blobs

# 特徴量行列を作成
features, _ = make_blobs(n_samples = 1000,
                         n_features = 10,
                         centers = 2,
                         cluster_std = 0.5,
                         shuffle = True,
                         random_state = 1)

# k-meansを用いてデータをクラスタリングしクラスを予想
model = KMeans(n_clusters=2, random_state=1).fit(features)

# 予想されたクラスを取得
target_predicted = model.labels_

# モデルを評価
silhouette_score(features, target_predicted)

## レシピ11.10　評価指標のカスタマイズ 


In [None]:
# ライブラリをロード
from sklearn.metrics import make_scorer, r2_score
from sklearn.model_selection import train_test_split
from sklearn.linear_model import Ridge
from sklearn.datasets import make_regression

# ターゲットベクトルと特徴量行列を作成
features, target = make_regression(n_samples = 100,
                                   n_features = 3,
                                   random_state = 1)

# 訓練セットとテストセットに分割
features_train, features_test, target_train, target_test = train_test_split(
    features, target, test_size=0.10, random_state=1)

# 独自の評価指標関数を作成
def custom_metric(target_test, target_predicted):
    # R^2スコアを計算
    r2 = r2_score(target_test, target_predicted)

    # R^2スコアを返す
    return r2

# スコアが高いほうがよいと指定して、スコア付けオブジェクトを作成
score = make_scorer(custom_metric, greater_is_better=True)

# リッジ回帰器を作成
classifier = Ridge()

# リッジ回帰モデルを訓練
model = classifier.fit(features_train, target_train)

# 独自のスコア関数を適用
score(model, features_test, target_test)

In [None]:
# 値の予測
target_predicted = model.predict(features_test)

# R^2スコアの計算
r2_score(target_test, target_predicted)

## レシピ11.11　訓練セットサイズによる影響の可視化 


In [None]:
# ライブラリをロード
import numpy as np
import matplotlib.pyplot as plt
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_digits
from sklearn.model_selection import learning_curve

# データをロード
digits = load_digits()

# 特徴量行列とターゲットベクトルを作成
features, target = digits.data, digits.target

# 訓練セットサイズを変更しながら交差検証を用いた訓練を行い、スコアを取得
train_sizes, train_scores, test_scores = \
    learning_curve(RandomForestClassifier(), # クラス分類器
                   features,                 # 特徴量行列
                   target,                   # ターゲットベクトル
                   cv=10,                    # 分割数
                   scoring='accuracy',       # 性能評価指標
                   n_jobs=-1,                # すべてのコアを利用
                   train_sizes=np.linspace(0.01, 1.0, 50))
                                             # 訓練セットのサイズを50通りに設定
                                                        
# 訓練セットスコアの平均と分散を計算                                                                                                            
train_mean = np.mean(train_scores, axis=1)
train_std = np.std(train_scores, axis=1)

# テストセットスコアの平均と分散を計算
test_mean = np.mean(test_scores, axis=1)
test_std = np.std(test_scores, axis=1)

# 線を描画
plt.plot(train_sizes, train_mean, '--', color="#111111", label="Training score")
plt.plot(train_sizes, test_mean, color="#111111", label="Cross-validation score")

# 帯領域を描画
plt.fill_between(train_sizes, train_mean - train_std,
                 train_mean + train_std, color="#DDDDDD")
plt.fill_between(train_sizes, test_mean - test_std,
                 test_mean + test_std, color="#DDDDDD")

# プロットを作成
plt.title("Learning Curve")
plt.xlabel("Training Set Size"), plt.ylabel("Accuracy Score"),
plt.legend(loc="best")
plt.tight_layout()
plt.show()


## レシピ11.12　評価指標に関するテキストレポートの生成 


In [None]:
# ライブラリをロード
from sklearn import datasets
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report

# データをロード
iris = datasets.load_iris()

# 特徴量行列を作成
features = iris.data

# ターゲットベクトルを作成
target = iris.target

# ターゲットクラス名のリストを作成
class_names = iris.target_names

# 訓練セットとテストセットに分割
features_train, features_test, target_train, target_test = train_test_split(
    features, target, random_state=0)

# ロジスティック回帰器を作成
classifier = LogisticRegression()

# モデルを訓練して予測
model = classifier.fit(features_train, target_train)
target_predicted = model.predict(features_test)

# クラス分類レポートを作成
print(classification_report(target_test,
                            target_predicted,
                            target_names=class_names))

## レシピ11.13　ハイパーパラメータの効果の可視化 


In [None]:
# ライブラリをロード
import matplotlib.pyplot as plt
import numpy as np
from sklearn.datasets import load_digits
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import validation_curve

# データをロード
digits = load_digits()

# 特徴量行列とターゲットベクトルを生成
features, target = digits.data, digits.target

# パラメータ値の範囲を指定
param_range = np.arange(1, 250, 2)

# 指定したパラメータの範囲の範囲に対して、訓練精度とテスト精度を計算
train_scores, test_scores = validation_curve(
    RandomForestClassifier(),  # クラス分類器
    features,                  # 特徴量行列
    target,                    # ターゲットベクトル
    param_name="n_estimators", # 変更するハイパーパラメータ
    param_range=param_range,   # ハイパーパラメータ値の範囲
    cv=3,                      # 交差検証の分割数
    scoring="accuracy",        # 性能評価指標
    n_jobs=-1)                 # すべてのコアを利用

# 訓練セットスコアの平均と標準偏差を算出
train_mean = np.mean(train_scores, axis=1)
train_std = np.std(train_scores, axis=1)

# テストセットスコアの平均と標準偏差を算出
test_mean = np.mean(test_scores, axis=1)
test_std = np.std(test_scores, axis=1)

# 訓練セットとテストセットの平均精度スコアをプロット
plt.plot(param_range, train_mean, label="Training score", color="black")
plt.plot(param_range, test_mean, label="Cross-validation score", color="dimgrey")

# 訓練セットとテストセットの精度帯をプロット
plt.fill_between(param_range, train_mean - train_std,
                 train_mean + train_std, color="gray")
plt.fill_between(param_range, test_mean - test_std,
                 test_mean + test_std, color="gainsboro")

# プロットを作成
plt.title("Validation Curve With Random Forest")
plt.xlabel("Number Of Trees")
plt.ylabel("Accuracy Score")
plt.tight_layout()
plt.legend(loc="best")
plt.show()
