# 分類タスクの評価指標
## Accuracy（正解率）
全テストサンプルのうち、正しく分類された割合  
クラスの不均衡がある場合、Accuracyだけでは不十分な評価になる
## Precision（適合率）
モデルが陽性と予測した中で、実際に陽性であった割合  
高い適合率は、誤検出（False Positive）を抑えていることを示す
## Recall（再現率）
実際に陽性であるサンプルのうち、モデルが正しく陽性と予測できた割合
高い再現率は、見逃し（False Negative）が少ないことを示す
## F1スコア
PrecisionとRecallの調和平均  
バランスの良い指標  
クラス不均衡の場合に有用な指標
## ROC-AUC
ROC曲線の下の面積で、分類の閾値を変化させたときの性能を示す
1に近いほど良い性能を意味する  
### ROC(Receiver Operating Characteristic)
以下の2つの指標をプロットして描かれる
#### 真陽性率（True Positive Rate, TPR）
実際に陽性であるサンプルのうち、正しく陽性と予測された割合。
#### 偽陽性率（False Positive Rate, FPR）
実際には陰性であるサンプルのうち、誤って陽性と予測された割合。

In [3]:
# ライブラリのインポート
from sklearn.datasets import make_classification
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, roc_auc_score, classification_report
import numpy as np

# 合成データの生成（2クラス分類）
X, y = make_classification(n_samples=1000, n_features=20, n_informative=10, n_redundant=5,
                           n_classes=2, random_state=42)

# データの分割（訓練データとテストデータ）
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# モデルの作成（ロジスティック回帰）
model = LogisticRegression(max_iter=1000, random_state=42)
model.fit(X_train, y_train)

# 予測値と確信度（確率）
y_pred = model.predict(X_test)
y_prob = model.predict_proba(X_test)[:, 1]  # 陽性クラスの確率

# 各種評価指標の計算
accuracy = accuracy_score(y_test, y_pred)
precision = precision_score(y_test, y_pred)
recall = recall_score(y_test, y_pred)
f1 = f1_score(y_test, y_pred)
roc_auc = roc_auc_score(y_test, y_prob)

print("=== 各種評価指標 ===")
print(f"Accuracy  : {accuracy:.4f}")
print(f"Precision : {precision:.4f}")
print(f"Recall    : {recall:.4f}")
print(f"F1 Score  : {f1:.4f}")
print(f"ROC-AUC   : {roc_auc:.4f}")

# 詳細なレポート
print("\n=== Classification Report ===")
print(classification_report(y_test, y_pred))


=== 各種評価指標 ===
Accuracy  : 0.7950
Precision : 0.7767
Recall    : 0.8163
F1 Score  : 0.7960
ROC-AUC   : 0.8924

=== Classification Report ===
              precision    recall  f1-score   support

           0       0.81      0.77      0.79       102
           1       0.78      0.82      0.80        98

    accuracy                           0.80       200
   macro avg       0.80      0.80      0.79       200
weighted avg       0.80      0.80      0.79       200

