# 7.2. Площади

В этой задаче Вам требуется сравнить значения метрик для 4 различных алгоритмов. Для этого отредактируйте следующий код так, чтобы он соответствовал сформулированному заданию.

In [2]:
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn.svm import SVC
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import roc_auc_score, average_precision_score


X, y = load_breast_cancer(return_X_y=True)
X_train, x_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, random_state=42
)

sc = StandardScaler()
tree = DecisionTreeClassifier()
lr = LogisticRegression()
knn = KNeighborsClassifier(n_neighbors=5)
svm = SVC(probability=True)

sc.fit(X_train)
X_train, X_test = sc.transform(X_train), sc.transform(x_test)

models = [tree, lr, knn, svm]

best_roc_auc, best_pr_auc = 0, 0
best_roc_model, best_pr_model = None, None

for model in models:
    model.fit(X_train, y_train)
    y_pred_proba = model.predict_proba(X_test)[:, 1]
    roc_auc = roc_auc_score(y_test, y_pred_proba)
    pr_auc = average_precision_score(y_test, y_pred_proba)
    
    if roc_auc > best_roc_auc:
        best_roc_auc = roc_auc
        best_roc_model = model
        
    if pr_auc > best_pr_auc:
        best_pr_auc = pr_auc
        best_pr_model = model

print(f'ROC AUC Best Model: {(models.index(best_roc_model) + 1)}')
print(f'PR AUC Best Model: {(models.index(best_pr_model) + 1)}')

ROC AUC Best Model: 2
PR AUC Best Model: 2


## Примечания

1. Обратите внимание, что StandardScaler может влиять на результаты работы алгоритмов. Поэтому рекомендуем его использовать.

2. Когда мы разбиваем данные на train и test, мы должны понимать, что **все** алгоритмы должны обучаться **только на train**. Test при обучении **не используется**. Более того, в реальной жизни мы вообще ничего не знаем про test. Поэтому StandardScaler нужно обучать только на X_train, а к X_test делать только transform (**не** fit_transform).