# Оптимальное ядро

Ваша задача - подобрать оптимальное ядро для решения задачи классификации датасета `breast cancer` при помощи алгоритма `SVC`. Заполните шаблон кода, приведённый ниже, и выберите оптимальное ядро при фиксированных остальных гиперпараметрах.

Значения других гиперпараметров:

* C = 1.0
* degree (для полиномиального ядра) = 2
* gamma = 'auto'
* random_state = 42

Ядра, которые слеедует попробовать: линейное, полиномиальное, радиальное, сигмоидальное.

В качестве ответа укажите строковое название наилучшего ядра без кавычек и других дополнительных символов в нижнем регистре. Имеется в виду название, которое Вы передаёте в аргумент SVC (то есть, например, не `полиномиальное`, а `poly`)

Для проверки качества решения задачи используйте `accuracy` с применением разбиения выборки на train и test с параметром `test_size=0.2` и `random_state=42`.

Не забудьте об использовании `StandardScaler`

In [1]:
import numpy as np
from sklearn import datasets
from sklearn.svm import SVC
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

names = [
    "Linear SVM",
    "RBF SVM",
    "Polinomial SVM, degree=2",
    "Sigmoidal kernel SVM"
]

classifiers = [
    SVC(kernel="linear", C=1.0, random_state=42),
    SVC(kernel='rbf', gamma='auto', C=1.0, random_state=42),
    SVC(kernel='poly', degree=2, gamma='auto', C=1.0, random_state=42),
    SVC(kernel='sigmoid', gamma='auto', C=1.0, random_state=42)
]

data = datasets.load_breast_cancer()
X, y = data.data, data.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, shuffle=True, random_state=42)

scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

def compare_svm_kernels(X_train, X_test, y_train, y_test):
    best_accuracy = 0
    best_kernel = None
    
    for name, clf in zip(names, classifiers):
        clf.fit(X_train, y_train)
        y_pred = clf.predict(X_test)
        accuracy = accuracy_score(y_test, y_pred)
        
        if accuracy > best_accuracy:
            best_accuracy = accuracy
            best_kernel = clf.kernel
    
    return best_kernel

best_kernel = compare_svm_kernels(X_train_scaled, X_test_scaled, y_train, y_test)
print(best_kernel)

rbf


In [2]:
X_train

array([[9.029e+00, 1.733e+01, 5.879e+01, ..., 1.750e-01, 4.228e-01,
        1.175e-01],
       [2.109e+01, 2.657e+01, 1.427e+02, ..., 2.903e-01, 4.098e-01,
        1.284e-01],
       [9.173e+00, 1.386e+01, 5.920e+01, ..., 5.087e-02, 3.282e-01,
        8.490e-02],
       ...,
       [1.429e+01, 1.682e+01, 9.030e+01, ..., 3.333e-02, 2.458e-01,
        6.120e-02],
       [1.398e+01, 1.962e+01, 9.112e+01, ..., 1.827e-01, 3.179e-01,
        1.055e-01],
       [1.218e+01, 2.052e+01, 7.722e+01, ..., 7.431e-02, 2.694e-01,
        6.878e-02]])