# Оптимальное ядро

Ваша задача - подобрать оптимальное ядро для решения задачи классификации датасета `breast cancer` при помощи алгоритма `SVC`. Заполните шаблон кода, приведённый ниже, и выберите оптимальное ядро при фиксированных остальных гиперпараметрах.

Значения других гиперпараметров:

* C = 1.0
* degree (для полиномиального ядра) = 2
* gamma = 'auto'
* random_state = 42

Ядра, которые слеедует попробовать: линейное, полиномиальное, радиальное, сигмоидальное.

В качестве ответа укажите строковое название наилучшего ядра без кавычек и других дополнительных символов в нижнем регистре. Имеется в виду название, которое Вы передаёте в аргумент SVC (то есть, например, не `полиномиальное`, а `poly`)

Для проверки качества решения задачи используйте `accuracy` с применением разбиения выборки на train и test с параметром `test_size=0.2` и `random_state=42`.

Не забудьте об использовании `StandardScaler`

In [None]:
import numpy as np
from sklearn import datasets
from sklearn.svm import SVC
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score


data = datasets.load_breast_cancer()
X, y = data.data, data.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

"""
Обучите и примените StandardScaler
"""
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train, y_train)
X_test_scaled = scaler.fit_transform(X_test, y_test)

def compare_svm_kernels(X_train, X_test, y_train, y_test):
    """
      Напишите функцию, определяющую наилучшее ядро для решения данной задачи
    """
    params = {
        'C': 1.0,
        'degree': 2,
        'gamma': 'auto',
        'random_state': 42
    }
    kernels = ['linear', 'poly', 'sigmoid', 'rbf']
    n_splits = 5

    best_kernel = None
    best_accuracy = 0
    for kernel in kernels:
        svm = SVC(kernel=kernel, **params)

        svm.fit(X_train_scaled, y_train)
        y_pred = svm.predict(X_test_scaled)

        accuracy = accuracy_score(y_test, y_pred)
        if accuracy > best_accuracy:
            best_accuracy = accuracy
            best_kernel = kernel

    print(f"Best Kernel: {best_kernel}, Best Mean Accuracy: {best_accuracy:.4f}")

compare_svm_kernels(X_train, X_test, y_train, y_test)

Best Kernel: rbf, Best Mean Accuracy: 0.9825
