# Оптимальное ядро

Ваша задача - подобрать оптимальное ядро для решения задачи классификации датасета `breast cancer` при помощи алгоритма `SVC`. Заполните шаблон кода, приведённый ниже, и выберите оптимальное ядро при фиксированных остальных гиперпараметрах.

Значения других гиперпараметров:

* C = 1.0
* degree (для полиномиального ядра) = 2
* gamma = 'auto'
* random_state = 42

Ядра, которые слеедует попробовать: линейное, полиномиальное, радиальное, сигмоидальное.

В качестве ответа укажите строковое название наилучшего ядра без кавычек и других дополнительных символов в нижнем регистре. Имеется в виду название, которое Вы передаёте в аргумент SVC (то есть, например, не `полиномиальное`, а `poly`)

Для проверки качества решения задачи используйте `accuracy` с применением разбиения выборки на train и test с параметром `test_size=0.2` и `random_state=42`.

Не забудьте об использовании `StandardScaler`

In [1]:
import numpy as np
from sklearn import datasets
from sklearn.svm import SVC
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

data = datasets.load_breast_cancer()
X, y = data.data, data.target

# Split the dataset into train and test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Initialize and fit the StandardScaler
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

def compare_svm_kernels(X_train, X_test, y_train, y_test):
    """
    A function to determine the best kernel for the task.
    """
    kernels = ['linear', 'poly', 'rbf', 'sigmoid']
    best_score = 0
    best_kernel = None

    for kernel in kernels:
        # Create an SVC model with the specified parameters
        model = SVC(kernel=kernel, C=1.0, degree=2, gamma='auto', random_state=42)
        # Train the model
        model.fit(X_train, y_train)
        # Make predictions on the test set
        y_pred = model.predict(X_test)
        # Calculate accuracy
        score = accuracy_score(y_test, y_pred)
        # Print the result for each kernel
        print(f"Kernel: {kernel}, Accuracy: {score:.4f}")

        # Update the best kernel if a higher accuracy is found
        if score > best_score:
            best_score = score
            best_kernel = kernel

    print(f"\nThe best kernel is '{best_kernel}' with an accuracy of {best_score:.4f}")
    return best_kernel

# Call the function
compare_svm_kernels(X_train_scaled, X_test_scaled, y_train, y_test)

Kernel: linear, Accuracy: 0.9561
Kernel: poly, Accuracy: 0.8070
Kernel: rbf, Accuracy: 0.9825
Kernel: sigmoid, Accuracy: 0.9561

The best kernel is 'rbf' with an accuracy of 0.9825


'rbf'