## 👨🏻‍💻 Практика - Выбор гиперпараметров 
Оптимизация гиперпараметров модели с помощью перекрестной проверки

✔️**Решение:**
Использован датасет [sales.csv](./files/sales.csv)
### ✔ Импорт библиотек: 
Импортируем все необходимые библиотеки

In [1]:
# Шаг 1: Импорт необходимых библиотек
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

In [2]:
# Шаг 2: Загрузка и подготовка данных
# В этом примере мы будем использовать набор данных Iris из scikit-learn.
# Загрузка данных
iris = load_iris()
X = iris.data
y = iris.target

# Разделение данных на обучающий и тестовый наборы
X_train, X_test, y_train, y_test = (
    train_test_split(X, y, test_size=0.2, random_state=1))

In [3]:
# Шаг 3: Создание модели и определение сетки гиперпараметров
# Создадим модель SVM (Support Vector Machine) 
# и определим сетку гиперпараметров, которые мы хотим оптимизировать.
# Создание модели SVM
model = SVC()
# Определение сетки гиперпараметров
param_grid = {'C': [0.1, 1, 10],
              'gamma': [0.01, 0.1, 1],
              'kernel': ['linear', 'rbf']}

In [4]:
# Шаг 4: Оптимизация гиперпараметров с помощью GridSearchCV
# Используем GridSearchCV для поиска наилучшей комбинации гиперпараметров 
# из заданной сетки с использованием перекрестной проверки.
# Создание объекта GridSearchCV
grid_search = GridSearchCV(estimator=model,
                           param_grid=param_grid,
                           cv=5,
                           scoring='accuracy')

# Подгонка модели на обучающих данных
grid_search.fit(X_train, y_train)
# Вывод лучших гиперпараметров
print("Лучшие гиперпараметры:", grid_search.best_params_)

Лучшие гиперпараметры: {'C': 1, 'gamma': 0.01, 'kernel': 'linear'}


In [5]:
# Шаг 5: Оценка модели с лучшими гиперпараметрами
# Получим лучшую модель из GridSearchCV и оценим 
# ее производительность на тестовом наборе данных.
# Получение лучшей модели
best_model = grid_search.best_estimator_
# Предсказание на тестовом наборе данных
y_pred = best_model.predict(X_test)

# Оценка точности модели
accuracy = accuracy_score(y_test, y_pred)
print("Точность на тестовом наборе:", accuracy)

Точность на тестовом наборе: 1.0
