In [1]:
pip install optuna

Collecting optuna
  Downloading optuna-4.2.1-py3-none-any.whl.metadata (17 kB)
Collecting alembic>=1.5.0 (from optuna)
  Downloading alembic-1.14.1-py3-none-any.whl.metadata (7.4 kB)
Collecting colorlog (from optuna)
  Downloading colorlog-6.9.0-py3-none-any.whl.metadata (10 kB)
Collecting Mako (from alembic>=1.5.0->optuna)
  Downloading Mako-1.3.9-py3-none-any.whl.metadata (2.9 kB)
Downloading optuna-4.2.1-py3-none-any.whl (383 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m383.6/383.6 kB[0m [31m10.2 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading alembic-1.14.1-py3-none-any.whl (233 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m233.6/233.6 kB[0m [31m13.1 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading colorlog-6.9.0-py3-none-any.whl (11 kB)
Downloading Mako-1.3.9-py3-none-any.whl (78 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m78.5/78.5 kB[0m [31m2.7 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: M

1. Загружаем набор данных о диабете и разделяем его на обучающую и тестовую выборки.
2. Определяем функцию `objective`, которая принимает `trial` и настраивает гиперпараметр `alpha` для Ridge-регрессии. Мы используем `suggest_loguniform`, чтобы задать логарифмическое пространство для `alpha`.
3. Обучаем модель и вычисляем MSE, который будем минимизировать.
4. Создаем объект `study`, чтобы оптимизировать гиперпараметры, и запускаем процесс оптимизации с заданным количеством операций (в данном случае 100).
5. После нахождения лучших гиперпараметров, мы обучаем финальную модель и рассчитываем R² и MSE на тестовых данных.
6. В конце выводим лучшие гиперпараметры, а также значения R² и MSE.

In [2]:
import numpy as np
import optuna
from sklearn.datasets import load_diabetes
from sklearn.model_selection import train_test_split
from sklearn.linear_model import Ridge
from sklearn.metrics import mean_squared_error, r2_score

In [3]:
# Загружаем данные
diabetes = load_diabetes()
X = diabetes.data
y = diabetes.target

In [4]:
# Разделяем данные на обучающую и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [5]:
# Функция для оптимизации гиперпараметров
def objective(trial):
    # Определяем гиперпараметры
    alpha = trial.suggest_loguniform('alpha', 1e-5, 1e2)
    model = Ridge(alpha=alpha)

    # Обучаем модель
    model.fit(X_train, y_train)

    # Предсказываем
    y_pred = model.predict(X_test)

    # Вычисляем ошибки
    mse = mean_squared_error(y_test, y_pred)
    return mse  # Возвращаем MSE для минимизации

In [6]:
# Настраиваем оптимизацию гиперпараметров
study = optuna.create_study(direction='minimize')
study.optimize(objective, n_trials=100)

# Выводим лучшие гиперпараметры
best_params = study.best_params
best_model = Ridge(alpha=best_params['alpha'])
best_model.fit(X_train, y_train)

# Делаем предсказания на тестовом наборе
y_pred = best_model.predict(X_test)

[I 2025-02-23 17:08:47,693] A new study created in memory with name: no-name-d04ed672-7377-4437-8ae2-a5f6be5a3aa1
  alpha = trial.suggest_loguniform('alpha', 1e-5, 1e2)
[I 2025-02-23 17:08:47,736] Trial 0 finished with value: 2865.4508605802157 and parameters: {'alpha': 0.05313571264070418}. Best is trial 0 with value: 2865.4508605802157.
  alpha = trial.suggest_loguniform('alpha', 1e-5, 1e2)
[I 2025-02-23 17:08:47,743] Trial 1 finished with value: 2900.1125718608523 and parameters: {'alpha': 1.5505328686392524e-05}. Best is trial 0 with value: 2865.4508605802157.
  alpha = trial.suggest_loguniform('alpha', 1e-5, 1e2)
[I 2025-02-23 17:08:47,749] Trial 2 finished with value: 3511.959108471827 and parameters: {'alpha': 2.507144430059446}. Best is trial 0 with value: 2865.4508605802157.
  alpha = trial.suggest_loguniform('alpha', 1e-5, 1e2)
[I 2025-02-23 17:08:47,764] Trial 3 finished with value: 5195.061061151797 and parameters: {'alpha': 75.77191885708655}. Best is trial 0 with value: 2

In [7]:
# Вычисляем R² и MSE
r2 = r2_score(y_test, y_pred)
mse = mean_squared_error(y_test, y_pred)

print(f"Лучшие гиперпараметры: alpha = {best_params['alpha']}")
print(f"R²: {r2:.4f}")
print(f"MSE: {mse:.4f}")

Лучшие гиперпараметры: alpha = 0.15491959314495785
R²: 0.4615
MSE: 2853.2739
