In [1]:
import optuna
from sklearn.datasets import load_iris
from sklearn.model_selection import cross_val_score
from sklearn.svm import SVC

# Определяем целевую функцию для Optuna, которая будет оптимизироваться
def objective(trial):
    # Определяем гиперпараметры, которые хотим оптимизировать.
    # В данном случае это параметр 'C' (регуляризация) и тип ядра 'kernel' для SVM.
    c = trial.suggest_loguniform('svc_c', 1e-10, 1e10)
    kernel = trial.suggest_categorical('svc_kernel', ['linear', 'poly', 'rbf'])
    
    # Загружаем набор данных Iris из sklearn.
    iris = load_iris()
    X, y = iris.data, iris.target

    # Оцениваем модель с текущими гиперпараметрами, используя перекрёстную проверку.
    scores = cross_val_score(SVC(C=c, kernel=kernel), X, y, cv=3)
    
    # Рассчитываем среднюю точность на кросс-валидации для текущего набора гиперпараметров.
    accuracy = scores.mean()
    
    # Возвращаем полученное значение точности.
    return accuracy

study = optuna.create_study(direction='maximize')
study.optimize(objective, n_trials=5)


  from .autonotebook import tqdm as notebook_tqdm
[I 2024-11-03 07:32:10,108] A new study created in memory with name: no-name-691b92ba-089f-49fb-9d98-a3be504a2c28
  c = trial.suggest_loguniform('svc_c', 1e-10, 1e10)
[I 2024-11-03 07:32:10,127] Trial 0 finished with value: 0.32 and parameters: {'svc_c': 1.0931425588021585e-05, 'svc_kernel': 'rbf'}. Best is trial 0 with value: 0.32.
  c = trial.suggest_loguniform('svc_c', 1e-10, 1e10)
[I 2024-11-03 07:32:10,137] Trial 1 finished with value: 0.32 and parameters: {'svc_c': 1.4843225079972864e-06, 'svc_kernel': 'rbf'}. Best is trial 0 with value: 0.32.
  c = trial.suggest_loguniform('svc_c', 1e-10, 1e10)
[I 2024-11-03 07:32:10,146] Trial 2 finished with value: 0.9666666666666667 and parameters: {'svc_c': 74.89243745430814, 'svc_kernel': 'rbf'}. Best is trial 2 with value: 0.9666666666666667.
  c = trial.suggest_loguniform('svc_c', 1e-10, 1e10)
[I 2024-11-03 07:32:10,155] Trial 3 finished with value: 0.32 and parameters: {'svc_c': 0.0029634

In [5]:
study.best_params

{'svc_c': 74.89243745430814, 'svc_kernel': 'rbf'}

In [8]:

# После оптимизации можно использовать различные виды графиков для анализа результатов.

# График контуров показывает, как комбинация двух гиперпараметров влияет на целевую метрику.
# Это помогает увидеть взаимосвязь между параметрами и их оптимальные значения.

plot_contour = optuna.visualization.plot_contour(study, params=["svc_c", "svc_kernel"])
plot_contour.show() 

# plot_contour.write_image('contour.png')

# График распределения эффективности (EDF) показывает долю испытаний, достигших определённого значения целевой функции.
# Это полезно для оценки скорости сходимости оптимизации.

plot_edf = optuna.visualization.plot_edf(study)

# plot_edf.write_image('edf.png')

# График истории оптимизации показывает, как менялась целевая метрика с каждым новым испытанием.
# Это позволяет оценить, насколько быстро модель сходится к лучшему решению.

plot_optimization_history = optuna.visualization.plot_optimization_history(study)

# plot_optimization_history.write_image('optimization_history.png')

# График параллельных координат отвечает за визуализацию взаимосвязей между многомерными гиперпараметрами и их влиянием на целевую метрику.
# Это полезно для изучения тенденций и зависимостей между параметрами.

plot_parallel_coordinate = optuna.visualization.plot_parallel_coordinate(study) # ваш код здесь

# plot_parallel_coordinate.write_image('parallel_coordinate.png')

# График важности параметров помогает понять, какие параметры наиболее важны для производительности модели.

plot_param_importances = optuna.visualization.plot_param_importances(study)

# plot_param_importances.write_image('param_importances.png')

# График среза помогает понять, как изменение одного гиперпараметра влияет на целевую метрику.
# Полезен для детального изучения влияния конкретного параметра.

plot_slice = optuna.visualization.plot_slice(study, params=["svc_c", "svc_kernel"])

# plot_slice.write_image('slice.png')

# График ранжирования показывает, как каждый испытанный набор параметров распределяется по эффективности.
# Это удобный способ сравнить результаты всех испытаний.

plot_rank = optuna.visualization.plot_rank(study, params=["svc_c", "svc_kernel"])

# plot_rank.write_image('rank.png')

# График временной шкалы иллюстрирует, когда каждое испытание было выполнено и сколько времени заняло.
# Это позволяет оценить производительность оптимизации во времени.

plot_timeline = optuna.visualization.plot_timeline(study)
# plot_timeline.write_image('timeline.png')


plot_rank is experimental (supported from v3.2.0). The interface can change in the future.


plot_timeline is experimental (supported from v3.2.0). The interface can change in the future.

