# 모델 튜닝 (HPO) - Scikit-Learn

## GridSearchCV
- 검색하고자 하는 피처 값들의 모든 조합을 사용하여 모델을 학습/검증 후 최고의 모델 선택

## RandomizedSearchCV
- 검색하고자 하는 피처 값들의 조합 중 N개의 조합을 임의로 선택하여 모델을 학습/검증 후 최고의 모델 선택
- 피처 값의 범위 혹은 분포를 지정할 수 있음

https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression

https://lightgbm.readthedocs.io/en/latest/pythonapi/lightgbm.LGBMClassifier.html#lightgbm.LGBMClassifier

https://scikit-learn.org/stable/auto_examples/model_selection/plot_randomized_search.html#sphx-glr-auto-examples-model-selection-plot-randomized-search

In [11]:
from sklearn.linear_model import SGDClassifier
import numpy as np

clf = SGDClassifier(loss='hinge', penalty='elasticnet', fit_intercept=True)

In [13]:
from sklearn.model_selection import GridSearchCV

# use a full grid over all parameters
param_grid = {'average' : [True, False],
             'l1_ratio' : np.linspace(0, 1, num=10),
             'alpha' : np.power(10, np.arange(-4, 1, dtype=float))}

# run grid search
grid_search = GridSearchCV(clf, param_grid=param_grid)
start = time()
grid_search.fit(X, y)

In [5]:
from sklearn.model_selection import RandomizedSearchCV

# specify parameters and distributions to sample from
param_dist = {'average' : [True, False],
             'l1_ratio' : stats.uniform(0, 1),
             'alpha' : np.power(10, loguniform(1e-4, 1e0))}

# run randomized search
n_iter_search = 20
random_search = RandomizedSearchCV(clf, param_distributions=param_dist,
                                  n_iter=n_iter_search)

start = time()
random_search.fit(X, y)

# Hypteropt

가장 널리 사용되는 모델 튜닝 (HPO) 라이브러리 중 하나

- 2013년 Harvard의 James Bergstra와 MIT의 Dan Yamins가 Hpteropt를 ICML과 SciPy에서 발표
- Tree-structured Parzen Esimator (TPE) 알고리즘 사용
- scipy.optimize.minimize()와 비슷한 API 제공

# Optuna

최근 각광 받고 있는 모델 튜닝 (HPO) 라이브러리
- 2019년 일본의 prefrred Networks사의 연구진들이 KDD에서 Optuna 발표
- 기존 HPO 라이브러리들의 장점을 결합
- 단순한 API
| <center>Framework</center> | <center>API Style</center>| <center>Prunung</center> | <center>Lightweight</center>| <center>Distributed</center>| <center>DashBoard</center>| <center>OSS</center>  
|:--------:|:--------:|:--------:|:--------:|:--------:|:--------:|:--------:|      
|**<center>SMAC[3]</center>** |<center>define-and-run</center>|<center>X</center>|<center>O</center>|<center>X</center>|<center>X</center>|<center>O</center>|
|**<center>GpyOpt</center>** |<center>define-and-run</center>|<center>X</center>|<center>O</center>|<center>X</center>|<center>X</center>|<center>O</center>|
|**<center>Spearmint[2]</center>** |<center>define-and-run</center>|<center>X</center>|<center>O</center>|<center>O</center>|<center>X</center>|<center>O</center>|
|**<center>Hyperopt[1]</center>** |<center>define-and-run</center>|<center>X</center>|<center>O</center>|<center>O</center>|<center>X</center>|<center>O</center>|
|**<center>Autotune[4]</center>** |<center>define-and-run</center>|<center>O</center>|<center>X</center>|<center>O</center>|<center>O</center>|<center>X</center>|
|**<center>Vizier[5]</center>** |<center>define-and-run</center>|<center>O</center>|<center>X</center>|<center>O</center>|<center>O</center>|<center>X</center>|
|**<center>Katib</center>** |<center>define-and-run</center>|<center>O</center>|<center>X</center>|<center>O</center>|<center>O</center>|<center>O</center>|
|**<center>Tune[7]</center>** |<center>define-and-run</center>|<center>O</center>|<center>X</center>|<center>O</center>|<center>O</center>|<center>O</center>|
| <center>Optuna(this work)</center> | <center>define-by-run</center>| <center>O</center> | <center>O</center>| <center>O</center>| <center>O</center>| <center>O</center>  