### XGBoost 모델의 매개변수 탐색 범위 설정 예제

### 학습 내용
 * 기본 베이스라인 매개변수 설정
 * 매개변수 탐색 범위 지정
 * 추가적인 매개변수 조정 가능성 소개 (alpha, lambda)

In [1]:
import numpy as np
from hyperopt import hp

In [3]:
# -----------------------------------
# xgboost의 파라미터 공간의 예
# -----------------------------------

# 베이스라인 매개변수
params = {
    'booster': 'gbtree',             # 트리의 유형
    'objective': 'binary:logistic',  # 목적 함수
    'eta': 0.1,                      # 학습률
    'gamma': 0.0,                    # 가지치기 매개변수
    'alpha': 0.0,                    # L1 규제 하이퍼파라미터
    'lambda': 1.0,                   # L2 규제 하이퍼파라미터
    'min_child_weight': 1,           # 최소 자식 가중치
    'max_depth': 5,                  # 트리의 최대 깊이
    'subsample': 0.8,                # 훈련 샘플의 샘플링 비율
    'colsample_bytree': 0.8,         # 특성의 샘플링 비율
    'random_state': 71,              # 난수 생성기의 시드
}

In [4]:
# 매개변수의 탐색범위
param_space = {
    'min_child_weight': hp.loguniform('min_child_weight', np.log(0.1), np.log(10)),
    'max_depth': hp.quniform('max_depth', 3, 9, 1),
    'subsample': hp.quniform('subsample', 0.6, 0.95, 0.05),
    'colsample_bytree': hp.quniform('subsample', 0.6, 0.95, 0.05),
    'gamma': hp.loguniform('gamma', np.log(1e-8), np.log(1.0)),

    # 여유가 있으면 alpha, lambda도 조정
    # 'alpha' : hp.loguniform('alpha', np.log(1e-8), np.log(1.0)),
    # 'lambda' : hp.loguniform('lambda', np.log(1e-6), np.log(10.0)),
}
