# Hyper Parameter Tuning
- hyper parameter : 모델 설정과 관려해 직접 지정할 수 있는 매개변수
- model parameter : 회귀계수(가중치), 절편 등 모델의 학습 대상이 되는 변수


### GridSearchCV

In [5]:
from sklearn.datasets import load_iris
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import GridSearchCV

# 데이터 로드
iris_input, iris_target = load_iris(return_X_y=True)

# 모델 생성
knn = KNeighborsClassifier()

# 테스트할 파라미터 값
params = {
    'n_neighbors' : range(1,13,2)
}

grid = GridSearchCV(knn, params, scoring='accuracy', cv=5)
grid.fit(iris_input, iris_target)

print('최적의 파라미터 : ', grid.best_params_)
print('최적화된 모델 객체 : ', grid.best_estimator_)
print('최적화된 점수: ', grid.best_score_)


최적의 파라미터 :  {'n_neighbors': 7}
최적화된 모델 객체 :  KNeighborsClassifier(n_neighbors=7)
최적화된 점수:  0.9800000000000001


In [None]:
best_knn = grid.best_estimator_
best_knn.score(iris_input,iris_target)
best_knn.fit(iris_input,iris_target)

### RandomSearchCV
- 하이퍼 파라미터의 값 목록이나 값의 범위를 제공하는데, 이 범위 중에 랜덤하게 값을 뽑아내 최적의 하이퍼 파라미터 조합을 찾는다.
    - 탐색범위가 넓을 때 짧은 시간 내에 좋은 결과를 얻을 수 있다.
    - 랜덤하게 값을 추출해 계산하므로, 전역 최적값을 놓칠 수 있다.
    

In [9]:
from sklearn.model_selection import RandomizedSearchCV

# 모델 생성
knn = KNeighborsClassifier()

params = {
    'n_neighbors' : range(1,100,2)
}

# n_iter : 탐색할 최적의 하이퍼 파라미터 조합 수
            # 값이 크면 시간이 오래 걸림 / 값이 작으면 조흔 조합을 찾을 가능성 저하
rd_search = RandomizedSearchCV(knn, params, cv=5, n_iter=10, random_state=0)
rd_search.fit(iris_input, iris_target)

print('최적의 파라미터 : ', rd_search.best_params_)
print('최적화된 모델 객체 : ', rd_search.best_estimator_)
print('최적화된 점수: ', rd_search.best_score_)
rd_search.cv_results_

최적의 파라미터 :  {'n_neighbors': 5}
최적화된 모델 객체 :  KNeighborsClassifier()
최적화된 점수:  0.9733333333333334


{'mean_fit_time': array([0.00103683, 0.00221806, 0.00065722, 0.00082235, 0.00030198,
        0.0004209 , 0.00021024, 0.00020127, 0.00032201, 0.        ]),
 'std_fit_time': array([0.00110114, 0.00277113, 0.00016381, 0.00082774, 0.00060396,
        0.00084181, 0.00042048, 0.00040255, 0.00064402, 0.        ]),
 'mean_score_time': array([0.0053565 , 0.00224547, 0.00341806, 0.01251373, 0.00343208,
        0.00341878, 0.01077733, 0.01056056, 0.001896  , 0.00322952]),
 'std_score_time': array([0.00383794, 0.00308659, 0.00026281, 0.00089588, 0.00354499,
        0.00265435, 0.00240061, 0.00312583, 0.00155373, 0.00397133]),
 'param_n_neighbors': masked_array(data=[57, 23, 21, 83, 5, 55, 77, 63, 45, 9],
              mask=[False, False, False, False, False, False, False, False,
                    False, False],
        fill_value=999999),
 'params': [{'n_neighbors': 57},
  {'n_neighbors': 23},
  {'n_neighbors': 21},
  {'n_neighbors': 83},
  {'n_neighbors': 5},
  {'n_neighbors': 55},
  {'n_neighb