# Hyper Parameter Tuning
- hyper parameter: 모델 설정과 관련해 직접 지정할 수 있는 매개변수
- model parameter: 회귀계수(가중치), 절편 등 모델의 학습 대상이 도는 변수

## GridSearchCV

In [5]:
from sklearn.datasets import load_iris
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import GridSearchCV

iris_input, iris_output = load_iris(return_X_y=True)

knn = KNeighborsClassifier()

params = {
    'n_neighbors': range(1, 13, 2)
}

# 첫 번째 인자: 모델
# 두 번째 인자: 테스트할 parameter 모음집 (딕셔너리 형태)
# scoring: 평가 지표 (accuracy, precision, recall, f1)
# cv: 반복 횟수
grid = GridSearchCV(knn, params, scoring='accuracy', cv=5)
grid.fit(iris_input, iris_output) # grid search는 수행 도구니까 이 부분에 input이랑 target 다 넣어줌

print(f"최적의 파라미터:", grid.best_params_)
print(f"최적의 모델 객체:", grid.best_estimator_)
print(f"최적화된 점수:", grid.best_score_)

최적의 파라미터: {'n_neighbors': 7}
최적의 모델 객체: KNeighborsClassifier(n_neighbors=7)
최적화된 점수: 0.9800000000000001


In [4]:
best_knn = grid.best_estimator_
best_knn.score(iris_input, iris_output)

0.9733333333333334

### RandomSearchCV
- 하이퍼 파라미터의 값 목록이나 값의 범위를 제공하는데, 이 범위 중에 랜덤하게 값을 뽑아내 최적의 하이퍼 파라미터 조합을 찾는다.
    - 탐색범위가 넓을 때 짧은 시간 내에 좋은 결과를 얻을 수 있다
    - 랜덤하게 값을 추출해 계산하므로, 전역 최적값을 놓칠 수 있다

In [12]:
from sklearn.model_selection import RandomizedSearchCV

knn = KNeighborsClassifier()

params = {
    'n_neighbors': range(1,150,2)
}

rd_search = RandomizedSearchCV(knn, params, cv =5, n_iter=10, random_state=0)
rd_search.fit(iris_input, iris_output)

print(f"최적의 파라미터:", rd_search.best_params_)
print(f"최적의 모델 객체:", rd_search.best_estimator_)
print(f"최적화된 점수:", rd_search.best_score_)


최적의 파라미터: {'n_neighbors': 15}
최적의 모델 객체: KNeighborsClassifier(n_neighbors=15)
최적화된 점수: 0.9666666666666668


Traceback (most recent call last):
  File "c:\Users\Playdata\anaconda3\envs\ml_env\Lib\site-packages\sklearn\model_selection\_validation.py", line 942, in _score
    scores = scorer(estimator, X_test, y_test, **score_params)
             ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "c:\Users\Playdata\anaconda3\envs\ml_env\Lib\site-packages\sklearn\metrics\_scorer.py", line 492, in __call__
    return estimator.score(*args, **kwargs)
           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "c:\Users\Playdata\anaconda3\envs\ml_env\Lib\site-packages\sklearn\neighbors\_classification.py", line 446, in score
    return super().score(X, y, sample_weight)
           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "c:\Users\Playdata\anaconda3\envs\ml_env\Lib\site-packages\sklearn\base.py", line 546, in score
    return accuracy_score(y, self.predict(X), sample_weight=sample_weight)
                             ^^^^^^^^^^^^^^^
  File "c:\Users\Playdata\anaconda3\envs\ml_env\Lib\site-packages\sk