## sklearn.model_selection.GridSearchCV
* class sklearn.model_selection.GridSearchCV(estimator, param_grid, *, scoring=None, n_jobs=None, refit=True, cv=None, verbose=0, pre_dispatch='2*n_jobs', error_score=nan, return_train_score=False)
* 격자 탐색을 crose validation으로 최적의 파라미터를 찾는 것

<https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html>

#### 주요 파라미터 (Parameters):

* estimator: Grid Search를 수행할 머신러닝 모델입니다. 이 모델의 하이퍼파라미터를 튜닝합니다.
* param_grid: 탐색할 하이퍼파라미터 그리드를 나타내는 딕셔너리입니다. 각 키는 모델의 하이퍼파라미터 이름을 나타내고, 값은 해당 하이퍼파라미터의 후보 값을 리스트로 나타냅니다.
* scoring: 모델의 성능을 평가하는 데 사용되는 스코어링 메트릭을 지정합니다. 일반적으로 'accuracy', 'f1', 'precision', 'recall' 등이 사용됩니다.
* cv: 교차 검증 (Cross-Validation)을 위한 분할 수 또는 교차 검증 분할기 (Cross-Validation Splitter)를 지정합니다. 정수 값을 입력하면 k-fold 교차 검증을 수행하고, 교차 검증 분할기 객체를 입력할 수도 있습니다.
* n_jobs: 병렬 처리를 위한 CPU 코어 수를 지정합니다. -1로 설정하면 가능한 모든 코어를 사용합니다.
* verbose: 자세한 로그를 출력할지 여부를 지정합니다. 0은 출력하지 않음을 의미하고, 숫자를 높일수록 더 많은 정보를 출력합니다.

#### 어트리뷰트 (Attributes):

* best_estimator_: 최적의 하이퍼파라미터 조합으로 튜닝된 모델 객체를 반환합니다.
* best_params_: 최적의 하이퍼파라미터 조합을 나타내는 딕셔너리입니다.
* best_score_: 최적 모델의 평균 교차 검증 점수를 나타냅니다.
* cv_results_: 그리드 서치 중에 수행된 교차 검증 결과를 포함하는 딕셔너리입니다. 주로 Grid Search의 세부 정보 및 결과를 분석하는 데 사용됩니다.

In [32]:
import pandas as pd
from sklearn.datasets import load_iris

iris=load_iris()

In [33]:
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import GridSearchCV

X_train, X_test, y_train, y_test = train_test_split(iris.data,iris.target, test_size=0.2, random_state=0)

dtree=DecisionTreeClassifier(random_state=0)

### parameter 들을 dic형태로 설정
parameters= {'max_depth':[3,5,8],'min_samples_split':[5,10],'criterion' :['gini','entropy']}

grid_search=GridSearchCV(dtree,parameters,cv=5,refit=True,n_jobs=-1)
grid_search.fit(X_train,y_train)


In [34]:
grid_search.best_estimator_

In [42]:
## 이게 뭔 말이냐면??


In [35]:
grid_search.best_params_

{'criterion': 'gini', 'max_depth': 3, 'min_samples_split': 5}

In [36]:
grid_search.best_score_

0.9333333333333333

In [38]:
grid_search.cv_results_

{'mean_fit_time': array([0.00080137, 0.00120225, 0.00083756, 0.00124016, 0.00089741,
        0.00115867, 0.00138268, 0.00158601, 0.00099959, 0.00139952,
        0.00139799, 0.00159988]),
 'std_fit_time': array([4.00691414e-04, 4.02380120e-04, 4.24644868e-04, 4.75464026e-04,
        4.86403446e-04, 2.00385016e-04, 4.80858738e-04, 5.56725555e-04,
        1.90734863e-07, 4.90271574e-04, 5.80936183e-04, 4.89765515e-04]),
 'mean_score_time': array([0.00060115, 0.00060296, 0.00083933, 0.00060034, 0.00089846,
        0.00066247, 0.00060096, 0.00050144, 0.00080028, 0.00069923,
        0.00089846, 0.00039973]),
 'std_score_time': array([0.00049084, 0.00049232, 0.00042533, 0.00049017, 0.00048663,
        0.00055163, 0.00049068, 0.00044703, 0.00040014, 0.0005983 ,
        0.00048796, 0.00048957]),
 'param_criterion': masked_array(data=['gini', 'gini', 'gini', 'gini', 'gini', 'gini',
                    'entropy', 'entropy', 'entropy', 'entropy', 'entropy',
                    'entropy'],
        

In [37]:
from sklearn.metrics import accuracy_score

y_pred=grid_search.predict(X_test)
accuracy_score(y_pred,y_test)

0.9666666666666667