### GridSearchCV 메소드를 이용한 그리드 서치 적용
- GridSearch 기능과 교차 검증을 동시에 수행

In [4]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

In [1]:
import warnings
warnings.filterwarnings("ignore")

In [3]:
iris = load_iris()

In [5]:
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, random_state = 0)

### 결정 트리 모델 적용

In [7]:
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import GridSearchCV

In [11]:
# 그리드 서치를 적용하기 위한 준비
# 파라미터의 범위를 설정 -> 설정한 범위 내에서 가장 좋은 파라미터 값이 출력됨
param_tree = {"max_depth" : range(1, 5),
              "max_leaf_nodes" : range(1, 50, 10),
              "min_samples_leaf" : range(1, 150, 10) }

In [12]:
grid_tree = GridSearchCV(DecisionTreeClassifier(), param_tree, cv=5)

In [13]:
grid_tree.fit(X_train, y_train)

GridSearchCV(cv=5, estimator=DecisionTreeClassifier(),
             param_grid={'max_depth': range(1, 5),
                         'max_leaf_nodes': range(1, 50, 10),
                         'min_samples_leaf': range(1, 150, 10)})

In [14]:
print("최고의 하이퍼파라미터 :", grid_tree.best_params_)
print("최고의 점수 :", grid_tree.best_score_)
print("최고 성능의 모델 :", grid_tree.best_estimator_)

최고의 하이퍼파라미터 : {'max_depth': 3, 'max_leaf_nodes': 11, 'min_samples_leaf': 1}
최고의 점수 : 0.9644268774703558
최고 성능의 모델 : DecisionTreeClassifier(max_depth=3, max_leaf_nodes=11)


### KNN 모델 적용
- n_neighbors : range(1, 10)

In [16]:
from sklearn.neighbors import KNeighborsClassifier

In [15]:
param_knn = {"n_neighbors" : range(1, 10) }

In [39]:
grid_knn = GridSearchCV(KNeighborsClassifier(), param_knn, cv=5)

In [40]:
grid_knn.fit(X_train, y_train)

GridSearchCV(cv=5, estimator=KNeighborsClassifier(),
             param_grid={'n_neighbors': range(1, 10)})

In [41]:
print("최고의 하이퍼파라미터 :", grid_knn.best_params_)
print("최고의 점수 :", grid_knn.best_score_)
print("최고 성능의 모델 :", grid_knn.best_estimator_)

최고의 하이퍼파라미터 : {'n_neighbors': 6}
최고의 점수 : 0.9640316205533598
최고 성능의 모델 : KNeighborsClassifier(n_neighbors=6)


### 라쏘, 릿지 모델 적용
- param_lasso = 'alpha' : {0.001, 0.01, 0.1, 1, 10, 100, 1000}

In [51]:
from sklearn.linear_model import Lasso, Ridge

In [42]:
param_lasso = {'alpha' : [0.001, 0.01, 0.1, 1, 10, 100, 1000]}

In [43]:
grid_lasso = GridSearchCV(Lasso(), param_lasso, cv=5)

In [49]:
grid_ridge = GridSearchCV(Ridge(), param_lasso, cv=5)

In [44]:
grid_lasso.fit(X_train, y_train)

GridSearchCV(cv=5, estimator=Lasso(),
             param_grid={'alpha': [0.001, 0.01, 0.1, 1, 10, 100, 1000]})

In [50]:
grid_ridge.fit(X_train, y_train)

GridSearchCV(cv=5, estimator=Ridge(),
             param_grid={'alpha': [0.001, 0.01, 0.1, 1, 10, 100, 1000]})

In [45]:
print("최고의 하이퍼파라미터 :", grid_lasso.best_params_)
print("최고의 점수 :", grid_lasso.best_score_)
print("최고 성능의 모델 :", grid_lasso.best_estimator_)

최고의 하이퍼파라미터 : {'alpha': 0.001}
최고의 점수 : 0.9186561385419278
최고 성능의 모델 : Lasso(alpha=0.001)


In [52]:
print("최고의 하이퍼파라미터 :", grid_ridge.best_params_)
print("최고의 점수 :", grid_ridge.best_score_)
print("최고 성능의 모델 :", grid_ridge.best_estimator_)

최고의 하이퍼파라미터 : {'alpha': 0.1}
최고의 점수 : 0.9181889421037803
최고 성능의 모델 : Ridge(alpha=0.1)
