## GridSearchCV 메소드를 이용한 그리드 서치 적용
- GridSearch 기능과 교차검증을 동시에 수행!

In [1]:
import warnings
warnings.filterwarnings("ignore")

In [2]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

In [3]:
iris = load_iris()

In [4]:
X_train, X_test, y_train, y_Test = train_test_split(iris.data, iris.target,
                                                   random_state = 0)

결정 트리 모델 적용

In [5]:
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import GridSearchCV

In [9]:
# 그리드 서치 적용
# 파라미터 범위 설정 -> 범위 내 가장 좋은 파라미터 값 출력됨

param_tree = {"max_depth" : range(1,5),
              "max_leaf_nodes" : range(1,50,10),
              "min_samples_leaf": range(1,150,10)}

In [10]:
grid_tree = GridSearchCV(DecisionTreeClassifier(), param_tree, cv = 5)

In [11]:
grid_tree.fit(X_train, y_train)

GridSearchCV(cv=5, estimator=DecisionTreeClassifier(),
             param_grid={'max_depth': range(1, 5),
                         'max_leaf_nodes': range(1, 50, 10),
                         'min_samples_leaf': range(1, 150, 10)})

In [13]:
print("최고의 하이퍼파라미터 :", grid_tree.best_params_)
print("최고의 점수 :", grid_tree.best_score_)
print("최고의성능 모델 :", grid_tree.best_estimator_)

최고의 하이퍼파라미터 : {'max_depth': 3, 'max_leaf_nodes': 11, 'min_samples_leaf': 1}
최고의 점수 : 0.9644268774703558
최고의성능 모델 : DecisionTreeClassifier(max_depth=3, max_leaf_nodes=11)


knn 모델 적용
- n_neighbors : range(1,10)

In [15]:
from sklearn.neighbors import KNeighborsClassifier

In [16]:
param_knn = {"n_neighbors" : range(1,10)}

In [17]:
grid_knn = GridSearchCV(KNeighborsClassifier(), param_knn, cv = 5)

In [18]:
grid_knn.fit(X_train, y_train)

GridSearchCV(cv=5, estimator=KNeighborsClassifier(),
             param_grid={'n_neighbors': range(1, 10)})

In [19]:
print("최고의 하이퍼파라미터 :", grid_knn.best_params_)
print("최고의 점수 :", grid_knn.best_score_)
print("최고의성능 모델 :", grid_knn.best_estimator_)

최고의 하이퍼파라미터 : {'n_neighbors': 6}
최고의 점수 : 0.9640316205533598
최고의성능 모델 : KNeighborsClassifier(n_neighbors=6)


## 랏쏘, 릿지 모델 적용
- 'alpha' : {0.001, 0.01, 0.1, 1, 10, 100, 1000}

랏쏘

In [26]:
from sklearn.linear_model import Lasso

In [27]:
param_lasso = {'alpha' : [0.001, 0.01, 0.1, 1, 10, 100, 1000]}

In [28]:
grid_lasso = GridSearchCV(Lasso(), param_lasso, cv = 5)

In [29]:
grid_lasso.fit(X_train, y_train)

GridSearchCV(cv=5, estimator=Lasso(),
             param_grid={'alpha': [0.001, 0.01, 0.1, 1, 10, 100, 1000]})

In [30]:
print("최고의 하이퍼파라미터 :", grid_lasso.best_params_)
print("최고의 점수 :", grid_lasso.best_score_)
print("최고의성능 모델 :", grid_lasso.best_estimator_)

최고의 하이퍼파라미터 : {'alpha': 0.001}
최고의 점수 : 0.9186561385419278
최고의성능 모델 : Lasso(alpha=0.001)


릿지

In [31]:
from sklearn.linear_model import Ridge

In [32]:
param_ridge = {'alpha' : [0.001, 0.01, 0.1, 1, 10, 100, 1000]}

In [33]:
grid_ridge = GridSearchCV(Ridge(), param_ridge, cv = 5)

In [34]:
grid_ridge.fit(X_train, y_train)

GridSearchCV(cv=5, estimator=Ridge(),
             param_grid={'alpha': [0.001, 0.01, 0.1, 1, 10, 100, 1000]})

In [35]:
print("최고의 하이퍼파라미터 :", grid_ridge.best_params_)
print("최고의 점수 :", grid_ridge.best_score_)
print("최고의성능 모델 :", grid_ridge.best_estimator_)

최고의 하이퍼파라미터 : {'alpha': 0.1}
최고의 점수 : 0.9181889421037803
최고의성능 모델 : Ridge(alpha=0.1)
