교재에 있는 결정 트리 알고리즘 중 하나를 선택한 후, 그리드 서치를 수행
하여 최적의 하이퍼 파라메터를 출력하는 코드를 작성하시오

# 1. Decision Tree

In [1]:
from sklearn.model_selection import GridSearchCV
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier

In [2]:
# 데이터 로딩
iris = load_iris()
X = iris.data
y = iris.target

In [3]:
# 모델 생성
dtc = DecisionTreeClassifier()

In [4]:
# 파라미터 설정
param_grid = {'max_depth': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
              'min_samples_split': [2, 3, 4],
              'min_samples_leaf': [1, 2, 3]}

In [5]:
# 그리드 서치 설정
grid_search = GridSearchCV(dtc, param_grid, cv=5)

In [6]:
# 그리드 서치 수행
grid_search.fit(X, y)

In [7]:
# 최적의 파라미터 출력
print("Best parameters: ", grid_search.best_params_)
print("Best cross-validation score: ", grid_search.best_score_)

Best parameters:  {'max_depth': 3, 'min_samples_leaf': 1, 'min_samples_split': 2}
Best cross-validation score:  0.9733333333333334


# 2. Random Forest

In [8]:
from sklearn.model_selection import GridSearchCV
from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestClassifier

In [9]:
# 데이터 로딩
iris = load_iris()
X = iris.data
y = iris.target

In [10]:
# 모델 생성
rfc = RandomForestClassifier()

In [11]:
# 파라미터 설정
param_grid = {'n_estimators': [10, 50, 100, 200],
              'max_depth': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
              'min_samples_split': [2, 3, 4],
              'min_samples_leaf': [1, 2, 3]}

In [12]:
# 그리드 서치 설정
grid_search = GridSearchCV(rfc, param_grid, cv=5)

In [13]:
# 그리드 서치 수행
grid_search.fit(X, y)

In [14]:
# 최적의 파라미터 출력
print("Best parameters: ", grid_search.best_params_)
print("Best cross-validation score: ", grid_search.best_score_)

Best parameters:  {'max_depth': 1, 'min_samples_leaf': 3, 'min_samples_split': 4, 'n_estimators': 200}
Best cross-validation score:  0.9666666666666668


# 3. AdaBoost

In [15]:
from sklearn.model_selection import GridSearchCV
from sklearn.datasets import load_iris
from sklearn.ensemble import AdaBoostClassifier

In [16]:
# 데이터 로딩
iris = load_iris()
X = iris.data
y = iris.target

In [17]:
# 모델 생성
abc = AdaBoostClassifier()

In [18]:
# 파라미터 설정
param_grid = {'n_estimators': [50, 100, 200],
              'learning_rate': [0.01, 0.05, 0.1, 0.3, 1]}

In [19]:
# 그리드 서치 설정
grid_search = GridSearchCV(abc, param_grid, cv=5)

In [20]:
# 그리드 서치 수행
grid_search.fit(X, y)

In [21]:
# 최적의 파라미터 출력
print("Best parameters: ", grid_search.best_params_)
print("Best cross-validation score: ", grid_search.best_score_)

Best parameters:  {'learning_rate': 0.3, 'n_estimators': 50}
Best cross-validation score:  0.9533333333333334
