## **1. cross_val_score**

In [10]:
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import cross_val_score
from sklearn.datasets import load_iris
import numpy as np

In [21]:
iris = load_iris()
iris.target

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2])

In [11]:
dt_clf = DecisionTreeClassifier(random_state=156)

features = iris.data
label = iris.target

# 성능 지표는 정확도, 교차 검증 세트는 3개
# dt_clf.fit도 여기서 해 줌
# predict 하는 것은 검증 데이터에 대한 것이고 test에 대한 것 아님
scores = cross_val_score(dt_clf, features, label, scoring='accuracy', cv = 3)
print('교차 검증별 정확도 :', np.round(scores, 4))
print('평균 검증 정확도 :', np.round(np.mean(scores), 4))

교차 검증별 정확도 : [0.98 0.94 0.98]
평균 검증 정확도 : 0.9667


## **2. K-Fold**

In [12]:
from sklearn.model_selection import KFold

In [19]:
kfold = KFold(n_splits=5, shuffle=True, random_state=42)
score = cross_val_score(dt_clf, features, label, scoring='accuracy', cv=kfold)
print('교차 검증별 정확도 :', np.round(score, 4))
print('평균 검증 정확도 :', np.round(np.mean(score), 4))

교차 검증별 정확도 : [1.     0.9667 0.9333 0.9333 0.9333]
평균 검증 정확도 : 0.9533


## **3. Stratified K-Fold**

In [22]:
from sklearn.model_selection import StratifiedKFold

In [24]:
stratified_kfold = StratifiedKFold(n_splits=3, shuffle=True, random_state=42)
score = cross_val_score(dt_clf, features, label, cv=stratified_kfold)
print('교차 검증별 정확도 :', np.round(score, 4))
print('평균 검증 정확도 :', np.round(np.mean(score), 4))

교차 검증별 정확도 : [1.   0.92 0.94]
평균 검증 정확도 : 0.9533


## **4. 임의분할 교차검증**

In [25]:
from sklearn.model_selection import ShuffleSplit

In [27]:
shuffle_split = ShuffleSplit(n_splits=5, test_size=0.5, train_size=0.5, random_state=11)
score = cross_val_score(dt_clf, features, label, cv=shuffle_split)
print('교차 검증별 정확도 :', np.round(score, 4))
print('평균 검증 정확도 :', np.round(np.mean(score), 4))

교차 검증별 정확도 : [0.8933 0.9467 0.9333 0.92   0.96  ]
평균 검증 정확도 : 0.9307
