## 결정 트리 분류기 훈련하기

In [8]:
# 라이브러리를 임포트합니다.
from sklearn.tree import DecisionTreeClassifier
from sklearn import datasets

# 데이터를 로드합니다.
iris = datasets.load_iris()
features = iris.data
target = iris.target

# 결정 트리 분류기를 만듭니다.
decisiontree = DecisionTreeClassifier(random_state=0)

# 모델을 훈련합니다.
model = decisiontree.fit(features, target)

In [9]:
# 새로운 샘플을 만듭니다.
observation = [[ 5,  4,  3,  2]]

# 샘플의 클래스를 예측합니다.
model.predict(observation)

array([1])

In [10]:
# 세 개의 클래스에 댜한 예측 확률을 확인합니다.
model.predict_proba(observation)

array([[0., 1., 0.]])

In [11]:
# 엔트로피를 사용해 결정 트리 분류기를 훈련합니다.

decisiontree_entropy = DecisionTreeClassifier(
    criterion='entropy', random_state=0)

# 모델을 훈련합니다.
model_entropy = decisiontree_entropy.fit(features, target)

## 결정 트리 회귀 훈련하기

In [12]:
# 보스턴 주택가격 데이터셋의 특성에는 흑인 인구 비율이 들어 있어 요즘 시대에 적절치 않다는 의견이 많았습니다.
# 사이킷런 1.0 버전에서 load_boston() 함수가 deprecated 되었고 1.2 버전에서 삭제될 예정입니다.
# 이와 관련된 경고를 무시하기 위해 다음 코드를 추가합니다.
import warnings
warnings.filterwarnings("ignore", category=FutureWarning)

# 라이브러리를 임포트합니다.
from sklearn.tree import DecisionTreeRegressor
from sklearn import datasets

# 데이터를 로드하고 두 개의 특성만 선택합니다.
boston = datasets.load_boston()
features = boston.data[:,0:2]
target = boston.target

# 결정 트리 회귀 모델을 만듭니다.
decisiontree = DecisionTreeRegressor(random_state=0)

# 모델을 훈련합니다.
model = decisiontree.fit(features, target)

In [13]:
# 새로운 샘플을 만듭니다.
observation = [[0.02, 16]]

# 샘플의 타깃을 예측합니다.
model.predict(observation)

array([33.])

In [14]:
# 평균 제곱 오차를 사용한 결정 트리 회귀 모델을 훈련합니다.
decisiontree_mae = DecisionTreeRegressor(criterion="absolute_error", random_state=0)

# 모델을 훈련합니다.
model_mae = decisiontree_mae.fit(features, target)