# 決定木(Decision Tree)

## 決定木とは<a name="description"></a>

- IF文の連続で結果を予測するモデル
- 精度は低いが、結果に対する説明力(理由の理解しやすさ)が高い
- Random ForestやDecision Jungleなどの樹木系アルゴリズムのベース
- 元のデータを根(root)・分類の最終点を葉(leaf)・根から葉に至る途中を枝(branch)と呼ぶ

## 使用例<a name="example"></a>

### データ準備<a name="data"></a>

scikit-learnに用意されているデータを使用する。

In [None]:
import numpy as np
from sklearn.datasets import load_iris
import pandas as pd

iris = load_iris()
X, y = iris.data, iris.target

data = np.concatenate([X, y[:, np.newaxis]], axis=1)
columns = iris.feature_names + ['target']
df = pd.DataFrame(data=data, columns=columns)
df.tail()

### 学習<a name="training"></a>

In [None]:
from sklearn.tree import DecisionTreeClassifier

clf = DecisionTreeClassifier()
clf.fit(X, y)

### 結果の可視化<a name="visualization"></a>

In [None]:
from sklearn import tree
import pydotplus 
from IPython.display import Image

dot_data = tree.export_graphviz(
    clf, out_file=None, feature_names=iris.feature_names,
    class_names=iris.target_names, filled=True, rounded=True,
    special_characters=True)
graph = pydotplus.graph_from_dot_data(dot_data)
Image(graph.create_png())