<a href="https://colab.research.google.com/github/yukinaga/minnano_ds/blob/main/section_5/04_decision_tree.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 決定木
決定木（Decision Tree）では、木の枝のような構造を用いて分類を行います。  
学習結果を視覚化が可能で、ルールを明確に表記できるというメリットがあります。

## ●データセットの読み込み
今回は、Irisデータセットを使用します。以下はこのデータセットの説明変数です。  

sepal length (cm): がくの長さ  
sepal width (cm): がくの幅  
petal length (cm): 花弁の長さ
petal width (cm): 花弁の幅  

目的変数classは0から2の整数で、花の品種を表します。

In [None]:
import numpy as np
from sklearn.datasets import load_iris

iris = load_iris()

## ●決定木の実装
`tree.DecisionTreeClassifier`により決定木のモデルを作成します。  

In [None]:
from sklearn import tree

model = tree.DecisionTreeClassifier(max_depth=3)

fitメソッドにより訓練が行われ、決定木が構築されます。 

In [None]:
model = model.fit(iris.data, iris.target)

`predict`メソッドにより予測を行い、正解率を測定します。  

In [None]:
predicted = model.predict(iris.data)
print("正解率:", sum(predicted == iris.target) / len(iris.target))

`graphviz`と`pydotplus`を使い、決定木を可視化します。

In [None]:
import graphviz
import pydotplus
from IPython.display import Image

dot_str = tree.export_graphviz(
    model,
    feature_names=iris.feature_names, 
    out_file=None,  
    filled=True,
    rounded=True
    ) 
graph = pydotplus.graph_from_dot_data(dot_str) 

file_name = "iris_tree.png"
graph.write_png(file_name)
Image(file_name)