# Classificação com Árvore de Decisão
### Importando a biblioteca pandas

In [1]:
import pandas as pd
dados = pd.read_csv('jogar-tenis.csv') #lendo os dados
dados

Unnamed: 0,tempo,temperatura,umidade,vento,jogar
0,Ensolarado,Quente,Alta,Fraco,Nao
1,Ensolarado,Quente,Alta,Forte,Nao
2,Nublado,Quente,Alta,Fraco,Sim
3,Chuvoso,Moderada,Alta,Fraco,Sim
4,Chuvoso,Frio,Normal,Fraco,Sim
5,Chuvoso,Frio,Normal,Forte,Nao
6,Nublado,Frio,Normal,Forte,Sim
7,Ensolarado,Moderada,Alta,Fraco,Nao
8,Ensolarado,Frio,Normal,Fraco,Sim
9,Chuvoso,Moderada,Normal,Fraco,Sim


### Separando atributos previsores e as classes

qtdeAtributosPrevisores = 4 #guarda a quantidade de atributos previsores 
previsores = dados.iloc[:,0:qtdeAtributosPrevisores].values
previsores

In [3]:
classes = dados.iloc[:, qtdeAtributosPrevisores].values
classes

array(['Nao', 'Nao', 'Sim', 'Sim', 'Sim', 'Nao', 'Sim', 'Nao', 'Sim',
       'Sim', 'Sim', 'Sim', 'Sim', 'Sim'], dtype=object)

### Processando os dados

In [4]:
from sklearn.preprocessing import LabelEncoder
encoder = LabelEncoder()

In [5]:
previsores[:, 0] = encoder.fit_transform(previsores[:, 0])
previsores[:, 1] = encoder.fit_transform(previsores[:, 1])
previsores[:, 2] = encoder.fit_transform(previsores[:, 2])
previsores[:, 3] = encoder.fit_transform(previsores[:, 3])
previsores

array([[1, 2, 0, 1],
       [1, 2, 0, 0],
       [2, 2, 0, 1],
       [0, 1, 0, 1],
       [0, 0, 1, 1],
       [0, 0, 1, 0],
       [2, 0, 1, 0],
       [1, 1, 0, 1],
       [1, 0, 1, 1],
       [0, 1, 1, 1],
       [1, 1, 1, 0],
       [2, 1, 0, 0],
       [2, 2, 1, 1],
       [0, 1, 0, 0]], dtype=object)

### Criando o classificado com Árvore de Decisão

In [6]:
from sklearn.tree import DecisionTreeClassifier, export
classificador = DecisionTreeClassifier(criterion='entropy')

In [7]:
#rodar o algoritmo de arvore de decisão
classificador.fit(previsores, classes)

DecisionTreeClassifier(class_weight=None, criterion='entropy', max_depth=None,
            max_features=None, max_leaf_nodes=None,
            min_impurity_decrease=0.0, min_impurity_split=None,
            min_samples_leaf=1, min_samples_split=2,
            min_weight_fraction_leaf=0.0, presort=False, random_state=None,
            splitter='best')

### Exportar a arvore de decisão para visualização

In [10]:
export.export_graphviz(classificador,
                      out_file = 'arvore-jorgar-tenis.dot',
                      feature_names = ['tempo', 'temperatura', 'umidade', 'vento'],
                      class_names = ['Nao', 'Sim'],
                       filled = True,
                       leaves_parallel = True
                      )
#out_file é o nome do arquivo
#feature_names são os atributos previsores e tem que ser na ordem que aparecem nos dados
#class_names valore das classes em ordem alfabetica
#deixar os outros parametros como estão, são apenas para formatação visual da árvore

#site para visualizar a árvore www.webgraphviz.com

### Fazendo previsões com o classificador treinado

In [11]:
resultado = classificador.predict([ [0, 1, 0, 1], [1, 2, 0, 1] ])
resultado

array(['Sim', 'Nao'], dtype=object)