# Árvores de decisão

Modelos com capacidade de interpretabilidade e muito intuitivo. Sendo conhecidas como um conjunto de regras "Se-então" utilizadas para regressão e classificação. São construidas a partir de um conjunto de dados. O precesso de criação de uma arvore de decisão passa por essas regras de decisão.

Exempo de árvore é a árvore binária de busca.

Por natureza, a arvore de decissão tem uma alta índice de overfitting, já que ela tenta sempre carregar todo o conjunto de dados e separa-lo perfeitamente. Uma vez que isso ocorre em base de dados com outlears a divisão dos dados os tratariam como dados válidos. O overfitting se evidencia quando a arvore de decisao consegue separar os dados perfeitamente. Se elas se especializarem em separar um conjunto de dados ela não consegue generalizar para outros demais conjunto de dados.

![image.png](attachment:image.png)

Para obter a árvore a partir dos dados é utilizado um indice de impureza do resultado de uma divisão, sendo utilizado o gini, entropia, etc.
![image.png](attachment:image-6.png)

É dado por um menos o somatório da divisão dos dados ao quadrado para cada classe.

Se escolhermos um brilho maior que 0,7 teremos duas possibilidades abaixo.
 a possibilidade de ser menor do que 0,7 e a de ser maior que 0,7.

![image.png](attachment:image-2.png)
![image.png](attachment:image-3.png)

Usando outro método de divisão, escolhendo T>25

![image.png](attachment:image-4.png)
![image.png](attachment:image-5.png)

Essa escolha é mais apropriada, uma vez que quanto menor a impureza melhor a escolha.



## Implementando árvores de decisão
Pra isso será implementado tanto métodos de regressão quanto de classificação.

In [1]:
#Importando biblioteca de arvore de regressão e classificação 
from sklearn.tree import DecisionTreeClassifier, DecisionTreeRegressor

### Base de dados
Será utlizado duas base de dados uma para regressão e outra para classificação.

In [1]:
#Importando a base de dados
from sklearn.datasets import load_boston,load_iris

In [2]:
from sklearn.model_selection import train_test_split

In [4]:
#Carregar os dados da base Iris
X_iris, y_iris = load_iris(return_X_y=True)

array([[5.1, 3.5, 1.4, 0.2],
       [4.9, 3. , 1.4, 0.2],
       [4.7, 3.2, 1.3, 0.2],
       [4.6, 3.1, 1.5, 0.2],
       [5. , 3.6, 1.4, 0.2],
       [5.4, 3.9, 1.7, 0.4],
       [4.6, 3.4, 1.4, 0.3],
       [5. , 3.4, 1.5, 0.2],
       [4.4, 2.9, 1.4, 0.2],
       [4.9, 3.1, 1.5, 0.1],
       [5.4, 3.7, 1.5, 0.2],
       [4.8, 3.4, 1.6, 0.2],
       [4.8, 3. , 1.4, 0.1],
       [4.3, 3. , 1.1, 0.1],
       [5.8, 4. , 1.2, 0.2],
       [5.7, 4.4, 1.5, 0.4],
       [5.4, 3.9, 1.3, 0.4],
       [5.1, 3.5, 1.4, 0.3],
       [5.7, 3.8, 1.7, 0.3],
       [5.1, 3.8, 1.5, 0.3],
       [5.4, 3.4, 1.7, 0.2],
       [5.1, 3.7, 1.5, 0.4],
       [4.6, 3.6, 1. , 0.2],
       [5.1, 3.3, 1.7, 0.5],
       [4.8, 3.4, 1.9, 0.2],
       [5. , 3. , 1.6, 0.2],
       [5. , 3.4, 1.6, 0.4],
       [5.2, 3.5, 1.5, 0.2],
       [5.2, 3.4, 1.4, 0.2],
       [4.7, 3.2, 1.6, 0.2],
       [4.8, 3.1, 1.6, 0.2],
       [5.4, 3.4, 1.5, 0.4],
       [5.2, 4.1, 1.5, 0.1],
       [5.5, 4.2, 1.4, 0.2],
       [4.9, 3

In [11]:
X_boston, y_boston = load_boston(return_X_y=True)

In [6]:
X_treino, X_teste, y_treino, y_teste = train_test_split(X_boston, y_boston)

### Modelo para classificação

In [4]:
#Árvore de decissão na classificação
dt = DecisionTreeClassifier()

In [7]:
dt.fit(X_treino,y_treino)

In [8]:
dt.score(X_teste,y_teste)

0.9210526315789473

### Modelo para regressão

In [12]:
dtr = DecisionTreeRegressor()

In [13]:
X_treino, X_teste, y_treino, y_teste = train_test_split(X_boston,y_boston)

In [14]:
dtr.fit(X_treino,y_treino)

In [15]:
dtr.score(X_teste,y_teste)

0.6527127638405001

### Podando a árvore
A quantidade de altura menor da arvore é possivél generalizar melhor o algoritmo. Já que não se faz necessário se especializar em um conjunto de dados mas sim que possamos pegar a ideia do que esse conjuto de dados significa.

Será criado uma arvore com um limitador de regras que serão feiras, diminuindo assim a quantidade de nós puros.

In [22]:
#Criando o objeto arvore agora com profundidade máxima
dt = DecisionTreeClassifier(max_depth = 5)

In [23]:
X_iris,y_iris = load_iris(return_X_y= True)

In [27]:
X_treino, X_teste, y_treino, y_teste = train_test_split(X_iris,y_iris )

In [28]:
dt.fit(X_treino,y_treino)

In [29]:
dt.score(X_teste,y_teste)

0.9473684210526315

## Selecionando features com árvores de decisão

Como selecionar um conjunto de atributos para a classificação de alguns elementos de tarefas. Será usado um conjunto de dados de câncer de mama, já que é uma base de dados com mais atributos.

In [31]:
from sklearn.tree import DecisionTreeClassifier
from sklearn.datasets import load_breast_cancer

In [32]:
#Implementa a arvore de decisão (instancia o objeto)
dt = DecisionTreeClassifier()

In [33]:
X, y = load_breast_cancer(return_X_y=True)

In [35]:
dt.fit(X,y)

In [36]:
X.shape

(569, 30)

In [38]:
#Importância dos atributos em relação ao modelo
dt.feature_importances_

array([0.        , 0.04248468, 0.        , 0.        , 0.01265547,
       0.        , 0.00877112, 0.03184137, 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.00204521, 0.00100384,
       0.        , 0.        , 0.        , 0.007316  , 0.00644409,
       0.69559352, 0.0460766 , 0.        , 0.0110859 , 0.00738798,
       0.        , 0.00747439, 0.11398847, 0.00583135, 0.        ])