# Uma Árvore de Decisão é um modelo de aprendizado de máquina que usa uma estrutura de árvore para tomar decisões. Cada "nó" na árvore representa uma pergunta ou teste sobre um atributo dos dados, e cada ramo que sai do nó representa uma das possíveis respostas a essa pergunta. Isso continua até que se chegue a um nó folha, que contém a previsão ou decisão final.

## Vantagens
* Fácil de entender e interpretar: Árvores de decisão podem ser visualizadas, o que facilita a compreensão do processo de tomada de decisão.
* Não requer grande preparação de dados: Não é necessário normalizar os dados.
* Lida bem com dados não lineares: Pode capturar padrões complexos nos dados.
* Robusta a valores ausentes: Pode lidar com dados incompletos ou faltantes.

# Desvantagens
* Tendência ao sobreajuste (overfitting): Árvores de decisão tendem a se ajustar demais aos dados de treinamento, o que pode reduzir a precisão nas previsões de novos dados.
* Instabilidade: Pequenas variações nos dados podem resultar em árvores muito diferentes.
* Ineficaz para previsões contínuas: Não é a melhor escolha para tarefas que exigem previsões de resultados contínuos (regressão).

### Exemplo de código

#### Importação de bibliotecas e dados:

In [6]:
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix, classification_report

# Carregando o dataset
iris = load_iris()
X = iris.data
y = iris.target
print(X[0:10], y[0:10])

[[5.1 3.5 1.4 0.2]
 [4.9 3.  1.4 0.2]
 [4.7 3.2 1.3 0.2]
 [4.6 3.1 1.5 0.2]
 [5.  3.6 1.4 0.2]
 [5.4 3.9 1.7 0.4]
 [4.6 3.4 1.4 0.3]
 [5.  3.4 1.5 0.2]
 [4.4 2.9 1.4 0.2]
 [4.9 3.1 1.5 0.1]] [0 0 0 0 0 0 0 0 0 0]


#### Divisão do dataset em treino e teste:

In [2]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

In [3]:
clf = DecisionTreeClassifier(random_state=42)
clf.fit(X_train, y_train)

#### Previsões e Avaliação:

In [4]:
y_pred = clf.predict(X_test)

# Matriz de Confusão
print(confusion_matrix(y_test, y_pred))

# Relatório de classificação
print(classification_report(y_test, y_pred))

[[19  0  0]
 [ 0 13  0]
 [ 0  0 13]]
              precision    recall  f1-score   support

           0       1.00      1.00      1.00        19
           1       1.00      1.00      1.00        13
           2       1.00      1.00      1.00        13

    accuracy                           1.00        45
   macro avg       1.00      1.00      1.00        45
weighted avg       1.00      1.00      1.00        45

