# 🌼 Classificador de Espécies de Flores com o Dataset Iris

Este notebook mostra passo a passo como construir um modelo de aprendizado supervisionado usando o dataset Iris, com foco em duas abordagens: Árvore de Decisão e K-Nearest Neighbors (KNN).

📅 Projeto gerado em: 05/07/2025


In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, cross_val_score
from sklearn.tree import DecisionTreeClassifier
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, confusion_matrix, ConfusionMatrixDisplay


## 1. Carregamento e exploração dos dados

In [None]:
iris = load_iris()
df = pd.DataFrame(data=iris.data, columns=iris.feature_names)
df['target'] = iris.target
df['species'] = pd.Categorical.from_codes(iris.target, iris.target_names)
df.head()

## 2. Separação entre atributos (features) e rótulos (target)

In [None]:
X = df[iris.feature_names]
y = df['target']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

print("Tamanho treino:", X_train.shape)
print("Tamanho teste:", X_test.shape)

## 3. Treinamento de modelos de Machine Learning

In [None]:
# Modelo 1: Árvore de Decisão
dt_model = DecisionTreeClassifier(random_state=42)
dt_model.fit(X_train, y_train)

# Modelo 2: K-Nearest Neighbors
knn_model = KNeighborsClassifier(n_neighbors=3)
knn_model.fit(X_train, y_train)

## 4. Avaliação dos modelos

In [None]:
# Previsões
dt_preds = dt_model.predict(X_test)
knn_preds = knn_model.predict(X_test)

# Acurácias
print("Acurácia - Árvore de Decisão:", accuracy_score(y_test, dt_preds))
print("Acurácia - KNN:", accuracy_score(y_test, knn_preds))

# Validação cruzada
dt_cv = cross_val_score(dt_model, X, y, cv=5).mean()
knn_cv = cross_val_score(knn_model, X, y, cv=5).mean()

print("Validação cruzada - Árvore de Decisão:", dt_cv)
print("Validação cruzada - KNN:", knn_cv)

## 5. Matriz de Confusão - KNN

In [None]:
cm = confusion_matrix(y_test, knn_preds)
disp = ConfusionMatrixDisplay(confusion_matrix=cm, display_labels=iris.target_names)
disp.plot()
plt.title("Matriz de Confusão - KNN")
plt.show()

## 6. Testando com nova amostra

In [None]:
# [comprimento_sépala, largura_sépala, comprimento_pétala, largura_pétala]
nova_flor = np.array([[5.1, 3.5, 1.4, 0.2]])
print("Previsão - Árvore de Decisão:", iris.target_names[dt_model.predict(nova_flor)[0]])
print("Previsão - KNN:", iris.target_names[knn_model.predict(nova_flor)[0]])

## 7. Reflexão

Este exercício mostrou como usar aprendizado supervisionado para classificação com dados reais. Os dois modelos utilizados demonstraram excelente desempenho, com acurácias acima de 95%.

Esse tipo de técnica é amplamente usada em sistemas modernos de IA, como:
- Reconhecimento de imagem
- Diagnóstico médico automatizado
- Assistentes virtuais
- Filtros de spam

Você pode treinar esse classificador com outros dados e adaptar para novos domínios facilmente.
