# 🌸 Clasificación con K-NN en el dataset Iris

Este notebook muestra cómo entrenar y evaluar un modelo de clasificación utilizando el algoritmo **K-Nearest Neighbors (K-NN)** con el dataset clásico **Iris**.

Exploraremos paso a paso:

1. Carga y preparación del dataset.
2. Entrenamiento del modelo K-NN.
3. Evaluación del desempeño con métricas de clasificación.


In [None]:
# Importar librerías
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns


## 📥 Cargar y preparar los datos

Usaremos el dataset `Iris`, que contiene 150 registros con cuatro características por flor y una etiqueta de clase.


In [None]:
# Cargar el dataset
iris = load_iris()
X = iris.data
y = iris.target

# División en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Escalar características
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)


## 🤖 Entrenar el modelo K-NN

Entrenamos un clasificador K-NN con `k=5` vecinos.


In [None]:
knn = KNeighborsClassifier(n_neighbors=5)
knn.fit(X_train, y_train)


## 📊 Evaluar el modelo

Evaluaremos el desempeño con precisión, matriz de confusión y reporte de clasificación.


In [None]:
# Predicción
y_pred = knn.predict(X_test)

# Evaluación
print("✔ Precisión del modelo:", accuracy_score(y_test, y_pred))

print("\n📌 Matriz de confusión:")
print(confusion_matrix(y_test, y_pred))

print("\n📋 Reporte de clasificación:")
print(classification_report(y_test, y_pred, target_names=iris.target_names))


In [None]:
# Visualizar la matriz de confusión con Seaborn
conf_matrix = confusion_matrix(y_test, y_pred)
plt.figure(figsize=(6, 4))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap="Blues", xticklabels=iris.target_names, yticklabels=iris.target_names)
plt.xlabel("Clase predicha")
plt.ylabel("Clase verdadera")
plt.title("Matriz de Confusión - Iris con K-NN (k=5)")
plt.show()


✅ **Conclusión**:  
Este modelo logra una alta precisión, y la matriz de confusión muestra que la mayoría de las predicciones están correctamente clasificadas, especialmente en la clase *setosa*, con un leve cruce entre *versicolor* y *virginica*.

Este análisis permite comprender mejor **dónde acierta y en qué se equivoca el modelo**, una habilidad fundamental al trabajar con clasificación.
