# üå∏ Clasificaci√≥n con K-NN en el dataset Iris

Este notebook muestra c√≥mo entrenar y evaluar un modelo de clasificaci√≥n utilizando el algoritmo **K-Nearest Neighbors (K-NN)** con el dataset cl√°sico **Iris**.

Exploraremos paso a paso:

1. Carga y preparaci√≥n del dataset.
2. Entrenamiento del modelo K-NN.
3. Evaluaci√≥n del desempe√±o con m√©tricas de clasificaci√≥n.


In [None]:
# Importar librer√≠as
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns


## üì• Cargar y preparar los datos

Usaremos el dataset `Iris`, que contiene 150 registros con cuatro caracter√≠sticas por flor y una etiqueta de clase.


In [None]:
# Cargar el dataset
iris = load_iris()
X = iris.data
y = iris.target

# Divisi√≥n en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Escalar caracter√≠sticas
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)


## ü§ñ Entrenar el modelo K-NN

Entrenamos un clasificador K-NN con `k=5` vecinos.


In [None]:
knn = KNeighborsClassifier(n_neighbors=5)
knn.fit(X_train, y_train)


## üìä Evaluar el modelo

Evaluaremos el desempe√±o con precisi√≥n, matriz de confusi√≥n y reporte de clasificaci√≥n.


In [None]:
# Predicci√≥n
y_pred = knn.predict(X_test)

# Evaluaci√≥n
print("‚úî Precisi√≥n del modelo:", accuracy_score(y_test, y_pred))

print("\nüìå Matriz de confusi√≥n:")
print(confusion_matrix(y_test, y_pred))

print("\nüìã Reporte de clasificaci√≥n:")
print(classification_report(y_test, y_pred, target_names=iris.target_names))


In [None]:
# Visualizar la matriz de confusi√≥n con Seaborn
conf_matrix = confusion_matrix(y_test, y_pred)
plt.figure(figsize=(6, 4))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap="Blues", xticklabels=iris.target_names, yticklabels=iris.target_names)
plt.xlabel("Clase predicha")
plt.ylabel("Clase verdadera")
plt.title("Matriz de Confusi√≥n - Iris con K-NN (k=5)")
plt.show()


‚úÖ **Conclusi√≥n**:  
Este modelo logra una alta precisi√≥n, y la matriz de confusi√≥n muestra que la mayor√≠a de las predicciones est√°n correctamente clasificadas, especialmente en la clase *setosa*, con un leve cruce entre *versicolor* y *virginica*.

Este an√°lisis permite comprender mejor **d√≥nde acierta y en qu√© se equivoca el modelo**, una habilidad fundamental al trabajar con clasificaci√≥n.
