<a href="https://colab.research.google.com/github/jamillan94/flakapp/blob/main/Implementaci%C3%B3n_pr%C3%A1ctica_de_una_red_neuronal_MLP_con_dataset_Digits_en_Google_Colab.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 🌸 Actividad práctica: KNN con el dataset Iris (Scikit-Learn)

**Autor:** Jorge Armando Millán Gómez  
**Cargo actual:** Arquitecto de Software – BBVA Colombia  
**Formación:** MBA & Analítica de Datos | MSc. en Ciencias de la Información | Especialista en Ingeniería de Software  

---

### 🎯 Objetivo
Cargar el conjunto **Iris**, crear un modelo **KNN (k=3)**, entrenarlo con **todos los datos** y **predecir** la clase de una nueva flor. Además, evaluar el desempeño con **accuracy** (en el mismo conjunto, por simplicidad).

---

### 📋 Instrucciones
1) Ejecuta las celdas en orden.  
2) Verifica la clase predicha para la nueva flor dada.  
3) Observa la **precisión (accuracy)** reportada.  
4) Toma captura del código y los resultados impresos y súbela a **Moodle**, junto con el enlace del notebook.

---


In [2]:
# -*- coding: utf-8 -*-
# -------------------------------------------------------------
# KNN (k=3) sobre el dataset Iris con evaluación y predicción
# -------------------------------------------------------------

# 1) IMPORTACIONES
from sklearn.datasets import load_iris            # Carga el dataset Iris incluido en scikit-learn
from sklearn.neighbors import KNeighborsClassifier # Importa el clasificador KNN
from sklearn.metrics import accuracy_score         # Métrica de evaluación: accuracy (precisión)

# 2) CARGA DEL DATASET
datos = load_iris()   # Carga el dataset (retorna un objeto tipo 'Bunch' con data, target, target_names, etc.)
X = datos.data        # Matriz de características (4 por muestra: sépalo largo/ancho, pétalo largo/ancho)
y = datos.target      # Vector de etiquetas (0, 1, 2) que corresponden a las clases en target_names

# 3) CREACIÓN DEL MODELO KNN
modelo = KNeighborsClassifier(n_neighbors=3)  # Instancia el modelo KNN con k=3 vecinos

# 4) ENTRENAMIENTO CON TODOS LOS DATOS (sin división para simplificar)
modelo.fit(X, y)      # Ajusta el modelo aprendiendo a clasificar según los vecinos más cercanos

# 5) PREDICCIÓN PARA UNA NUEVA FLOR (valores dados en el enunciado)
#    Orden de las características: [longitud_sépalo, ancho_sépalo, longitud_pétalo, ancho_pétalo]
nueva_flor = [[6.0, 2.9, 4.5, 1.5]]      # Nueva muestra a clasificar
prediccion = modelo.predict(nueva_flor)  # Devuelve el índice de la clase predicha (ej. array([1]))
clase_predicha = datos.target_names[prediccion][0]  # Mapea el índice a su nombre (ej. 'versicolor')

# 6) EVALUACIÓN (accuracy) EN EL MISMO CONJUNTO (nota: sobreestima desempeño)
y_pred_entrenamiento = modelo.predict(X)        # Predicciones sobre los mismos datos de entrenamiento
accuracy = accuracy_score(y, y_pred_entrenamiento)  # Cálculo de la precisión (proporción de aciertos)

# 7) IMPRESIÓN DE RESULTADOS
print("Clase predicha para la nueva flor:", clase_predicha)
print("Precisión (accuracy) en el mismo conjunto:", round(accuracy, 4))


Clase predicha para la nueva flor: versicolor
Precisión (accuracy) en el mismo conjunto: 0.96


## ✅ Resultados y respuestas

**Clase predicha para la nueva flor** \([6.0, 2.9, 4.5, 1.5]\):  
> *(Se imprimirá arriba; típicamente será **"versicolor"** con k=3)*

**Precisión (accuracy) reportada** (en el mismo conjunto):  
> *(Se imprimirá arriba; al evaluar sobre entrenamiento, suele ser alta y **sobreestima** el rendimiento real)*

---

### 📝 Nota rápida
- Evaluar en el mismo conjunto facilita la práctica, pero **no refleja** el desempeño real en datos nuevos.  
- Para una evaluación más realista, usar `train_test_split` y medir accuracy en el **conjunto de prueba**.

---


## 🧩 Conclusión

Este ejercicio mostró el flujo básico de un clasificador **KNN** con *Scikit-Learn*: cargar datos, crear el modelo (k=3), entrenar y predecir la clase de una nueva flor.  
El modelo predijo correctamente una clase plausible (p. ej., **versicolor**) y reportó una **accuracy alta** al evaluarse sobre el mismo conjunto de entrenamiento.

Al igual que en ejercicios previos, esta configuración **tiende a sobreestimar el rendimiento real** por no separar datos de entrenamiento y prueba.  
Este experimento sirve como punto de partida para futuras mejoras que incluyan:
- División de datos (`train_test_split`)  
- Búsqueda del mejor **k** mediante validación cruzada  
- Normalización de características para mejorar el desempeño de KNN  
- Matriz de confusión y métricas por clase (precision, recall, F1-score)

---

**Autor:** *Jorge Armando Millán Gómez*  
**LinkedIn:** [www.linkedin.com/in/jorge-millan](https://www.linkedin.com/in/jorge-millan)  
**Correo:** jamillan94@gmail.com
