# üìò Ejemplo conceptual de K-NN: Elecci√≥n del valor de K
Este notebook demuestra c√≥mo afecta la elecci√≥n del par√°metro **K** en el algoritmo **K-Nearest Neighbors**, utilizando un ejemplo simple: predecir si un estudiante aprobar√° un examen seg√∫n las horas de estudio.

Exploraremos dos casos:
- **K = 1** (sobreajuste)
- **K = 6** (subajuste)

In [None]:
# Importamos librer√≠as necesarias
import matplotlib.pyplot as plt
import numpy as np

## Datos del problema
- Cada punto representa un estudiante y si aprob√≥ el examen (1 = S√≠, 0 = No)
- Queremos predecir el resultado de un nuevo estudiante que estudi√≥ 4.5 horas

In [None]:
# Datos de entrenamiento
horas_estudio = np.array([1, 2, 3, 4, 5, 6, 7])
aprobado = np.array([0, 0, 1, 1, 1, 1, 0])  # 0 = No, 1 = S√≠
nuevo_estudiante = 4.5

## Funci√≥n para simular K-NN
Esta funci√≥n selecciona los K vecinos m√°s cercanos y predice seg√∫n la mayor√≠a.

In [None]:
def prediccion_knn(k):
    distancias = np.abs(horas_estudio - nuevo_estudiante)
    vecinos_idx = np.argsort(distancias)[:k]
    vecinos_clases = aprobado[vecinos_idx]
    prediccion = np.round(np.mean(vecinos_clases))  # mayor√≠a simple
    return vecinos_idx, vecinos_clases, prediccion

## Visualizaci√≥n del resultado
Se muestran los puntos conocidos y la predicci√≥n para el nuevo estudiante, con K=1 y K=6.

## üîç Analicemos el impacto del valor de K con un ejemplo

**Problema:** Queremos predecir si un estudiante aprobar√° un examen, en base a las horas de estudio.

Supongamos que tenemos una peque√±a base de datos con estas observaciones:

| Horas de estudio | Aprob√≥ examen |
|------------------|----------------|
| 1                | ‚ùå No          |
| 2                | ‚ùå No          |
| 3                | ‚úÖ S√≠          |
| 4                | ‚úÖ S√≠          |
| 5                | ‚úÖ S√≠          |
| 6                | ‚úÖ S√≠          |
| 7                | ‚ùå No          |

Ahora vamos a predecir el resultado para un estudiante que estudi√≥ **4.5 horas**.

---

### üìå Caso 1: K = 1 ‚Üí Sobreajuste

Con **K = 1**, el modelo considera solo al vecino m√°s cercano.

En este caso, el punto m√°s cercano es **5 horas**, cuyo resultado fue ‚Äú‚úÖ S√≠‚Äù.

‚û° El modelo predice **S√≠**, bas√°ndose en un solo vecino.

**Problema:** si ese vecino estuviera mal etiquetado (ruido), la predicci√≥n fallar√≠a.  
Esto es **sobreajuste**: el modelo se ajusta demasiado a detalles espec√≠ficos y pierde generalidad.

---

### üìå Caso 2: K = 6 ‚Üí Subajuste

Ahora probamos con **K = 6** (consideramos los 6 vecinos m√°s cercanos).

Resultados:

- 4 vecinos son ‚Äú‚úÖ S√≠‚Äù
- 2 vecinos son ‚Äú‚ùå No‚Äù

‚û° El modelo predice ‚Äú‚úÖ S√≠‚Äù‚Ä¶ pero est√° muy cerca del empate.

¬øY si fueran 3 y 3? El modelo podr√≠a confundirse.  
¬øY si K fuera a√∫n mayor? Considerar√≠a incluso valores alejados (como el de 1 hora), diluyendo patrones reales.

Esto es **subajuste**: el modelo generaliza tanto que pierde precisi√≥n en los l√≠mites entre clases.

---

### ‚úÖ ¬øCu√°l es el mejor valor de K?

Una pr√°ctica recomendada es **graficar el error de validaci√≥n** para diferentes valores de K y elegir el que **minimiza la tasa de error** sin caer en sobreajuste o subajuste.

üìà *Imagen sugerida*:  
Gr√°fico con el eje X como el valor de K (1, 2, 3‚Ä¶ 15)  
Eje Y como el error de validaci√≥n.  
üîµ Punto m√≠nimo indica el valor √≥ptimo de K.


### üìå Caso 1: K = 1 ‚Üí Sobreajuste

Con **K = 1**, el modelo considera solo al vecino m√°s cercano.

En este ejemplo, el nuevo estudiante que estudi√≥ **4.5 horas** es clasificado seg√∫n el estudiante m√°s cercano: el que estudi√≥ **5 horas** y **s√≠ aprob√≥**.

‚úÖ **Resultado:** El modelo predice ‚Äú‚úî S√≠‚Äù.

üî¥ **Peligro:** Si ese √∫nico vecino estuviera mal etiquetado, toda la predicci√≥n ser√≠a incorrecta.

üß† Esto es un caso t√≠pico de **sobreajuste (overfitting)**: el modelo se adapta demasiado a casos espec√≠ficos y puede perder capacidad de generalizaci√≥n.


In [None]:
# Visualizaci√≥n para K=1
fig, ax = plt.subplots(figsize=(10, 4))

# Dibujar puntos existentes
for i in range(len(horas_estudio)):
    color = 'green' if aprobado[i] == 1 else 'red'
    ax.scatter(horas_estudio[i], 0, color=color, s=100)
    ax.text(horas_estudio[i], 0.05, f"{horas_estudio[i]}h", ha='center')

# Punto a predecir
ax.scatter(nuevo_estudiante, 0.05, color='blue', marker='*', s=200, label="Nuevo estudiante (4.5h)")

# Conexi√≥n con vecinos para K=1
vecinos_k1, _, pred_k1 = prediccion_knn(1)
for idx in vecinos_k1:
    ax.plot([nuevo_estudiante, horas_estudio[idx]], [0.05, 0], linestyle='--', alpha=0.6)

resultado_k1 = '‚úî S√≠' if pred_k1 == 1 else '‚úò No'
ax.text(8, -0.1, f"Predicci√≥n con K=1: {resultado_k1}", fontsize=10)

ax.set_title("K-NN con K = 1")
ax.set_xlabel("Horas de estudio")
ax.get_yaxis().set_visible(False)
ax.legend()
plt.grid(True)
plt.tight_layout()
plt.show()


### üìå Caso 2: K = 6 ‚Üí Subajuste

Ahora el modelo considera los **6 vecinos m√°s cercanos** al nuevo estudiante de 4.5 horas.

üìä De esos 6:
- 4 vecinos aprobaron (verde)
- 2 no aprobaron (rojo)

‚úÖ **Resultado:** El modelo tambi√©n predice ‚Äú‚úî S√≠‚Äù, pero ya no est√° tan seguro.  
Si el valor de **K fuera mayor**, podr√≠an entrar vecinos cada vez m√°s alejados y con clases mezcladas.

üß† Esto representa un caso de **subajuste (underfitting)**: el modelo es tan general que pierde precisi√≥n en zonas con l√≠mites m√°s sutiles entre clases.


In [None]:
# Visualizaci√≥n para K=6
fig, ax = plt.subplots(figsize=(10, 4))

# Dibujar puntos existentes
for i in range(len(horas_estudio)):
    color = 'green' if aprobado[i] == 1 else 'red'
    ax.scatter(horas_estudio[i], 0, color=color, s=100)
    ax.text(horas_estudio[i], 0.05, f"{horas_estudio[i]}h", ha='center')

# Punto a predecir
ax.scatter(nuevo_estudiante, 0.05, color='blue', marker='*', s=200, label="Nuevo estudiante (4.5h)")

# Conexi√≥n con vecinos para K=6
vecinos_k6, _, pred_k6 = prediccion_knn(6)
for idx in vecinos_k6:
    ax.plot([nuevo_estudiante, horas_estudio[idx]], [0.05, 0], linestyle='--', alpha=0.6)

resultado_k6 = '‚úî S√≠' if pred_k6 == 1 else '‚úò No'
ax.text(8, -0.1, f"Predicci√≥n con K=6: {resultado_k6}", fontsize=10)

ax.set_title("K-NN con K = 6")
ax.set_xlabel("Horas de estudio")
ax.get_yaxis().set_visible(False)
ax.legend()
plt.grid(True)
plt.tight_layout()
plt.show()


### üéØ ¬øCu√°ntos vecinos necesitas para tomar una buena decisi√≥n?

Esta visualizaci√≥n muestra c√≥mo el algoritmo **K-Nearest Neighbors (K-NN)** analiza un nuevo dato ‚Äîel estudiante azul que estudi√≥ 4.5 horas‚Äî compar√°ndolo con su entorno m√°s cercano.

Cada c√≠rculo representa un caso real:
- üî¥ En rojo, estudiantes que **no aprobaron**
- üü¢ En verde, estudiantes que **s√≠ aprobaron**
- üîµ El punto azul representa al **nuevo estudiante** cuya clasificaci√≥n queremos predecir.

Al variar el valor de **K**, el modelo puede:
- Centrarse demasiado en un solo vecino ‚Üí **Sobreajuste (overfitting)**
- Considerar demasiados vecinos ‚Üí **Subajuste (underfitting)**

En esta imagen se visualiza el caso de **K = 6**, donde se conectan los seis vecinos m√°s cercanos al nuevo estudiante. Esto puede diluir diferencias relevantes entre clases, afectando la precisi√≥n del modelo.

‚úÖ **Conclusi√≥n:** Elegir el valor de K adecuado es clave para lograr un modelo balanceado, que generalice bien y no sea ni demasiado r√≠gido ni demasiado flexible.
