# 📊 EJERCICIOS PRÁCTICOS: Métricas de Evaluación en Machine Learning
## Curso: Machine Learning con Python (IFCD093PO)

---

## 🎯 Objetivo

En este notebook practicarás los conceptos aprendidos sobre **métricas de evaluación** tanto para problemas de **regresión** como de **clasificación**.

### 📝 Instrucciones:

1. **Lee cada ejercicio cuidadosamente**
2. **Implementa el código** en las celdas señaladas con `# TODO:`
3. **Ejecuta la celda** para verificar tus resultados
4. **Compara con la solución** al final del notebook si tienes dudas

### ⚠️ Importante:

- **No hagas "Ctrl+A" para ver todo el código** - ¡aprenderás más escribiendo!
- Si te atascas, consulta el notebook de teoría antes de mirar la solución
- Intenta entender **por qué** cada métrica es útil, no solo cómo calcularla

---

## 📦 Ejercicio 0: Importar Librerías

Necesitaremos estas librerías para todos los ejercicios. Ejecuta la siguiente celda:

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Scikit-learn para datos y modelos
from sklearn.datasets import load_diabetes, load_iris
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression, LogisticRegression

# Métricas para REGRESIÓN
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score

# Métricas para CLASIFICACIÓN
from sklearn.metrics import (
    confusion_matrix,
    accuracy_score,
    precision_score,
    recall_score,
    f1_score,
    classification_report,
    roc_curve,
    roc_auc_score
)

# Configuración visual
sns.set_style('whitegrid')
plt.rcParams['figure.figsize'] = (12, 6)

print("✅ Todas las librerías importadas correctamente")

---

## PARTE 1: MÉTRICAS DE REGRESIÓN

En estos ejercicios trabajaremos con un problema de **regresión** usando el dataset de Diabetes de scikit-learn.

### Ejercicio 1.1: Cargar Datos y Entrenar Modelo de Regresión

**Instrucciones:**
1. Carga el dataset de diabetes usando `load_diabetes(return_X_y=True)`
2. Usa solo la primera característica (índice 0)
3. Divide en train/test con `test_size=0.2` y `random_state=42`
4. Entrena un modelo `LinearRegression()`
5. Realiza predicciones en el conjunto de test

**Pista:** Recuerda usar `X[:, np.newaxis, 0]` para seleccionar la primera característica con la dimensionalidad correcta.

**Salida esperada:** Imprime las primeras 5 predicciones y los valores reales.

In [None]:
# TODO: EJERCICIO 1.1 - Carga de datos y entrenamiento
# 1. Carga el dataset de diabetes
# X, y = load_diabetes(return_X_y=True)

# 2. Selecciona solo la primera característica (reshape para que sea 2D)
# X_single = X[:, np.newaxis, 0]  # Selecciona la primera característica

# 3. Divide en train/test
# X_train, X_test, y_train, y_test = train_test_split(X_single, y, test_size=0.2, random_state=42)

# 4. Entrena el modelo
# modelo_regresion = LinearRegression()
# modelo_regresion.fit(X_train, y_train)

# 5. Realiza predicciones
# y_pred = modelo_regresion.predict(X_test)

# 6. Imprime resultados
# print(f"Primeras 5 predicciones: {y_pred[:5].round(2)}")
# print(f"Primeros 5 valores reales: {y_test[:5].values}")

print("❌ Completa el código anterior")

### Ejercicio 1.2: Calcular MAE, MSE y RMSE

**Instrucciones:**
1. Calcula el **Error Absoluto Medio (MAE)** usando `mean_absolute_error()`
2. Calcula el **Error Cuadrático Medio (MSE)** usando `mean_squared_error()`
3. Calcula el **RMSE** como la raíz cuadrada del MSE (usando `np.sqrt()`)

**Pregunta:** ¿Cuál métrica crees que es más fácil de interpretar para un cliente? ¿Por qué?

**Formato de salida:**
```
MAE: XX.XX
MSE: XXXX.XX
RMSE: XX.XX
```

In [None]:
# TODO: EJERCICIO 1.2 - Calcular métricas de regresión

# Calcula MAE
mae = None  # mean_absolute_error(y_test, y_pred)

# Calcula MSE
mse = None  # mean_squared_error(y_test, y_pred)

# Calcula RMSE
rmse = None  # np.sqrt(mse)

# Imprime los resultados
# print(f"MAE:  {mae:.2f}")
# print(f"MSE:  {mse:.2f}")
# print(f"RMSE: {rmse:.2f}")

print("❌ Completa el código anterior")

### Ejercicio 1.3: Calcular y Interpretar R²

**Instrucciones:**
1. Calcula el **Coeficiente de Determinación (R²)** usando `r2_score()`
2. Interpreta el resultado respondiendo:
   - ¿Qué porcentaje de la variabilidad explica el modelo?
   - ¿Es un buen modelo? ¿Por qué?
   - ¿Qué significaría un R² de 0? ¿Y de 1?

**Salida esperada:**
```
R²: X.XX
El modelo explica el XX% de la variabilidad en la variable objetivo.
```

In [None]:
# TODO: EJERCICIO 1.3 - Calcular R²

# Calcula R²
r2 = None  # r2_score(y_test, y_pred)

# Imprime el resultado
# print(f"R²: {r2:.4f}")
# print(f"El modelo explica el {r2*100:.1f}% de la variabilidad en la variable objetivo.")

# Crea un resumen
# if r2 > 0.7:
#     calidad = "Excelente"
# elif r2 > 0.5:
#     calidad = "Bueno"
# elif r2 > 0.3:
#     calidad = "Aceptable"
# else:
#     calidad = "Pobre"

# print(f"Calidad del modelo: {calidad}")

print("❌ Completa el código anterior")

### Ejercicio 1.4: Comparar Métricas - Análisis Completo

**Instrucciones:**
1. Crea un diccionario con todas las métricas de regresión
2. Crea una tabla (DataFrame) mostrando las métricas
3. Escribe tu interpretación sobre qué tan bueno es el modelo

**Formato esperado:**
```
Métricas de Evaluación - Modelo de Regresión
┌─────────────────────┬──────────┐
│ Métrica             │ Valor    │
├─────────────────────┼──────────┤
│ MAE (Error Medio)   │ XX.XX    │
│ MSE (Error Cuadrát) │ XXXX.XX  │
│ RMSE                │ XX.XX    │
│ R² (Varianza Exp.)  │ X.XX     │
└─────────────────────┴──────────┘
```

In [None]:
# TODO: EJERCICIO 1.4 - Análisis completo de métricas

# Crea un diccionario con todas las métricas
metricas_regresion = {
    # 'MAE': mae,
    # 'MSE': mse,
    # 'RMSE': rmse,
    # 'R²': r2
}

# Crea un DataFrame
# df_metricas = pd.DataFrame(list(metricas_regresion.items()), columns=['Métrica', 'Valor'])

# Imprime la tabla
# print("\n📊 MÉTRICAS DE EVALUACIÓN - MODELO DE REGRESIÓN")
# print(df_metricas.to_string(index=False))

# Escribe tu interpretación
# print("\n📝 INTERPRETACIÓN:")
# print("- El modelo se equivoca en promedio...")
# print("- Los errores grandes son...")
# print("- La capacidad explicativa del modelo es...")

print("❌ Completa el código anterior")

---

## PARTE 2: MÉTRICAS DE CLASIFICACIÓN

En estos ejercicios trabajaremos con un problema de **clasificación** usando el dataset de Iris.

### Ejercicio 2.1: Cargar Datos y Entrenar Modelo de Clasificación

**Instrucciones:**
1. Carga el dataset Iris usando `load_iris()`
2. Extrae características (X) y objetivo (y) del dataset
3. Convierte a problema binario: "Iris Versicolor" (clase 1) vs "Otros" (clase 0)
4. Divide en train/test con `test_size=0.3` y `random_state=42`
5. Entrena un modelo `LogisticRegression(random_state=42)`
6. Realiza predicciones en el conjunto de test

**Pista:** El dataset Iris tiene 3 clases (0=Setosa, 1=Versicolor, 2=Virginica). Para binario: `y_binary = (iris.target == 1).astype(int)`

**Salida esperada:** Imprime estadísticas básicas del dataset binario.

In [None]:
# TODO: EJERCICIO 2.1 - Carga de datos de clasificación

# 1. Carga el dataset Iris
# iris = load_iris()
# X_iris = iris.data
# y_iris = iris.target

# 2. Convierte a problema binario (Versicolor vs Otros)
# y_binary = (y_iris == 1).astype(int)

# 3. Divide en train/test
# X_train_c, X_test_c, y_train_c, y_test_c = train_test_split(
#     X_iris, y_binary, test_size=0.3, random_state=42
# )

# 4. Entrena el modelo
# modelo_clasificacion = LogisticRegression(random_state=42)
# modelo_clasificacion.fit(X_train_c, y_train_c)

# 5. Realiza predicciones
# y_pred_c = modelo_clasificacion.predict(X_test_c)

# 6. Imprime estadísticas
# print(f"Dataset Iris binario:")
# print(f"  - Total de muestras: {len(y_binary)}")
# print(f"  - Muestras positivas (Versicolor): {sum(y_binary)}")
# print(f"  - Muestras negativas (Otros): {len(y_binary) - sum(y_binary)}")
# print(f"  - Proporción: {sum(y_binary)/len(y_binary)*100:.1f}% positivas")

print("❌ Completa el código anterior")

### Ejercicio 2.2: Matriz de Confusión

**Instrucciones:**
1. Calcula la **Matriz de Confusión** usando `confusion_matrix()`
2. Extrae los valores: TP, TN, FP, FN
3. Visualiza la matriz con un heatmap de Seaborn
4. Escribe qué significan los números en tu contexto (Versicolor vs Otros)

**Formato esperado:**
```
Matriz de Confusión:
TN: XX  FP: X
FN: X   TP: XX

Interpretación:
- Casos correctos: XX (negativo) + XX (positivo)
- Casos incorrectos: X (falso positivo) + X (falso negativo)
```

In [None]:
# TODO: EJERCICIO 2.2 - Matriz de Confusión

# 1. Calcula la matriz de confusión
# cm = confusion_matrix(y_test_c, y_pred_c)

# 2. Extrae los valores
# tn, fp, fn, tp = cm.ravel()

# 3. Crea el heatmap
# plt.figure(figsize=(8, 6))
# sns.heatmap(cm, annot=True, fmt='d', cmap='Blues',
#             xticklabels=['No Versicolor', 'Versicolor'],
#             yticklabels=['Real: No', 'Real: Sí'])
# plt.title('Matriz de Confusión - Clasificador Iris')
# plt.ylabel('Etiqueta Real')
# plt.xlabel('Etiqueta Predicha')
# plt.show()

# 4. Imprime los valores
# print(f"\nMatriz de Confusión:")
# print(f"TN (Verdadero Negativo):  {tn}")
# print(f"FP (Falso Positivo):      {fp}")
# print(f"FN (Falso Negativo):      {fn}")
# print(f"TP (Verdadero Positivo):  {tp}")

print("❌ Completa el código anterior")

### Ejercicio 2.3: Calcular Accuracy, Precisión, Recall y F1-Score

**Instrucciones:**
1. Calcula **Accuracy** usando `accuracy_score()`
2. Calcula **Precisión** usando `precision_score()`
3. Calcula **Recall** usando `recall_score()`
4. Calcula **F1-Score** usando `f1_score()`
5. Responde: ¿Qué significa cada métrica? ¿Cuál es la más importante para este problema?

**Importante:** Usa `zero_division=0` para evitar advertencias.

**Formato esperado:**
```
Accuracy:  X.XX (proporción de aciertos totales)
Precisión: X.XX (exactitud de predicciones positivas)
Recall:    X.XX (capacidad de detectar positivos)
F1-Score:  X.XX (media armónica de precisión y recall)
```

In [None]:
# TODO: EJERCICIO 2.3 - Métricas de clasificación

# Calcula Accuracy
acc = None  # accuracy_score(y_test_c, y_pred_c)

# Calcula Precisión
prec = None  # precision_score(y_test_c, y_pred_c, zero_division=0)

# Calcula Recall
rec = None  # recall_score(y_test_c, y_pred_c, zero_division=0)

# Calcula F1-Score
f1 = None  # f1_score(y_test_c, y_pred_c, zero_division=0)

# Imprime los resultados
# print(f"MÉTRICAS DE CLASIFICACIÓN:")
# print(f"  Accuracy:   {acc:.4f} ({acc*100:.1f}%)")
# print(f"  Precisión:  {prec:.4f} ({prec*100:.1f}%)")
# print(f"  Recall:     {rec:.4f} ({rec*100:.1f}%)")
# print(f"  F1-Score:   {f1:.4f}")

print("❌ Completa el código anterior")

### Ejercicio 2.4: Usar `classification_report`

**Instrucciones:**
1. Usa `classification_report()` para obtener un reporte completo
2. Imprime el reporte con nombres descriptivos: `target_names=['No Versicolor', 'Versicolor']`
3. Usa `zero_division=0` para evitar advertencias
4. Compara los valores con los que calculaste manualmente en el ejercicio 2.3

**Salida esperada:** Reporte tabular con Precisión, Recall, F1-Score y Support por clase.

In [None]:
# TODO: EJERCICIO 2.4 - Reporte de Clasificación

# Obtén el reporte completo
# reporte = classification_report(
#     y_test_c, y_pred_c,
#     target_names=['No Versicolor', 'Versicolor'],
#     zero_division=0
# )

# Imprime el reporte
# print("\n📊 REPORTE DE CLASIFICACIÓN:")
# print(reporte)

# Pregunta: ¿Los valores coinciden con el ejercicio 2.3?

print("❌ Completa el código anterior")

### Ejercicio 2.5: Curva ROC y AUC

**Instrucciones:**
1. Obtén las **probabilidades** de predicción usando `predict_proba()`
2. Calcula la **curva ROC** usando `roc_curve()`
3. Calcula el **AUC** usando `roc_auc_score()`
4. Grafica la curva ROC con la línea de azar (diagonal)
5. Interpreta: ¿Qué significa un AUC cercano a 1? ¿Y cercano a 0.5?

**Pista:** Las probabilidades se obtienen de `modelo.predict_proba(X_test)[:, 1]` para la clase positiva.

**Salida esperada:**
```
AUC: X.XX
Curva ROC graficada con interpretación
```

In [None]:
# TODO: EJERCICIO 2.5 - Curva ROC y AUC

# 1. Obtén las probabilidades de la clase positiva
# y_pred_proba = modelo_clasificacion.predict_proba(X_test_c)[:, 1]

# 2. Calcula la curva ROC
# fpr, tpr, thresholds = roc_curve(y_test_c, y_pred_proba)

# 3. Calcula el AUC
# auc = roc_auc_score(y_test_c, y_pred_proba)

# 4. Grafica
# plt.figure(figsize=(8, 6))
# plt.plot(fpr, tpr, color='darkorange', lw=2, label=f'Curva ROC (AUC = {auc:.2f})')
# plt.plot([0, 1], [0, 1], color='navy', lw=2, linestyle='--', label='Azar (AUC = 0.50)')
# plt.xlim([0.0, 1.0])
# plt.ylim([0.0, 1.05])
# plt.xlabel('Tasa de Falsos Positivos (FPR)')
# plt.ylabel('Tasa de Verdaderos Positivos (TPR)')
# plt.title('Curva ROC')
# plt.legend(loc="lower right")
# plt.grid(alpha=0.3)
# plt.show()

# 5. Interpreta
# print(f"\nAUC: {auc:.2f}")
# if auc > 0.9:
#     print("✅ Excelente clasificador (AUC > 0.9)")
# elif auc > 0.8:
#     print("✅ Muy buen clasificador (AUC > 0.8)")
# elif auc > 0.7:
#     print("✅ Buen clasificador (AUC > 0.7)")
# elif auc > 0.6:
#     print("⚠️ Clasificador aceptable (AUC > 0.6)")
# else:
#     print("❌ Clasificador pobre (AUC ≤ 0.6)")

print("❌ Completa el código anterior")

---

## PARTE 3: ANÁLISIS Y COMPARACIÓN

En estos ejercicios analizaremos cuándo usar cada métrica y cómo elegir la correcta para cada problema.

### Ejercicio 3.1: Crear Tabla Comparativa de Métricas

**Instrucciones:**
1. Crea un DataFrame con todas las métricas de regresión de la Parte 1
2. Crea un DataFrame con todas las métricas de clasificación de la Parte 2
3. Compara: ¿Por qué no podemos usar métricas de regresión para clasificación y viceversa?

**Formato esperado:**
```
REGRESIÓN:              CLASIFICACIÓN:
Métrica      Valor      Métrica      Valor
MAE          XX.XX      Accuracy     X.XX
MSE          XXXX.XX    Precisión    X.XX
RMSE         XX.XX      Recall       X.XX
R²           X.XX       F1-Score     X.XX
                        AUC          X.XX
```

In [None]:
# TODO: EJERCICIO 3.1 - Tabla comparativa

# Crea tabla de REGRESIÓN
# df_reg = pd.DataFrame({
#     'Métrica': ['MAE', 'MSE', 'RMSE', 'R²'],
#     'Valor': [mae, mse, rmse, r2]
# })

# Crea tabla de CLASIFICACIÓN
# df_clf = pd.DataFrame({
#     'Métrica': ['Accuracy', 'Precisión', 'Recall', 'F1-Score', 'AUC'],
#     'Valor': [acc, prec, rec, f1, auc]
# })

# Imprime ambas tablas
# print("📊 REGRESIÓN vs CLASIFICACIÓN\n")
# print("REGRESIÓN:")
# print(df_reg.to_string(index=False))
# print("\nCLASIFICACIÓN:")
# print(df_clf.to_string(index=False))

print("❌ Completa el código anterior")

### Ejercicio 3.2: Interpretación Crítica

**Pregunta:** ¿Cuál es el propósito de evaluar un modelo? Responde brevemente (2-3 líneas):

1. _________________________________
2. _________________________________
3. _________________________________

**Pregunta:** ¿Por qué es peligroso usar una sola métrica para evaluar un modelo?

Respuesta: ________________________________________________________________

**Ejemplo:** Imagina un modelo que predice si alguien tiene cáncer. ¿Sería mejor tener:
- ☐ Alta Precisión (los positivos que detecta son confiables)
- ☐ Alto Recall (detecta todos los casos de cáncer, aunque haya falsos positivos)

Justifica tu respuesta: _____________________________________________________

### Ejercicio 3.3: Visualización Comparativa de Todas las Métricas

**Instrucciones:**
1. Crea una figura con 2 subplots:
   - **Subplot 1:** Gráfico de barras con las métricas de regresión
   - **Subplot 2:** Gráfico de barras con las métricas de clasificación
2. Usa colores diferentes para distinguir tipos de problemas
3. Añade títulos descriptivos

**Hint:** Usa `fig, axes = plt.subplots(1, 2, figsize=(14, 5))`

In [None]:
# TODO: EJERCICIO 3.3 - Visualización comparativa

# Crea figura con 2 subplots
# fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# Subplot 1: Métricas de REGRESIÓN
# metricas_reg = ['MAE', 'MSE', 'RMSE', 'R²']
# valores_reg = [mae, mse, rmse, r2]
# Nota: MSE y MAE están en escalas diferentes a RMSE y R², así que normaliza para visualizar

# axes[0].bar(metricas_reg[:3], [mae, rmse, r2], color=['#1f77b4', '#ff7f0e', '#2ca02c'])
# axes[0].set_title('Métricas de Regresión', fontweight='bold')
# axes[0].set_ylabel('Valor')
# axes[0].grid(axis='y', alpha=0.3)

# Subplot 2: Métricas de CLASIFICACIÓN
# metricas_clf = ['Accuracy', 'Precisión', 'Recall', 'F1-Score', 'AUC']
# valores_clf = [acc, prec, rec, f1, auc]

# axes[1].bar(metricas_clf, valores_clf, color=['#d62728', '#9467bd', '#8c564b', '#e377c2', '#7f7f7f'])
# axes[1].set_title('Métricas de Clasificación', fontweight='bold')
# axes[1].set_ylabel('Valor (0-1)')
# axes[1].set_ylim([0, 1.1])
# axes[1].grid(axis='y', alpha=0.3)
# plt.xticks(rotation=45, ha='right')

# plt.tight_layout()
# plt.show()

print("❌ Completa el código anterior")

---

## ✅ SOLUCIONES

Las soluciones están en las celdas siguientes. **Solo consulta si realmente te atascas.**

### SOLUCIÓN Ejercicio 1.1

In [None]:
# SOLUCIÓN 1.1
print("="*60)
print("SOLUCIÓN - EJERCICIO 1.1")
print("="*60)

# 1. Carga el dataset de diabetes
X_sol, y_sol = load_diabetes(return_X_y=True)

# 2. Selecciona solo la primera característica (reshape para que sea 2D)
X_single_sol = X_sol[:, np.newaxis, 0]  # Selecciona la primera característica

# 3. Divide en train/test
X_train_sol, X_test_sol, y_train_sol, y_test_sol = train_test_split(
    X_single_sol, y_sol, test_size=0.2, random_state=42
)

# 4. Entrena el modelo
modelo_regresion_sol = LinearRegression()
modelo_regresion_sol.fit(X_train_sol, y_train_sol)

# 5. Realiza predicciones
y_pred_sol = modelo_regresion_sol.predict(X_test_sol)

# 6. Imprime resultados
print(f"\nPrimeras 5 predicciones: {y_pred_sol[:5].round(2)}")
print(f"Primeros 5 valores reales: {y_test_sol[:5].values}")
print(f"\nTamaño del conjunto de test: {len(X_test_sol)}")

### SOLUCIÓN Ejercicio 1.2

In [None]:
# SOLUCIÓN 1.2
print("\n" + "="*60)
print("SOLUCIÓN - EJERCICIO 1.2")
print("="*60)

# Calcula MAE
mae_sol = mean_absolute_error(y_test_sol, y_pred_sol)

# Calcula MSE
mse_sol = mean_squared_error(y_test_sol, y_pred_sol)

# Calcula RMSE
rmse_sol = np.sqrt(mse_sol)

# Imprime los resultados
print(f"\nMAE:  {mae_sol:.2f}")
print(f"MSE:  {mse_sol:.2f}")
print(f"RMSE: {rmse_sol:.2f}")

print("\n💡 INTERPRETACIÓN:")
print(f"  • El modelo se equivoca en promedio {mae_sol:.2f} unidades (MAE)")
print(f"  • El error cuadrático medio es {mse_sol:.2f}")
print(f"  • El RMSE de {rmse_sol:.2f} es la métrica más interpretable (penaliza errores grandes)")

### SOLUCIÓN Ejercicio 1.3

In [None]:
# SOLUCIÓN 1.3
print("\n" + "="*60)
print("SOLUCIÓN - EJERCICIO 1.3")
print("="*60)

# Calcula R²
r2_sol = r2_score(y_test_sol, y_pred_sol)

# Imprime el resultado
print(f"\nR²: {r2_sol:.4f}")
print(f"El modelo explica el {r2_sol*100:.1f}% de la variabilidad en la variable objetivo.")

# Crea un resumen
if r2_sol > 0.7:
    calidad = "🟢 Excelente"
elif r2_sol > 0.5:
    calidad = "🟡 Bueno"
elif r2_sol > 0.3:
    calidad = "🟠 Aceptable"
else:
    calidad = "🔴 Pobre"

print(f"Calidad del modelo: {calidad}")

### SOLUCIÓN Ejercicio 2.1

In [None]:
# SOLUCIÓN 2.1
print("\n" + "="*60)
print("SOLUCIÓN - EJERCICIO 2.1")
print("="*60)

# 1. Carga el dataset Iris
iris_sol = load_iris()
X_iris_sol = iris_sol.data
y_iris_sol = iris_sol.target

# 2. Convierte a problema binario (Versicolor vs Otros)
y_binary_sol = (y_iris_sol == 1).astype(int)

# 3. Divide en train/test
X_train_c_sol, X_test_c_sol, y_train_c_sol, y_test_c_sol = train_test_split(
    X_iris_sol, y_binary_sol, test_size=0.3, random_state=42
)

# 4. Entrena el modelo
modelo_clasificacion_sol = LogisticRegression(random_state=42)
modelo_clasificacion_sol.fit(X_train_c_sol, y_train_c_sol)

# 5. Realiza predicciones
y_pred_c_sol = modelo_clasificacion_sol.predict(X_test_c_sol)

# 6. Imprime estadísticas
print(f"\nDataset Iris binario:")
print(f"  - Total de muestras: {len(y_binary_sol)}")
print(f"  - Muestras positivas (Versicolor): {sum(y_binary_sol)}")
print(f"  - Muestras negativas (Otros): {len(y_binary_sol) - sum(y_binary_sol)}")
print(f"  - Proporción: {sum(y_binary_sol)/len(y_binary_sol)*100:.1f}% positivas")
print(f"\n  - Tamaño train: {len(X_train_c_sol)}")
print(f"  - Tamaño test:  {len(X_test_c_sol)}")

### SOLUCIÓN Ejercicio 2.2

In [None]:
# SOLUCIÓN 2.2
print("\n" + "="*60)
print("SOLUCIÓN - EJERCICIO 2.2")
print("="*60)

# 1. Calcula la matriz de confusión
cm_sol = confusion_matrix(y_test_c_sol, y_pred_c_sol)

# 2. Extrae los valores
tn_sol, fp_sol, fn_sol, tp_sol = cm_sol.ravel()

# 3. Crea el heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(cm_sol, annot=True, fmt='d', cmap='Blues',
            xticklabels=['No Versicolor', 'Versicolor'],
            yticklabels=['Real: No', 'Real: Sí'])
plt.title('Matriz de Confusión - Clasificador Iris')
plt.ylabel('Etiqueta Real')
plt.xlabel('Etiqueta Predicha')
plt.show()

# 4. Imprime los valores
print(f"\nMatriz de Confusión:")
print(f"TN (Verdadero Negativo):  {tn_sol}")
print(f"FP (Falso Positivo):      {fp_sol}")
print(f"FN (Falso Negativo):      {fn_sol}")
print(f"TP (Verdadero Positivo):  {tp_sol}")
print(f"\nTotal de muestras: {tn_sol + fp_sol + fn_sol + tp_sol}")

### SOLUCIÓN Ejercicio 2.3

In [None]:
# SOLUCIÓN 2.3
print("\n" + "="*60)
print("SOLUCIÓN - EJERCICIO 2.3")
print("="*60)

# Calcula Accuracy
acc_sol = accuracy_score(y_test_c_sol, y_pred_c_sol)

# Calcula Precisión
prec_sol = precision_score(y_test_c_sol, y_pred_c_sol, zero_division=0)

# Calcula Recall
rec_sol = recall_score(y_test_c_sol, y_pred_c_sol, zero_division=0)

# Calcula F1-Score
f1_sol = f1_score(y_test_c_sol, y_pred_c_sol, zero_division=0)

# Imprime los resultados
print(f"\nMÉTRICAS DE CLASIFICACIÓN:")
print(f"  Accuracy:   {acc_sol:.4f} ({acc_sol*100:.1f}%)")
print(f"  Precisión:  {prec_sol:.4f} ({prec_sol*100:.1f}%)")
print(f"  Recall:     {rec_sol:.4f} ({rec_sol*100:.1f}%)")
print(f"  F1-Score:   {f1_sol:.4f}")

print("\n💡 INTERPRETACIÓN:")
print(f"  • Accuracy: {acc_sol*100:.1f}% de las predicciones fueron correctas")
print(f"  • Precisión: De los {tp_sol + fp_sol} casos predichos como Versicolor, {tp_sol} fueron correctos")
print(f"  • Recall: De los {tp_sol + fn_sol} Versicolores reales, {tp_sol} fueron detectados")
print(f"  • F1-Score: Media armónica entre precisión y recall: {f1_sol:.4f}")

### SOLUCIÓN Ejercicio 2.5

In [None]:
# SOLUCIÓN 2.5
print("\n" + "="*60)
print("SOLUCIÓN - EJERCICIO 2.5")
print("="*60)

# 1. Obtén las probabilidades de la clase positiva
y_pred_proba_sol = modelo_clasificacion_sol.predict_proba(X_test_c_sol)[:, 1]

# 2. Calcula la curva ROC
fpr_sol, tpr_sol, thresholds_sol = roc_curve(y_test_c_sol, y_pred_proba_sol)

# 3. Calcula el AUC
auc_sol = roc_auc_score(y_test_c_sol, y_pred_proba_sol)

# 4. Grafica
plt.figure(figsize=(8, 6))
plt.plot(fpr_sol, tpr_sol, color='darkorange', lw=2, label=f'Curva ROC (AUC = {auc_sol:.2f})')
plt.plot([0, 1], [0, 1], color='navy', lw=2, linestyle='--', label='Azar (AUC = 0.50)')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('Tasa de Falsos Positivos (FPR)')
plt.ylabel('Tasa de Verdaderos Positivos (TPR)')
plt.title('Curva ROC')
plt.legend(loc="lower right")
plt.grid(alpha=0.3)
plt.show()

# 5. Interpreta
print(f"\nAUC: {auc_sol:.2f}")
if auc_sol > 0.9:
    print("✅ Excelente clasificador (AUC > 0.9)")
elif auc_sol > 0.8:
    print("✅ Muy buen clasificador (AUC > 0.8)")
elif auc_sol > 0.7:
    print("✅ Buen clasificador (AUC > 0.7)")
elif auc_sol > 0.6:
    print("⚠️ Clasificador aceptable (AUC > 0.6)")
else:
    print("❌ Clasificador pobre (AUC ≤ 0.6)")

print(f"\n💡 INTERPRETACIÓN:")
print(f"El AUC de {auc_sol:.2f} significa que si elegimos aleatoriamente un ejemplo positivo y otro negativo,")
print(f"hay un {auc_sol*100:.0f}% de probabilidad de que el modelo los ordene correctamente.")

---

## 🎉 ¡Felicidades!

Has completado todos los ejercicios prácticos sobre **Métricas de Evaluación**. 

### ✅ Lo que has practicado:

- ✅ Cálculo de **MAE, MSE, RMSE y R²** para problemas de regresión
- ✅ Construcción e interpretación de la **Matriz de Confusión**
- ✅ Cálculo de **Accuracy, Precisión, Recall y F1-Score**
- ✅ Generación de **Reportes de Clasificación** automatizados
- ✅ Análisis de la **Curva ROC y AUC**
- ✅ Decisión sobre **qué métrica usar** en cada contexto

### 🚀 Próximos Pasos:

1. **Revisa el notebook de teoría** si algún concepto sigue sin estar claro
2. **Intenta ampliar los ejercicios** con otros datasets
3. **Experimenta** cambiando parámetros de los modelos y observando cómo cambian las métricas
4. **Prepárate para el próximo módulo**: Modelos Lineales (Regresión Logística)

---