<a href="https://colab.research.google.com/github/dtoralg/IE_Calidad_ML/blob/main/Ejercicios/Modulo%204/Modulo_4_A_Formulario.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<a href="https://colab.research.google.com/github/dtoralg/IE_Calidad_ML/blob/main/Ejercicios/Modulo_4/Modulo_4_Formulario.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Guía General de Evaluación de Modelos en Machine Learning

Esta guía proporciona una visión general sobre las métricas de evaluación que los alumnos deben conocer para ejecutar correctamente los ejercicios del Módulo 4.

## 1. Introducción a las métricas de evaluación

Las métricas de evaluación son herramientas fundamentales para medir el rendimiento de un modelo de Machine Learning. Dependiendo del tipo de problema (clasificación o regresión), se utilizan diferentes métricas para determinar si un modelo es adecuado o necesita mejoras.

En esta guía veremos cómo calcular e interpretar métricas clave en ambos contextos.

## 2. Métricas de Evaluación para Modelos de Clasificación

En problemas de clasificación, queremos medir qué tan bien un modelo predice categorías correctas. Algunas de las métricas más importantes son:

- **Matriz de confusión**: Permite visualizar aciertos y errores en la clasificación.
- **Precisión (Precision)**: Indica qué proporción de predicciones positivas fueron correctas.
- **Recall (Sensibilidad)**: Mide cuántos casos positivos fueron detectados correctamente.
- **F1-Score**: Es la media armónica entre precisión y recall, útil en conjuntos desbalanceados.
- **Curva ROC y AUC**: Evalúa la capacidad del modelo para distinguir entre clases.

In [None]:
# Ejemplo: Cálculo de la matriz de confusión
from sklearn.metrics import confusion_matrix

# Etiquetas reales y predicciones del modelo (Ejemplo)
y_true = [1, 0, 1, 1, 0, 1, 0, 0, 1, 0]
y_pred = [1, 0, 1, 0, 0, 1, 0, 1, 1, 0]

# Calcular la matriz de confusión
matriz_confusion = confusion_matrix(y_true, y_pred)
print(matriz_confusion)

In [None]:
# Cálculo de Precisión, Recall y F1-score
from sklearn.metrics import precision_score, recall_score, f1_score

precision = precision_score(y_true, y_pred)
recall = recall_score(y_true, y_pred)
f1 = f1_score(y_true, y_pred)

print(f'Precisión: {precision:.2f}')
print(f'Recall: {recall:.2f}')
print(f'F1-score: {f1:.2f}')

In [None]:
# Cálculo de Curva ROC y AUC
from sklearn.metrics import roc_curve, auc
import matplotlib.pyplot as plt

# Probabilidades predichas (Ejemplo)
y_scores = [0.9, 0.2, 0.85, 0.4, 0.3, 0.8, 0.1, 0.6, 0.7, 0.2]

# Calcular la curva ROC
fpr, tpr, _ = roc_curve(y_true, y_scores)
roc_auc = auc(fpr, tpr)

# Graficar la curva ROC
plt.plot(fpr, tpr, label=f'AUC = {roc_auc:.2f}')
plt.xlabel('Falsos Positivos')
plt.ylabel('Verdaderos Positivos')
plt.title('Curva ROC')
plt.legend()
plt.show()

## 3. Métricas de Evaluación para Modelos de Regresión

En problemas de regresión, evaluamos qué tan cercanas son las predicciones del modelo a los valores reales. Las métricas clave incluyen:

- **Error Cuadrático Medio (MSE)**: Penaliza más los errores grandes.
- **Raíz del Error Cuadrático Medio (RMSE)**: Permite interpretar el error en la misma escala que la variable objetivo.
- **Error Absoluto Medio (MAE)**: Indica la diferencia media entre predicciones y valores reales.
- **Coeficiente de Determinación (R²)**: Indica qué proporción de la variabilidad de los datos explica el modelo.

In [None]:
# Cálculo de métricas de regresión
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
import numpy as np

# Valores reales y predicciones (Ejemplo)
y_real = np.array([3.0, 2.5, 4.0, 3.8, 5.2])
y_pred = np.array([2.8, 2.7, 3.9, 3.6, 5.0])

# Calcular métricas
mse = mean_squared_error(y_real, y_pred)
rmse = np.sqrt(mse)
mae = mean_absolute_error(y_real, y_pred)
r2 = r2_score(y_real, y_pred)

print(f'MSE: {mse:.2f}')
print(f'RMSE: {rmse:.2f}')
print(f'MAE: {mae:.2f}')
print(f'R²: {r2:.2f}')

## 4. Consideraciones Finales

- Estas métricas deben interpretarse en el contexto del problema específico.
- Para clasificación, es importante evaluar el balance entre precisión y recall.
- En regresión, el RMSE y MAE permiten entender mejor el impacto de los errores.
- La selección de métricas influye en la optimización de los modelos y en su aplicación en la industria.