<a href="https://colab.research.google.com/github/dtoralg/IE_Calidad_ML/blob/main/Ejercicios/Modulo%204/Modulo_4_A_Formulario.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Guía de Evaluación de Modelos en Machine Learning

Esta guía proporciona información esencial sobre las métricas de evaluación que se utilizan en los ejercicios del Módulo 4.

### Índice
1. [Introducción a las Métricas de Evaluación](#section1)
2. [Matriz de Confusión](#section2)
3. [Precisión, Recall y F1-score](#section3)
4. [Curva ROC y AUC](#section4)
5. [Métricas para Modelos de Regresión](#section5)
6. [Visualización de Resultados](#section6)
7. [Consideraciones Finales](#section7)


## 1. Introducción a las Métricas de Evaluación

Las métricas de evaluación permiten medir el rendimiento de un modelo de Machine Learning. Dependiendo del tipo de problema, se utilizan diferentes métricas:

- **Clasificación**: Matriz de confusión, precisión, recall, F1-score, curva ROC y AUC.
- **Regresión**: Error cuadrático medio (MSE), raíz del error cuadrático medio (RMSE), error absoluto medio (MAE) y coeficiente de determinación (R²).

## 2. Matriz de Confusión

La matriz de confusión muestra la cantidad de aciertos y errores en una clasificación binaria o multiclase.

**Ejemplo de código para calcular la matriz de confusión:**

In [None]:
from sklearn.metrics import confusion_matrix

# Datos de ejemplo
y_true = [1, 0, 1, 1, 0, 1, 0, 0, 1, 0]
y_pred = [1, 0, 1, 0, 0, 1, 0, 1, 1, 0]

# Calcular la matriz de confusión
matriz_confusion = confusion_matrix(y_true, y_pred)
print(matriz_confusion)

## 3. Precisión, Recall y F1-score

- **Precisión**: Indica qué proporción de las predicciones positivas fueron correctas.
- **Recall**: Mide cuántos casos positivos fueron detectados correctamente.
- **F1-score**: Media armónica entre precisión y recall, útil en datasets desbalanceados.

**Ejemplo de código para calcular estas métricas:**

In [None]:
from sklearn.metrics import precision_score, recall_score, f1_score

# Calcular métricas
precision = precision_score(y_true, y_pred)
recall = recall_score(y_true, y_pred)
f1 = f1_score(y_true, y_pred)

print(f'Precisión: {precision:.2f}')
print(f'Recall: {recall:.2f}')
print(f'F1-score: {f1:.2f}')

## 4. Curva ROC y AUC

La curva ROC evalúa la capacidad del modelo para distinguir entre clases.

**Ejemplo de código para generar la curva ROC:**

In [None]:
from sklearn.metrics import roc_curve, auc
import matplotlib.pyplot as plt

# Probabilidades predichas (Ejemplo)
y_scores = [0.9, 0.2, 0.85, 0.4, 0.3, 0.8, 0.1, 0.6, 0.7, 0.2]

# Calcular la curva ROC
fpr, tpr, _ = roc_curve(y_true, y_scores)
roc_auc = auc(fpr, tpr)

# Graficar la curva ROC
plt.plot(fpr, tpr, label=f'AUC = {roc_auc:.2f}')
plt.xlabel('Falsos Positivos')
plt.ylabel('Verdaderos Positivos')
plt.title('Curva ROC')
plt.legend()
plt.show()

## 5. Métricas para Modelos de Regresión

Para modelos de regresión, las métricas más comunes incluyen:
- **MSE**: Penaliza más los errores grandes.
- **RMSE**: Permite interpretar el error en la misma escala de la variable objetivo.
- **MAE**: Indica la diferencia media entre predicciones y valores reales.
- **R²**: Indica qué proporción de la variabilidad de los datos explica el modelo.

**Ejemplo de código para calcular métricas de regresión:**

In [None]:
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
import numpy as np

# Datos de ejemplo
y_real = np.array([3.0, 2.5, 4.0, 3.8, 5.2])
y_pred = np.array([2.8, 2.7, 3.9, 3.6, 5.0])

# Calcular métricas
mse = mean_squared_error(y_real, y_pred)
rmse = np.sqrt(mse)
mae = mean_absolute_error(y_real, y_pred)
r2 = r2_score(y_real, y_pred)

print(f'MSE: {mse:.2f}')
print(f'RMSE: {rmse:.2f}')
print(f'MAE: {mae:.2f}')
print(f'R²: {r2:.2f}')

## 6. Consideraciones Finales

- Cada métrica es útil en distintos contextos.
- Para clasificación, es importante evaluar el balance entre precisión y recall.
- En regresión, el RMSE y MAE permiten entender mejor el impacto de los errores.
- La selección de métricas influye en la optimización de los modelos y en su aplicación en la industria.