# Tipos de Errores en Modelos de Machine Learning

## Introducción

En Machine Learning, medir el rendimiento de un modelo es crucial para evaluar su precisión y capacidad de generalización. Esto se logra mediante métricas de error que cuantifican qué tan lejos están las predicciones del modelo de los valores reales.

En esta clase abordaremos las métricas de error más comunes: **MSE**, **RMSE**, **MAE**, entre otras. Analizaremos cuándo utilizarlas, cómo interpretarlas y cómo calcularlas.

---

## 1. Error Medio Absoluto (MAE)

### **Descripción**
El **Mean Absolute Error (MAE)** mide el promedio de las diferencias absolutas entre las predicciones y los valores reales. No considera la dirección del error (positivo o negativo), solo su magnitud.

$$
MAE = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|
$$

Donde:
- $ y_i $: Valor real.
- $ \hat{y}_i $: Predicción del modelo.
- $ n $: Número de observaciones.

### **Método de Feynman**
Imagina que estás estimando el peso de varias cajas. El MAE es como calcular, en promedio, cuántos kilogramos te equivocas al adivinar el peso de cada caja, sin importar si tu error fue hacia arriba o hacia abajo.

### **Aplicación**
- Bueno para datos donde los errores extremos no son críticos.
- Ejemplo: Predicción de ingresos anuales.

---

## 2. Error Cuadrático Medio (MSE)

### **Descripción**
El **Mean Squared Error (MSE)** calcula el promedio de los cuadrados de las diferencias entre las predicciones y los valores reales. Penaliza más los errores grandes debido al término cuadrático.

$$
MSE = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2
$$

### **Método de Feynman**
El MSE es como calcular cuánto se amplifican tus errores si cada error se eleva al cuadrado. Es útil cuando quieres que los errores grandes tengan más peso en el análisis.

### **Aplicación**
- Útil cuando los errores grandes son inaceptables.
- Ejemplo: Predicción de costos en proyectos de construcción.

---

## 3. Raíz del Error Cuadrático Medio (RMSE)

### **Descripción**
El **Root Mean Squared Error (RMSE)** es la raíz cuadrada del MSE. Representa el error promedio en las mismas unidades que los datos.

$$
RMSE = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2}
$$

### **Método de Feynman**
El RMSE es como calcular cuánto te equivocas, en promedio, en las mismas unidades de tu problema, pero dándole más peso a los errores grandes.

### **Aplicación**
- Más interpretable que el MSE por estar en las mismas unidades.
- Ejemplo: Predicción de temperaturas en grados Celsius.

---

## 4. Error Absoluto Medio Porcentual (MAPE)

### **Descripción**
El **Mean Absolute Percentage Error (MAPE)** mide el error como un porcentaje del valor real, lo que lo hace independiente de las unidades de medida.

$$
MAPE = \frac{1}{n} \sum_{i=1}^{n} \left| \frac{y_i - \hat{y}_i}{y_i} \right| \times 100
$$

### **Método de Feynman**
Es como calcular, en promedio, cuánto porcentaje te equivocas en cada predicción. Ideal cuando comparas modelos en diferentes escalas.

### **Aplicación**
- Bueno para interpretar errores en términos relativos.
- Ejemplo: Predicción de ventas en diferentes regiones.

---

## Comparación de Métricas

| **Métrica** | **Fórmula**                          | **Unidades**              | **Ventajas**                                 | **Limitaciones**                                   | **Aplicaciones comunes**            |
|-------------|--------------------------------------|---------------------------|---------------------------------------------|--------------------------------------------------|-------------------------------------|
| MAE         | $ \frac{1}{n} \sum \|y_i - \hat{y}_i\| $ | Misma unidad que los datos | Fácil de interpretar                        | Penaliza igual errores grandes y pequeños         | Predicciones generales              |
| MSE         | $ \frac{1}{n} \sum (y_i - \hat{y}_i)^2 $ | Cuadrado de las unidades  | Penaliza más los errores grandes            | Difícil de interpretar en las unidades originales | Costos, valores extremos importantes |
| RMSE        | $ \sqrt{\frac{1}{n} \sum (y_i - \hat{y}_i)^2} $ | Misma unidad que los datos | Combina precisión y penalización de errores | Penaliza errores grandes                         | Temperaturas, datos continuos       |
| MAPE        | $\frac{1}{n} \sum \left\| \frac{y_i - \hat{y}_i}{y_i} \right\| \times 100 $ | Porcentaje               | Independiente de unidades                   | Sesgado si $ y_i $ se acerca a cero             | Comparaciones entre modelos         |

---

## Consejos para seleccionar métricas

1. **Considera las unidades de los datos**:
   - Si necesitas interpretabilidad directa, usa MAE o RMSE.
   - Si comparas modelos en diferentes escalas, usa MAPE.

2. **Piensa en los errores grandes**:
   - Usa MSE o RMSE si quieres penalizar más los errores grandes.

3. **No dependas de una sola métrica**:
   - Evalúa el rendimiento con varias métricas para obtener una visión completa.

---

## Ejemplo Práctico en Python

In [1]:
import numpy as np
from sklearn.metrics import mean_absolute_error, mean_squared_error

# Datos simulados
y_real = np.array([100, 200, 300, 400, 500])
y_pred = np.array([110, 190, 290, 410, 490])

# Calcular métricas
mae = mean_absolute_error(y_real, y_pred)
mse = mean_squared_error(y_real, y_pred)
rmse = np.sqrt(mse)
mape = np.mean(np.abs((y_real - y_pred) / y_real)) * 100

# Mostrar resultados
print("MAE:", mae)
print("MSE:", mse)
print("RMSE:", rmse)
print("MAPE:", mape)

MAE: 10.0
MSE: 100.0
RMSE: 10.0
MAPE: 4.566666666666666
