# Lags y residuos en modelos híbridos

En un **clasificador híbrido** que combina un modelo de series temporales (como `ForecasterRecursive`) con un modelo de clasificación, se añaden **lags** y **residuos** como columnas adicionales porque estas características proporcionan información valiosa sobre la estructura temporal y los patrones subyacentes en los datos.


### **1. ¿Por qué se añaden lags?**

Los **lags** son valores pasados de la serie temporal desplazados en el tiempo. Por ejemplo:
- `lag_1`: El valor de la serie en el período anterior.
- `lag_2`: El valor de la serie hace dos períodos.

#### **a) Capturan dependencias temporales**
Las series temporales suelen tener dependencias entre valores consecutivos. Por ejemplo:
- Si el consumo de energía ha estado aumentando constantemente en los últimos días, es más probable que siga aumentando.
- Si un sensor muestra anomalías recientes, es más probable que ocurra un fallo.

Los lags permiten al modelo de clasificación capturar estas dependencias temporales explícitamente.

#### **b) Reflejan patrones históricos**
Los lags actúan como una memoria del sistema, proporcionando contexto sobre el comportamiento pasado. Esto es especialmente útil en problemas donde el estado actual depende del estado anterior, como en predicción de fallos o movimientos de precios.

#### **c) Mejoran la capacidad predictiva**
Incluir lags como características permite que el modelo de clasificación aprenda patrones más complejos que no serían evidentes si solo se usaran los valores actuales.

### **2. ¿Por qué se añaden residuos?**

Los **residuos** son las diferencias entre los valores reales y las predicciones de un modelo de series temporales (como `ForecasterRecursive`). Por ejemplo:
- Si el modelo predice un valor de 100 pero el valor real es 110, el residuo es `10`.

#### **a) Resaltan errores no modelados**
Los residuos representan la parte de los datos que el modelo de series temporales no pudo capturar. Estos errores pueden contener información importante sobre anomalías, cambios abruptos o patrones no lineales que no están presentes en los lags.

#### **b) Detectan anomalías**
En problemas como predicción de fallos, los residuos grandes pueden indicar anomalías o desviaciones significativas del comportamiento normal. Estas anomalías pueden ser señales tempranas de eventos futuros (por ejemplo, fallos).

#### **c) Complementan los lags**
Mientras que los lags capturan la estructura temporal explícita, los residuos capturan la estructura implícita o los errores del modelo. Juntos, proporcionan una visión más completa de los datos.


### **3. Ejemplo práctico: Lags y residuos en un clasificador híbrido**

Supongamos que estás trabajando en un problema de **mantenimiento predictivo** para predecir si un equipo fallará en los próximos días. Aquí está cómo funcionan los lags y residuos:

#### **a) Lags**
- Si el consumo de energía (`lag_1`, `lag_2`, etc.) ha estado aumentando constantemente, esto podría ser un indicador de que el equipo está bajo estrés y podría fallar pronto.
- Los lags permiten al clasificador aprender patrones como "si el consumo ha estado aumentando durante los últimos 3 días, es más probable que ocurra un fallo".

#### **b) Residuos**
- Si el modelo de series temporales predice que el consumo de energía debería ser estable, pero los residuos muestran un aumento repentino, esto podría ser una señal de que algo inusual está ocurriendo.
- Los residuos resaltan anomalías que podrían ser indicadores tempranos de fallos.

#### **c) Combinación de lags y residuos**
Al combinar lags y residuos, el clasificador puede aprender tanto patrones temporales explícitos (lags) como anomalías implícitas (residuos). Esto mejora la capacidad del modelo para predecir eventos futuros.

### **4. Beneficios de usar lags y residuos**

#### **a) Mejora en la precisión**
Incluir lags y residuos como características adicionales permite al clasificador capturar patrones más complejos, lo que puede mejorar su precisión.

#### **b) Mayor robustez**
Al capturar tanto la estructura temporal explícita (lags) como los errores no modelados (residuos), el modelo es más robusto y menos sensible a ruido o cambios en los datos.

#### **c) Interpretación más clara**
Los lags y residuos tienen interpretaciones claras, lo que facilita entender cómo el modelo está tomando decisiones.

### **5. Consideraciones importantes**

#### **a) Selección de lags**
No todos los lags son igualmente útiles. Es importante seleccionar los lags más relevantes (por ejemplo, aquellos con mayor correlación con la variable objetivo).

#### **b) Manejo de residuos**
Los residuos deben ser cuidadosamente analizados para asegurarse de que no contienen ruido excesivo. En algunos casos, puede ser útil transformar los residuos (por ejemplo, usando medias móviles) para reducir el ruido.

#### **c) Evitar multicolinealidad**
Los lags pueden estar altamente correlacionados entre sí, lo que puede afectar el rendimiento del modelo. Para mitigarlo:
- Usa técnicas como PCA (Análisis de Componentes Principales).
- Combina lags con otras características derivadas (por ejemplo, medias móviles, diferencias).