<center>
    <h1><font size="16">Especializaci√≥n en Estad√≠stica</font></h1>
    <h1><font size="12">SERIES DE TIEMPO</font></h1>
</center>

## üéì Taller Pr√°ctico ‚Äì Modelos Avanzados para Series Temporales: Estado Espacial, Redes Neuronales y GAMs

### üìò **Introducci√≥n**

En este taller exploraremos **modelos avanzados aplicados a series temporales**, poniendo √©nfasis en aquellos que permiten capturar patrones complejos como **tendencia, estacionalidad no lineal y din√°micas estructurales latentes**. A diferencia de enfoques cl√°sicos como ARIMA, estos modelos ofrecen mayor flexibilidad para representar la evoluci√≥n temporal de un fen√≥meno y generar pron√≥sticos informados.

Nos centraremos en tres tipos de modelos:

1. **Modelos de Estado Espacial**: permiten descomponer la serie en componentes latentes (nivel, pendiente, estacionalidad) y realizar pron√≥sticos robustos mediante el filtro de Kalman.
2. **Redes Neuronales**: ofrecen una aproximaci√≥n no param√©trica para capturar relaciones no lineales a partir de rezagos temporales, incluyendo modelos autoregresivos y recurrentes.
3. **Modelos Aditivos Generalizados (GAMs)**: permiten modelar suavizadamente los efectos del tiempo y la estacionalidad mediante funciones spline, con alta interpretabilidad estructural.

> üß† Este taller no se centra en la construcci√≥n desde cero de los modelos, sino en **analizar, interpretar y comparar los resultados obtenidos**, incluyendo su descomposici√≥n, visualizaci√≥n y capacidad predictiva.

---

### üéØ **Objetivos del Taller**

* Analizar e interpretar los componentes latentes estimados por modelos de estado espacial.
* Comparar la capacidad predictiva de distintos enfoques neuronales aplicados a una misma serie.
* Evaluar la descomposici√≥n y ajuste realizado por un modelo GAM en t√©rminos de tendencia y estacionalidad.
* Visualizar y comunicar de forma efectiva los resultados de cada modelo y su aplicabilidad en contextos reales.

---

### üß∞ **Requisitos Previos**

In [None]:
library(KFAS)      # Modelos de estado espacial y filtro de Kalman con estructura flexible.
library(dlm)       # Alternativa para modelos de estado espacial con enfoque bayesiano/cl√°sico.
library(mgcv)      # Modelos Aditivos Generalizados (GAMs) con funciones suavizadas tipo spline.

library(tsDyn)     # Modelos autoregresivos no lineales con redes neuronales (`nnetTs`).
library(nnet)      # Redes neuronales cl√°sicas (perceptrones multicapa).
library(RSNNS)     # Implementaci√≥n de redes neuronales recurrentes (Elman, Jordan) y avanzadas.
library(caret)     # Framework unificado para entrenamiento y validaci√≥n de modelos (incluye redes neuronales).

library(fpp3)      # Framework moderno para an√°lisis de series temporales con `tsibble`, `fable` y `ggplot2`.
library(forecast)  # Modelos cl√°sicos de pron√≥stico y funciones auxiliares (`nnetar`, `forecast`, `accuracy`).
library(ggplot2)   # Visualizaci√≥n de series, componentes suavizados y pron√≥sticos.
library(zoo)       # Manipulaci√≥n de series temporales indexadas y conversi√≥n a `yearmon`.
library(lubridate) # Extracci√≥n y manejo de componentes temporales (a√±o, mes).
library(tibble)    # Estructura moderna de data frames para flujos `tidy`.
library(dplyr)     # Manipulaci√≥n eficiente y legible de datos (`mutate`, `filter`, `join`, etc.).

### üì• 1. Carga y transformaci√≥n de datos

Trabajaremos con la serie mensual de pasajeros a√©reos internacionales (`AirPassengers`), incluida por defecto en R. Esta serie contiene 144 observaciones mensuales desde enero de 1949 hasta diciembre de 1960.

In [None]:
# Cargar la serie
data("AirPassengers")
ap <- AirPassengers

üîç **Descripci√≥n**:

* La serie representa el n√∫mero de pasajeros (en miles) que viajaron por avi√≥n cada mes.
* Se trata de una serie **no estacionaria**, tanto en media como en varianza.

---

#### üîÑ Transformaci√≥n logar√≠tmica

Aplicamos la transformaci√≥n logar√≠tmica para **estabilizar la varianza** y facilitar la interpretaci√≥n en algunos modelos, como los de estado espacial, redes neuronales y GAMs.


In [None]:
# Transformar a logaritmo natural
log_ap <- log(ap)

> üß† Esta transformaci√≥n convierte los incrementos relativos en incrementos absolutos y suaviza la amplitud creciente de la estacionalidad.

### üß± **2. Definici√≥n del modelo de estado espacial estructural**

Iniciaremos con la construcci√≥n de un **modelo estructural cl√°sico** que descompone la serie en dos componentes principales:

1. Una **tendencia local** con nivel y pendiente.
2. Una **estacionalidad mensual** representada mediante variables dummy.

Trabajamos sobre la serie en escala logar√≠tmica, por lo que los efectos **multiplicativos se vuelven aditivos** en el modelo.

In [None]:
# Modelo estructural: tendencia local + estacionalidad
modelo_ss <- SSModel(log_ap ~ 
                       SSMtrend(degree = 2, Q = list(matrix(NA), matrix(NA))) +
                       SSMseasonal(period = 12, sea.type = "dummy", Q = matrix(NA)),
                     H = matrix(NA))

#### üß† Explicaci√≥n de los componentes

| Componente                        | Descripci√≥n                                                                                                           |
| :-------------------------------- | :-------------------------------------------------------------------------------------------------------------------- |
| `SSMtrend(degree = 2)`            | Modelo de **tendencia local lineal**, con dos estados: `nivel` y `pendiente`.                                         |
| `SSMseasonal(period = 12, dummy)` | Modelo de **estacionalidad mensual** con 11 variables dummy (meses).                                                  |
| `Q = list(...)`                   | Matriz de varianzas de los errores de estado (nivel, pendiente, estacionalidad). Se estiman por m√°xima verosimilitud. |
| `H = matrix(NA)`                  | Varianza del error de observaci√≥n (ruido blanco). Tambi√©n estimada.                                                   |

---

> üìå Este modelo es completamente **probabil√≠stico y din√°mico**, y permite analizar c√≥mo evolucionan separadamente el nivel de la serie y la estacionalidad mes a mes.

### üßÆ **3. Estimaci√≥n del modelo y aplicaci√≥n del Filtro de Kalman**

Una vez definido el modelo estructural, el siguiente paso es **estimar los par√°metros desconocidos** (las varianzas en $Q$ y $H$) mediante **m√°xima verosimilitud**, y luego aplicar el **Filtro de Kalman** para obtener los valores suavizados de los componentes latentes.

---

#### üî¢ Estimaci√≥n de par√°metros


In [None]:
# Valores iniciales (en log-escala) para las varianzas:
# Orden: H (observaci√≥n), Q1 (nivel), Q2 (pendiente), Q3 (estacionalidad)
iniciales <- log(c(0.01, 0.001, 0.001, 0.01))

# Estimaci√≥n con m√©todo de optimizaci√≥n BFGS
fit <- fitSSM(modelo_ss, inits = iniciales, method = "BFGS")

# Extraer modelo ajustado con par√°metros estimados
modelo_ajustado <- fit$model

# Visualizar resumen del modelo ajustado
modelo_ajustado


#### üìå Explicaci√≥n

* `fitSSM()` realiza la optimizaci√≥n de la verosimilitud para estimar los par√°metros libres (valores `NA` en Q y H).
* Se usa el m√©todo **BFGS**, eficiente para problemas diferenciables.
* `modelo_ajustado` contiene ya los valores estimados y est√° listo para aplicar el **Filtro de Kalman**.

---

#### üö¶ Aplicar Filtro de Kalman + suavizado


In [None]:
# Aplicar filtro de Kalman y suavizado de estados
kfs <- KFS(modelo_ajustado, smoothing = c("state", "signal"))

# Inspeccionar resumen del objeto
kfs

#### üîç ¬øQu√© contiene `kfs`?

* `kfs$alphahat`: valores suavizados de los **estados latentes** (nivel, pendiente, estacionalidad).
* `kfs$muhat`: serie suavizada reconstruida a partir de los componentes estimados.
* `kfs$V`: varianza de predicci√≥n.
* `kfs$v`: residuos de predicci√≥n.

Estos resultados se usar√°n en los pasos siguientes para **visualizar la tendencia, la estacionalidad y realizar pron√≥sticos**.

### üí¨ Preguntas

1. ¬øQu√© representa cada uno de los componentes del modelo de estado espacial (nivel, pendiente, estacionalidad)?
2. ¬øQu√© ventaja tiene representar la estacionalidad mediante variables dummy frente a usar funciones senoidales o splines?
3. ¬øQu√© nos dice el comportamiento del componente estacional sobre los ciclos anuales en la serie?
4. ¬øQu√© diferencia habr√≠a si us√°ramos una estacionalidad `bs = "cc"` con splines c√≠clicos como en GAMs?

---

### üìä **4. Visualizaci√≥n de componentes suavizados**

Despu√©s de aplicar el filtro y suavizado de Kalman, es posible **descomponer la serie observada** en sus componentes latentes estimados: **nivel**, **pendiente** y **estacionalidad**.

En esta secci√≥n, visualizaremos c√≥mo se comporta la **tendencia suavizada** en comparaci√≥n con la serie original transformada.

---

#### üîÅ Preparar los datos para graficar


In [None]:
# Crear un objeto ts con los componentes del modelo
ts_comp <- ts(cbind(
  Observado = log_ap,
  Tendencia = kfs$muhat,
  Nivel = kfs$alphahat[, "level"],
  Pendiente = kfs$alphahat[, "slope"],
  Estacionalidad = kfs$alphahat[, grepl("sea", colnames(kfs$alphahat))]
), start = start(log_ap), frequency = frequency(log_ap))


üîç Aqu√≠ estamos construyendo una serie multivariada `ts` con:

* La serie observada (`log_ap`).
* La serie suavizada completa (`muhat`), que incluye todos los componentes.
* Los estados individuales: `nivel`, `pendiente`, y la **suma de efectos estacionales** (`sea_dummy1`, ..., `sea_dummy11`).

---

#### üìÜ Construir un data frame con fechas


In [None]:
library(zoo)
library(lubridate)
library(ggplot2)

# Extraer fechas a partir del √≠ndice de tiempo
fechas <- as.yearmon(time(ts_comp))

# Crear data.frame con observaciones y tendencia
df_comp <- data.frame(
  Fecha = as.Date(fechas),
  Observado = as.numeric(ts_comp[, "Observado"]),
  Tendencia = as.numeric(ts_comp[, "Tendencia"])
)


#### üìà Graficar la tendencia suavizada


In [None]:
ggplot(df_comp, aes(x = Fecha)) +
  geom_line(aes(y = Observado), color = "black", linewidth = 0.8) +
  geom_line(aes(y = Tendencia), color = "blue", linewidth = 0.8, linetype = "dashed") +
  labs(title = "Observado vs Tendencia (modelo de estado espacial)",
       y = "log(Pasajeros)", x = "Fecha") +
  theme_minimal()


### ‚úÖ ¬øQu√© esperamos ver?

* La **l√≠nea negra** representa la serie log-transformada observada.
* La **l√≠nea azul discontinua** es la tendencia suavizada estimada por el modelo.
* Se espera que la tendencia siga el movimiento de fondo de la serie, **ignorando la estacionalidad** y el ruido aleatorio.

> üìå Esta descomposici√≥n permite **interpretar el comportamiento subyacente** de la serie, separado de los efectos c√≠clicos y de corto plazo.

### üìä **5. Visualizaci√≥n del componente estacional**

Una de las ventajas clave de los modelos de estado espacial es su capacidad para estimar la **componente estacional de forma separada y din√°mica**, lo que permite analizar su comportamiento a lo largo del tiempo.

---

#### üßÆ Extracci√≥n de la estacionalidad


In [None]:
# 1. Sumar los 11 efectos estacionales (uno por cada dummy)
estacionalidad_total <- rowSums(kfs$alphahat[, grepl("sea_dummy", colnames(kfs$alphahat))])

üîç Cada fila de `kfs$alphahat` contiene los valores suavizados de los estados latentes. Al sumar los efectos `sea_dummy1` a `sea_dummy11`, se reconstruye la estacionalidad total en cada punto del tiempo.

---

#### üßæ Construcci√≥n de la serie temporal


In [None]:
# 2. Convertir a serie ts con la misma estructura que log_ap
ts_estacionalidad <- ts(estacionalidad_total, start = start(log_ap), frequency = frequency(log_ap))

#### üìÜ Conversi√≥n a data.frame para graficar


In [None]:
# 3. Crear data.frame con fechas y valores estacionales
df_est <- data.frame(
  Fecha = as.Date(as.yearmon(time(ts_estacionalidad))),
  Estacionalidad = as.numeric(ts_estacionalidad)
)

#### üìà Graficar la estacionalidad suavizada


In [None]:
# 4. Visualizaci√≥n
ggplot(df_est, aes(x = Fecha, y = Estacionalidad)) +
  geom_line(color = "darkgreen", linewidth = 0.8) +
  labs(title = "Componente Estacional Suavizado (Modelo de Estado Espacial)",
       x = "Fecha", y = "Estacionalidad") +
  theme_minimal()

### ‚úÖ Interpretaci√≥n esperada

* El gr√°fico muestra c√≥mo var√≠a la estacionalidad mes a mes a lo largo del tiempo.
* Se espera observar un patr√≥n **c√≠clico repetitivo**, con meses consistentemente positivos (por ejemplo, junio‚Äìagosto) y otros negativos (enero, noviembre, etc.).
* La estacionalidad suavizada puede variar ligeramente entre a√±os, permitiendo capturar **din√°micas estacionales no estrictamente constantes**.

> üß† Este tipo de representaci√≥n es √∫til para **detectar cambios sutiles en la estructura estacional** a lo largo del tiempo.

### üìà **6. Generaci√≥n de pron√≥sticos con modelo de estado espacial**

Una vez ajustado el modelo e interpretados los componentes latentes, es posible generar **pron√≥sticos fuera de muestra** y sus respectivos **intervalos de predicci√≥n**. Esto se realiza f√°cilmente gracias a la estructura probabil√≠stica del modelo.

---

#### üîÆ Generar pron√≥stico a 24 meses



In [None]:
# Predicci√≥n en escala logar√≠tmica (con intervalo del 95%)
pred_kfas <- predict(modelo_ajustado, n.ahead = 24, interval = "prediction", level = 0.95)

# Transformar de log-escala a escala original (pasajeros)
pred_exp <- exp(pred_kfas)


üîç `predict()` entrega un objeto con tres columnas:

* `"fit"`: valor pronosticado.
* `"lwr"` y `"upr"`: l√≠mites inferior y superior del intervalo de predicci√≥n.

---

#### üßæ Visualizaci√≥n junto a la serie hist√≥rica



In [None]:
# Visualizar pron√≥stico junto a la serie observada
forecast::autoplot(window(ap, end = c(1960, 12))) +
  autolayer(ts(pred_exp[, "fit"], start = c(1961, 1), frequency = 12), series = "Pron√≥stico") +
  autolayer(ts(pred_exp[, "lwr"], start = c(1961, 1), frequency = 12), series = "L√≠mite inferior", linetype = "dashed") +
  autolayer(ts(pred_exp[, "upr"], start = c(1961, 1), frequency = 12), series = "L√≠mite superior", linetype = "dashed") +
  labs(title = "Pron√≥stico con modelo de estado espacial",
       y = "Pasajeros", x = "A√±o") +
  theme_minimal()


#### üì§ Visualizar **solo el pron√≥stico**


In [None]:
# Visualizaci√≥n solo del pron√≥stico y sus intervalos
forecast::autoplot(ts(pred_exp[, "fit"], start = c(1961, 1), frequency = 12), series = "Pron√≥stico") +
  autolayer(ts(pred_exp[, "lwr"], start = c(1961, 1), frequency = 12), series = "L√≠mite inferior", linetype = "dashed") +
  autolayer(ts(pred_exp[, "upr"], start = c(1961, 1), frequency = 12), series = "L√≠mite superior", linetype = "dashed") +
  labs(title = "Pron√≥stico con modelo de estado espacial",
       y = "Pasajeros", x = "A√±o") +
  theme_minimal()

### ‚úÖ Interpretaci√≥n esperada

* El modelo genera un **pron√≥stico suavizado** que **respeta la tendencia creciente y la estacionalidad** capturada.
* Las **bandas de predicci√≥n** reflejan la **incertidumbre creciente** a medida que se avanza en el horizonte.
* Este comportamiento es **t√≠pico de modelos estructurales** con m√∫ltiples componentes latentes.

## ü§ñ Redes Neuronales aplicadas a Series Temporales

Las redes neuronales permiten modelar relaciones no lineales complejas entre los valores pasados de una serie y su comportamiento futuro. Aunque no est√°n dise√±adas espec√≠ficamente para datos secuenciales como los modelos de estado espacial o ARIMA, pueden capturar patrones ocultos √∫tiles para la predicci√≥n, especialmente si se utilizan ventanas de entrada (lags) adecuadas.

En esta secci√≥n trabajaremos con la serie `AirPassengers`, previamente transformada para estabilizar la varianza, y exploraremos diferentes enfoques neuronales para el pron√≥stico.

---

### üîÑ **1. Transformaci√≥n logar√≠tmica y visualizaci√≥n inicial**

Antes de aplicar cualquier red neuronal, transformamos la serie a logaritmo natural para facilitar la modelaci√≥n y evitar predicciones negativas.


In [None]:
# Transformaci√≥n logar√≠tmica
log_ap <- log(AirPassengers)

#### üìà Visualizaci√≥n de la serie transformada

In [None]:
library(forecast)
library(ggplot2)

autoplot(log_ap) +
  labs(title = "Serie log-transformada: AirPassengers",
       y = "log(Pasajeros)", x = "A√±o") +
  theme_minimal()


### üß† ¬øPor qu√© usar el logaritmo?

* La transformaci√≥n suaviza la **amplitud creciente de la estacionalidad**.
* Permite que modelos con salida lineal (como `nnet`) trabajen de manera m√°s estable.
* Las predicciones en log-escala pueden transformarse de vuelta a escala original con `exp()`.

### ‚öôÔ∏è **2. Modelo autoregresivo neuronal con `nnetar()`**

El paquete `forecast` incluye la funci√≥n `nnetar()`, que ajusta de forma autom√°tica una **red neuronal autoregresiva no lineal (NNAR)**. Este modelo combina la flexibilidad de las redes neuronales con la estructura de los modelos AR tradicionales.

---

#### ü§ñ Ajustar el modelo


In [None]:
modelo_nnetar <- nnetar(log_ap)

* El modelo se entrena autom√°ticamente seleccionando:

  * El n√∫mero de retardos (lags) a usar.
  * La cantidad de neuronas en la capa oculta.
  * Si se incluye o no estacionalidad expl√≠cita.

---

#### üîç Ver resumen del modelo

In [None]:
modelo_nnetar

> Este comando muestra la arquitectura utilizada (por ejemplo, NNAR(1,1,2)\[12]) y cu√°ntas redes fueron promediadas para estabilizar el resultado.

---

#### üîÆ Generar pron√≥stico a 24 meses

In [None]:
pron_nnetar <- forecast(modelo_nnetar, h = 24)

#### üìà Visualizar el pron√≥stico

In [None]:
autoplot(pron_nnetar) +
  labs(title = "Pron√≥stico con red neuronal autoregresiva (nnetar)",
       y = "log(Pasajeros)", x = "A√±o") +
  theme_minimal()

### ‚úÖ Interpretaci√≥n esperada

* El modelo genera una **serie suavizada de pron√≥sticos** en log-escala, incluyendo bandas de predicci√≥n.
* Se espera que la red capture tanto la **tendencia global** como **patrones estacionales**, aunque puede suavizarlos en exceso si la arquitectura es muy simple.

> üìå `nnetar()` es una excelente herramienta para establecer un baseline no lineal, sin necesidad de configurar manualmente la red.

### ‚öôÔ∏è **3. Red neuronal personalizada con `nnet()`**

En esta etapa construiremos manualmente una red neuronal para pron√≥stico utilizando la funci√≥n `nnet()` del paquete base. A diferencia de `nnetar()`, este enfoque nos permite **definir directamente la estructura de entrada y controlar el entrenamiento** paso a paso.

---

#### üßÆ Crear matriz de entrada (ventana de 12 lags)

In [None]:
library(nnet)
library(tibble)

# Definir n√∫mero de retardos
lags <- 12

# Construir matriz con lags + objetivo
x <- embed(log_ap, lags + 1)
y <- x[, 1]         # valor objetivo
X <- x[, -1]        # variables predictoras


> üìå `embed()` crea una matriz en la que cada fila contiene los 12 valores anteriores (lagged inputs) y la respuesta.

---

#### ‚úÇÔ∏è Separar conjunto de entrenamiento



In [None]:
# Usamos todos los datos excepto los √∫ltimos 24 para entrenar
n <- nrow(X)
train_idx <- 1:(n - 24)

#### üß† Ajustar el modelo con `nnet()`

In [None]:
# Entrenar red neuronal: 12 entradas, 5 neuronas ocultas, salida lineal
modelo_nnet <- nnet(X[train_idx, ], y[train_idx],
                    size = 5, linout = TRUE, trace = FALSE)

# Revisar estructura de la red
modelo_nnet

### ‚úÖ ¬øQu√© hace esta red?

* **Arquitectura**: 12‚Äì5‚Äì1 (12 entradas, 5 nodos ocultos, 1 salida).
* **Activaci√≥n**: funciones no lineales en capa oculta, salida lineal (`linout = TRUE`).
* Entrenada sobre datos escalados en log-escala, con 24 valores reservados para prueba.
* Sin validaci√≥n cruzada autom√°tica, por lo que es **m√°s sensible a sobreajuste**.

### üîÆ **4. Pron√≥stico recursivo con red neuronal personalizada (`nnet`)**

Una vez entrenado el modelo con una ventana deslizante de 12 retardos, generamos el pron√≥stico fuera de muestra **de manera recursiva**, es decir, alimentando el modelo con sus propias predicciones.

---

#### üîÅ Generar pron√≥stico a 24 pasos


In [None]:
# Inicializar vector para almacenar predicciones
pred <- numeric(24)

# Tomar como entrada la √∫ltima fila disponible del conjunto de entrenamiento
input <- X[n - 24, ]

# Pron√≥stico recursivo: una predicci√≥n alimenta la siguiente
for (i in 1:24) {
  pred[i] <- predict(modelo_nnet, matrix(input, nrow = 1))
  input <- c(pred[i], head(input, -1))  # actualizar entrada
}


> üìå Este enfoque simula un escenario real de pron√≥stico, donde no se conocen los valores futuros verdaderos y el modelo debe apoyarse en sus propias salidas.

---

#### üîÑ Transformar y organizar resultados


In [None]:
# Volver a escala original (pasajeros)
pred_exp <- exp(pred)

# Construir fechas de predicci√≥n
fechas_pred <- seq(as.Date("1961-01-01"), by = "month", length.out = 24)

# Data frame de predicci√≥n
df_pred <- data.frame(Fecha = fechas_pred, Pronostico = pred_exp)

# Serie hist√≥rica
df_hist <- data.frame(
  Fecha = as.Date(as.yearmon(time(AirPassengers))),
  Pasajeros = as.numeric(AirPassengers)
)


#### üìà Visualizaci√≥n del pron√≥stico

In [None]:
library(ggplot2)

ggplot() +
  geom_line(data = df_hist, aes(x = Fecha, y = Pasajeros), color = "black") +
  geom_line(data = df_pred, aes(x = Fecha, y = Pronostico), color = "blue") +
  labs(title = "Pron√≥stico con red neuronal simple (`nnet`)",
       y = "Pasajeros", x = "Fecha") +
  theme_minimal()

### ‚úÖ ¬øQu√© observamos?

* La red logra continuar el patr√≥n de crecimiento, aunque en general:

  * **Subestima la amplitud de la estacionalidad**.
  * Puede presentar **explosiones o colapsos** si no est√° bien regularizada.
* Este comportamiento es t√≠pico en redes **alimentadas recursivamente sin control de error acumulado**.

> ‚ö†Ô∏è Para mejorar este enfoque, se podr√≠an usar t√©cnicas de regularizaci√≥n, validaci√≥n cruzada o redes con memoria como las recurrentes (`RSNNS`).

### üß™ **5. Red neuronal con validaci√≥n cruzada (`caret`)**

El paquete `caret` permite entrenar redes neuronales con control expl√≠cito de validaci√≥n cruzada para datos temporales. En este caso, usaremos **12 retardos como predictores** y una estrategia de validaci√≥n tipo *time slice*, adecuada para series temporales.

---

#### üßÆ Construcci√≥n del conjunto de datos


In [None]:
library(caret)

# Crear matriz de datos con lags como predictores
data_nnet <- as.data.frame(embed(log_ap, 13))
colnames(data_nnet) <- c("y", paste0("lag", 1:12))

# Conjunto de entrenamiento (excluye los √∫ltimos 24 puntos)
train_nnet <- data_nnet[1:(nrow(data_nnet) - 24), ]

> üìå Usamos 12 lags como variables independientes, y el valor actual como variable objetivo (`y`).

---

#### ‚öôÔ∏è Definir estrategia de validaci√≥n cruzada


In [None]:
control <- trainControl(
  method = "timeslice",
  initialWindow = 96,
  horizon = 12,
  fixedWindow = TRUE
)

* Se utiliza un enfoque tipo **rolling forecasting origin**, que:

  * Mantiene una ventana de entrenamiento fija.
  * Eval√∫a el modelo en m√∫ltiples puntos del tiempo.
  * Es coherente con la estructura temporal de los datos.

---

#### üß† Entrenar la red neuronal


In [None]:
set.seed(123)
modelo_caret <- train(
  y ~ ., data = train_nnet,
  method = "nnet",
  linout = TRUE,
  trace = FALSE,
  tuneLength = 5,
  trControl = control
)

modelo_caret

* `tuneLength = 5` explora autom√°ticamente combinaciones de:

  * N√∫mero de neuronas ocultas (`size`).
  * Par√°metro de regularizaci√≥n (`decay`).
* Se selecciona el modelo con menor RMSE en validaci√≥n.

---

#### üîÆ Generar predicciones fuera de muestra


In [None]:
# √öltimos 24 registros (lagged inputs) como test
X_pred <- tail(data_nnet, 24)[, -1]

# Predicci√≥n en log-escala
pred_caret <- predict(modelo_caret, newdata = X_pred)

# Transformar a escala original
fechas_pred <- seq(as.Date("1961-01-01"), by = "month", length.out = 24)
df_pred_caret <- data.frame(
  Fecha = fechas_pred,
  Pronostico = exp(pred_caret)
)

#### üìà Visualizaci√≥n del pron√≥stico


In [None]:
ggplot() +
  geom_line(data = df_hist, aes(x = Fecha, y = Pasajeros), color = "black") +
  geom_line(data = df_pred_caret, aes(x = Fecha, y = Pronostico), color = "blue") +
  labs(title = "Pron√≥stico con red neuronal (`caret`)", y = "Pasajeros") +
  theme_minimal()

### ‚úÖ Interpretaci√≥n esperada

* El modelo se beneficia del proceso de validaci√≥n cruzada, ajustando mejor la capacidad de generalizaci√≥n.
* Sin embargo, como depende solo de rezagos, **puede fallar al capturar estacionalidad compleja** o al mantener la tendencia con precisi√≥n en el largo plazo.
* La visualizaci√≥n permite detectar **desviaciones sistem√°ticas** y comparar con pron√≥sticos anteriores (`nnet`, `nnetar`).

## üîÅ **6. Red neuronal recurrente con `RSNNS` (Elman)**

Las redes Elman son un tipo de **red neuronal recurrente (RNN)** que incorporan memoria corta mediante conexiones de retroalimentaci√≥n. Son √∫tiles para series temporales ya que pueden capturar **dependencias m√°s profundas** que los modelos feedforward.

---

#### üß† Entrenar la red Elman


In [None]:
library(RSNNS)

modelo_rsnns <- elman(
  X[train_idx, ], y[train_idx],
  size = c(5),
  learnFuncParams = c(0.1),
  maxit = 100
)

modelo_rsnns


#### üîÆ Pron√≥stico recursivo


In [None]:
pred_rsnns <- numeric(24)
input <- X[n - 24, ]

for (i in 1:24) {
  pred_rsnns[i] <- predict(modelo_rsnns, matrix(input, nrow = 1))
  input <- c(pred_rsnns[i], head(input, -1))
}


#### üìä Visualizaci√≥n


In [None]:
df_pred_rsnns <- data.frame(
  Fecha = fechas_pred,
  Pronostico = exp(pred_rsnns)
)

ggplot() +
  geom_line(data = df_hist, aes(x = Fecha, y = Pasajeros), color = "black") +
  geom_line(data = df_pred_rsnns, aes(x = Fecha, y = Pronostico), color = "darkred") +
  labs(title = "Pron√≥stico con red neuronal recurrente (`RSNNS`)", y = "Pasajeros") +
  theme_minimal()


### ‚úÖ Observaciones esperadas

* Las RNN pueden **capturar patrones de dependencia m√°s largos**, pero:

  * Requieren m√°s datos y entrenamiento m√°s prolongado.
  * Son sensibles a la inicializaci√≥n y n√∫mero de iteraciones (`maxit`).
* La red puede producir **pron√≥sticos planos** si no logra aprender la estructura estacional.

---

## üîÅ **7. Red autoregresiva con `tsDyn::nnetTs`**

`tsDyn` ofrece una forma r√°pida de ajustar redes autoregresivas con una interfaz especializada para series temporales.

---

#### üß† Ajustar la red

In [None]:
library(tsDyn)

modelo_tsDyn <- nnetTs(log_ap[1:(length(log_ap) - 24)], m = 12, size = 5)
modelo_tsDyn


#### üîÆ Generar pron√≥stico a 24 pasos

In [None]:
pred_tsDyn <- predict(modelo_tsDyn, n.ahead = 24)

df_pred_tsDyn <- data.frame(
  Fecha = fechas_pred,
  Pronostico = exp(pred_tsDyn)
)

#### üìà Visualizaci√≥n

In [None]:
ggplot() +
  geom_line(data = df_hist, aes(x = Fecha, y = Pasajeros), color = "black") +
  geom_line(data = df_pred_tsDyn, aes(x = Fecha, y = Pronostico), color = "purple") +
  labs(title = "Pron√≥stico con red neuronal autoregresiva (`tsDyn`)", y = "Pasajeros") +
  theme_minimal()

### ‚úÖ Comentarios esperados

* `tsDyn` facilita el ajuste y predicci√≥n sin pasos manuales, ideal para exploraci√≥n r√°pida.
* Puede generar **pron√≥sticos razonables**, pero **no incluye validaci√≥n cruzada ni regularizaci√≥n expl√≠cita**.
* A diferencia de `caret` o `nnetar`, **el modelo es sensible al sobreajuste y a la amplitud de los lags**.

### üí¨ Preguntas

1.  ¬øQu√© ventajas ofrece el modelo de estado espacial frente a las redes neuronales cuando se busca descomponer una serie temporal en tendencia y estacionalidad? 
2.  ¬øPor qu√© es importante aplicar la transformaci√≥n logar√≠tmica antes de ajustar redes neuronales a la serie `AirPassengers`? ¬øQu√© podr√≠a pasar si no se realiza? 
3.  En el modelo `nnetar()`, ¬øc√≥mo se interpreta la notaci√≥n NNAR(1,1,2)\[12]? ¬øQu√© representa cada n√∫mero? 
4.  ¬øCu√°l es la diferencia clave entre los pron√≥sticos generados con `nnetar()` y los obtenidos con `nnet()` manual? ¬øQu√© riesgos introduce la predicci√≥n recursiva? 
5.  ¬øQu√© rol juega la validaci√≥n cruzada tipo *rolling forecasting origin* utilizada con `caret`? ¬øEn qu√© se diferencia de una validaci√≥n cruzada tradicional? 
6.  Al comparar los resultados de `RSNNS` y `tsDyn`, ¬øpor qu√© puede fallar una red neuronal en capturar adecuadamente la estacionalidad o la tendencia, incluso si tiene una arquitectura similar a otros modelos que s√≠ lo logran? 

## üìê Modelos Aditivos Generalizados (GAMs) con `mgcv`

Los modelos GAM permiten modelar series temporales de manera **flexible y estructurada**, separando la tendencia del tiempo y la estacionalidad mediante funciones suavizadas. Esta t√©cnica es especialmente √∫til cuando no se desea imponer una estructura param√©trica r√≠gida.

---

### ‚öôÔ∏è **1. Preparaci√≥n de datos**

Transformamos la serie `AirPassengers` en un `tibble` con variables expl√≠citas para a√±o, mes, tiempo y logaritmo:



In [None]:
library(mgcv)
library(tibble)
library(dplyr)

df_ap <- tibble(
  Fecha = as.Date(as.yearmon(time(AirPassengers))),
  A√±o = as.numeric(format(Fecha, "%Y")),
  Mes = as.numeric(format(Fecha, "%m")),
  Tiempo = 1:length(AirPassengers),
  Pasajeros = as.numeric(AirPassengers),
  LogPasajeros = log(Pasajeros)
)

### üß† **2. Ajustar modelo GAM**

Usamos dos funciones suavizadas:

* `s(Tiempo)`: para capturar la **tendencia**.
* `s(Mes, bs = "cc")`: para modelar la **estacionalidad c√≠clica**.


In [None]:
modelo_gam <- gam(LogPasajeros ~ s(Tiempo, k = 20) + s(Mes, bs = "cc", k = 12),
                  data = df_ap,
                  method = "REML")

### üìã **3. Evaluar y visualizar el modelo**


In [None]:
summary(modelo_gam)

par(mfrow = c(1, 2))
plot(modelo_gam, shade = TRUE, seWithMean = TRUE)


> Verifica la **significancia de los t√©rminos suavizados**, el **R¬≤ ajustado** y la **forma de los componentes suavizados** (tendencia y estacionalidad).

---

### üßæ **4. Visualizar el ajuste**

In [None]:
df_ap$Ajuste <- fitted(modelo_gam)

ggplot(df_ap, aes(x = Fecha)) +
  geom_line(aes(y = LogPasajeros), color = "black") +
  geom_line(aes(y = Ajuste), color = "blue") +
  labs(title = "GAM: Ajuste de log(Pasajeros)",
       y = "log(Pasajeros)", x = "Fecha") +
  theme_minimal()

### üîÆ **5. Generar predicci√≥n a 24 meses**

In [None]:
# Crear nuevas fechas
ultimo_tiempo <- max(df_ap$Tiempo)
fechas_futuras <- seq(from = max(df_ap$Fecha) + 1, by = "month", length.out = 24)

# Armar data.frame de predicci√≥n
df_pred <- tibble(
  Fecha = fechas_futuras,
  Tiempo = (ultimo_tiempo + 1):(ultimo_tiempo + 24),
  Mes = as.numeric(format(fechas_futuras, "%m"))
)

# Predicci√≥n en log-escala con errores est√°ndar
pred_log <- predict(modelo_gam, newdata = df_pred, se.fit = TRUE)

# Transformar a escala original
df_pred <- df_pred %>%
  mutate(
    LogPred = pred_log$fit,
    LogLI = LogPred - 1.96 * pred_log$se.fit,
    LogLS = LogPred + 1.96 * pred_log$se.fit,
    Pred = exp(LogPred),
    LI = exp(LogLI),
    LS = exp(LogLS)
  )

### üìà **6. Visualizar predicci√≥n final**

In [None]:
ggplot() +
  geom_line(data = df_ap, aes(x = Fecha, y = Pasajeros), color = "black") +
  geom_line(data = df_pred, aes(x = Fecha, y = Pred), color = "blue") +
  geom_ribbon(data = df_pred, aes(x = Fecha, ymin = LI, ymax = LS), alpha = 0.2, fill = "blue") +
  labs(title = "Predicci√≥n a 24 meses con GAM",
       x = "Fecha", y = "Pasajeros (escala original)") +
  theme_minimal()

### ‚úÖ ¬øQu√© observamos?

* El GAM logra capturar tanto la **tendencia suave** como la **estacionalidad c√≠clica mensual**.
* Las bandas de predicci√≥n reflejan la **incertidumbre estimada** por el modelo.
* Es un modelo **explicativo e interpretable**, ideal para **an√°lisis estructural y visualizaci√≥n**, aunque limitado en tareas de forecasting puro.

## üí¨  Preguntas para discusi√≥n final del taller 

### üìå Comparaci√≥n y aplicaci√≥n de modelos

1.  ¬øCu√°l de los tres enfoques modela de forma m√°s transparente la estructura de una serie temporal? ¬øPor qu√©? 
   *(Considera descomposici√≥n expl√≠cita, interpretabilidad y flexibilidad.)*
2.  ¬øQu√© tipo de modelo usar√≠as si tuvieras una serie con cambios de r√©gimen, intervenciones o datos faltantes? Justifica tu respuesta. 
3.  Si tu objetivo principal es la precisi√≥n del pron√≥stico en el corto plazo, ¬øcu√°l modelo preferir√≠as y por qu√©? 

---

### üß† Reflexi√≥n metodol√≥gica

4.  ¬øQu√© riesgos implica utilizar pron√≥sticos recursivos con redes neuronales como `nnet()` o `RSNNS`? ¬øC√≥mo podr√≠an mitigarse? 
5.  ¬øC√≥mo se diferencia el enfoque de estacionalidad en los GAMs respecto al modelo de estado espacial y las redes neuronales autoregresivas? 
6.  ¬øCrees que combinar estos enfoques (por ejemplo, GAM + RNN o GAM + estado espacial) podr√≠a ser √∫til en alg√∫n contexto? ¬øQu√© ganar√≠as o perder√≠as con dicha combinaci√≥n? 
