# Análisis de Series Temporales

Las series de tiempo son diferentes de los problemas de modelado predictivo de regresión y clasificación más tradicionales. La estructura temporal agrega un orden a las observaciones. Este orden impuesto significa que los supuestos importantes sobre la coherencia de esas observaciones deben manejarse específicamente.
El objetivo de la predicción de series temporales es realizar predicciones precisas sobre el futuro

## Definición de serie temporal
Es una secuencia ordenada de valores de una variable en intervalos de tiempo igualmente espaciados.

<img src="images/examples_TS.png" width="700">

El análisis de series de tiempo tiene algunas cosas en común con los conceptos de probabilidad y regresión. Por ejemplo, la media \& la desviación estándar.

En muchos casos, podemos describir partes de los procesos de series de tiempo en términos de una variable aleatoria con momentos estadísticos, aunque una característica importante de muchos procesos de series de tiempo es que **su media y / o varianza cambian a lo largo del tiempo** .

La siguiente figura muestra un ejemplo en el que la media varía, pero la oscilación alrededor de la media (la desviación estándar) parece constante.

<img src="images/mean_varying.png" width="700">

Ahora, tenemos un ejemplo de una señal con media constante, cambiando su desviación estándar (Volatilidad)
<img src="images/std_varying.png" width="500">

**Pregunta**: ¿Cuál es la principal diferencia entre una serie de tiempo y un grupo de observaciones de una variable aleatoria con una media y una desviación estándar conocidas?

Podríamos describir todos estos puntos de datos utilizando una distribución estadística normal (o cualquier otra). Pero, ¿significa esto que el muestreo aleatorio de esta distribución nos da una serie de tiempo representativa?

<img src="images/TS_NormalDistribution.png" width="700">

No si el valor de $x(t)$ depende de manera significativa del valor de $x(t-1)$.

<img src="images/TS_related.png" width="700">

Al igual que la regresión, el análisis de series de tiempo a menudo se centra en identificar tendencias y patrones subyacentes, describirlos matemáticamente y, en última instancia, hacer una predicción o pronóstico sobre lo que sucederá a continuación.

La regresión puede ser útil para modelar la demanda (p. Ej., Tendencias interanuales en función del crecimiento económico, ciclos anuales en función del clima o los grados por día)

<img src="images/power_demand.png" width="600">

Mientras la regresión tiene como objetivo cuantificar los impactos específicos de variables independientes subyacentes específicas, de la forma:

$$
Y=b_{1} x_{1}+b_{2} x_{2}+b_{3} x_{3}+b_{4} x_{4}+b_{5} x_{5}
$$

El modelado de series de tiempo nos permite replicar cada elemento del proceso descomponiendo el proceso matemático en una combinación de señales (por ejemplo, crecimiento interanual de la demanda de electricidad, variabilidad estacional, etc.) y ruido (procesos probabilísticos aleatorios), sin necesariamente conociendo las causas subyacentes de cada uno.

<img src="images/clean_noisy.png" width="600">

Hay algunos términos comunes que se utilizan para describir la naturaleza tanto de la señal subyacente como del ruido de los procesos de series de tiempo:
- $\underline{\text { Momentos Estadísticos}}$: media y desviación estándar
- $\underline{\text { Stationary vs. non-stationary}}$: tendencias en media y / o desviación estándar
- $\underline{\text { Seasonality}}$: patrones periódicos
- $\underline{\text { Autocorrelation }}$: grado en el que los valores de la serie temporal en el período (t) están relacionados con los valores de la serie temporal en los períodos $(t+1, t+2, \ldots)$

## Preprocesamiento y filtrado

Una gran parte del análisis de series de tiempo implica el filtrado, es decir, cambiar los atributos de una serie de tiempo o deconstruirla en sus partes componentes. A menudo, necesitamos hacer bastante con una serie de tiempo antes de construir un modelo para simular el proceso subyacente.

Hay todo tipo de filtros que podemos aplicar a los datos de series temporales, según nuestras necesidades:

- Detrending
    - Non-stationarity
    - Seasonality
- Autocorrelación
- Valores atípicos
- Filtros "pasa baja"
    - Suavizado
        - Media móvil
        - exponencial

### Non-stationarity

¿Qué pasa si queremos estudiar cómo varían las concentraciones de $\mathrm{CO}_{2}$ durante el año, pero todo lo que tenemos son medidas de concentración durante los últimos años, que están aumentando constantemente?

<img src="images/nonstationarity.gif" width="400">

Podemos ajustar un modelo lineal a los datos usando regresión de mínimos cuadrados:
$$
\mathrm{CO}_{2}=\mathrm{b}(\text { Time })+\mathrm{C}
$$

Podemos restar esta tendencia lineal de nuestros datos originales para obtener datos de $\mathrm{CO}_{2}$ "sin tendencia", lo que da como resultado la siguiente figura:

<img src="images/leave_seasonality.gif" width="400">

### Seasonality

#### Diferenciación

Si la serie tiene una tendencia estable a largo plazo y tiende a volver a la línea de tendencia después de una perturbación, puede ser posible estacionarizarla reduciendo la tendencia (por ejemplo, ajustando una línea de tendencia y restándola antes de ajustar un modelo ). Se dice que esta serie es de tendencia estacionaria.
Sin embargo, a veces incluso la eliminación de la tendencia no es suficiente para hacer que la serie sea estacionaria, en cuyo caso puede ser necesario transformarla en una serie de diferencias de período a período y / o de temporada a temporada. Si la media, la varianza y las autocorrelaciones de la serie original no son constantes en el tiempo, incluso después de la eliminación de la tendencia, quizás las estadísticas de los cambios en la serie entre períodos o temporadas sean constantes. Se dice que una serie de este tipo es estacionaria en diferencias.

La *primera diferencia* de una serie de tiempo es la serie de cambios de un período al siguiente. Si $Y_{t}$ denota el valor de la serie de tiempo $Y$ en el período $t$, entonces la primera diferencia de $Y$ en el período $t$ es igual a $Y_{t}-Y_{t-1}$

<img src="images/difference_example.png" width="500">

Si la primera diferencia de $Y$ es estacionaria y también completamente aleatoria (no autocorrelacionada), entonces $\mathrm{Y}$ se describe mediante un "modelo de random walk": en donde cada valor es un paso aleatorio del valor anterior.

La siguiente figura muestra múltiples simulaciones de un proceso de "paseo aleatorio": $y_{t}=y_{t-1}+w_{t}$, donde $w_{t}$ es ruido blanco.

<img src="images/random_walk_sim.png" width="500">

Muchas series de tiempo muestran **seasonality** (fluctuaciones periódicas). Si la seasonality está presente, debe incorporarse a un modelo de serie temporal. **¿Cómo lo detectamos?**

<img src="images/boxplot_seasonality.gif" width="400">

#### Detrend

Asimismo, podemos restar la tendencia estacional o periódica de los datos, dejando un proceso sin tendencia.
<img src="images/subtract_detrend.png" width="900">

**Pregunta:** *¿Es este un proceso aleatorio?* (¿Podemos replicarlo simplemente tomando muestras de una distribución conocida?)

### Autocorrelación

Una de las diferencias fundamentales entre muchas series de tiempo y un muestreo aleatorio de una única distribución conocida es que las series de tiempo a menudo tienen "memoria", es decir, los valores en un período de tiempo influyen en los valores de períodos de tiempo posteriores.

Podemos cuantificar esta memoria mediante **autocorrelación**.

La función de autocorrelación se puede utilizar para los dos propósitos siguientes:

- Para detectar la no aleatoriedad en los datos.

- Identificar un modelo de serie temporal apropiado si los datos no son aleatorios

Recuerde la ecuación para describir la correlación entre dos variables aleatorias, $X$ y $Y$.

$$r_{X, Y}=\frac{\operatorname{cov}(X, Y)}{\sigma_{X} \sigma_{Y}}=\frac{E\left[\left(X-\mu_{X}\right)\left(Y-\mu_{Y}\right)\right]}{\sigma_{X} \sigma_{Y}}$$


$$r_{X, Y}=\frac{E\left[\left(X-\mu_{X}\right)\left(Y-\mu_{Y}\right)\right]}{\sigma_{X} \sigma_{Y}}=\frac{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right)}{\sqrt{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2} \sum_{i=1}^{n}\left(y_{i}-\bar{y}\right)^{2}}}
$$

La ecuación para la autocorrelación parece bastante similar: solo estamos midiendo la correlación entre una serie de tiempo y ella misma, en diferentes "retrasos" (cambios en el tiempo).
Dadas las medidas, $Y_{1}, Y_{2}, \ldots, Y_{N}$ en el tiempo $t_{1}, t_{2}, \ldots, t_{N}$, la autocorrelación para un rezago de $\boldsymbol{k}$ es:

$$
r_{k}=\frac{\sum_{i=1}^{N-k}\left(Y_{i}-\bar{Y}\right)\left(Y_{i+k}-\bar{Y}\right)}{\sum_{i=1}^{N}\left(Y_{i}-\bar{Y}\right)^{2}}
$$

<img src="images/autocorrelation_comp.png" width="600">

Podemos probar la autocorrelación con tantos retrasos (lags) como queramos, dependiendo de la duración de la serie de tiempo. Entonces podemos graficar la autocorrelación en función del retraso.

<img src="images/autocorrelation_vs_k.png" width="500">

**¿Qué nos dice esto?**

Si eliminamos todos los elementos de "señal" (tendencias, periodicidad, autocorrelación), ¿qué nos queda? Ruido blanco.

El ruido blanco es un proceso aleatorio, cuyas muestras se consideran una secuencia de variables aleatorias no correlacionadas en serie con media cero y varianza finita. Eso significa que podemos replicar su naturaleza simplemente tomando muestras de una distribución estadística apropiada con reemplazo.

<img src="images/distribution_TS.png" width="700">

### Suavizado

El suavizado es una forma de filtrado que produce una serie temporal en la que se reduce la importancia de los componentes espectrales a altas frecuencias. Los ingenieros eléctricos llaman a este tipo de filtro un filtro pasa bajas porque se permite que las variaciones de baja frecuencia "atraviesen" el filtro. En un filtro pasa bajas, las ondas de baja frecuencia (período largo) apenas se ven afectadas por el suavizado.

<img src="images/smoothing_example.png" width="500">

Un filtro estadístico, o filtro digital, es una serie de ponderaciones que cuando se multiplican acumulativamente por valores consecutivos de una serie de tiempo da la serie filtrada. La serie de pesos a veces se denomina función de filtrado o simplemente filtro.

El funcionamiento del filtrado se ilustra en la siguiente tabla.

$$
\begin{array}{cccc} 
& & \text { Time } & \text { Filtered } \\
\text { Year } & \text { Filter } & \begin{array}{c}
\text { Series } \\
\end{array} & \text { Values } \\ \hline
1 & & 12 & \\
2 & \color{red}{.25 \mathrm{x}} & 17 & 14.00 \\
3 & \color{red}{.50 \mathrm{x}} & 10 & 14.75 \\
4 & \color{red}{.25 \mathrm{x}} & 22 & 17.25 \\
5 & & 15 & 15.75 \\
6 & & 11 & 13.75 \\
7 & & 18 & 18.50 \\
8 & & 27 & 21.50 \\
9 & & 14 &
\end{array}
$$

El filtro procede deslizándose a lo largo de la serie de tiempo un valor a la vez, calculando cada vez un producto acumulativo.

Los filtros de suavizado se pueden diseñar de muchas formas diferentes. Por ejemplo:
<img src="images/another_examples_smoothing.png" width="600">

Un problema logístico que hay con el suavizadoes que se pierden datos. Puede (si lo desea) reemplazar los puntos de datos perdidos al filtrar de varias formas:

<img src="images/smooth_loose.png" width="600">

**Pregunta**: Entonces, ¿por qué hacer esto en primer lugar?

<img src="images/reason_smoothing.png" width="600">

## Algunas aplicaciones de TSA

Aplicaciones: 

El objetivo al usar modelos de series temporales es doble:
1. Obtener una comprensión de las fuerzas y la estructura subyacentes que produjeron los datos observados.
2. Ajustar un modelo y proceder a la previsión, seguimiento o incluso retroalimentación y control anticipado.
El modelado de series temporales se utiliza para muchas aplicaciones como:
- Proyecciones económicas
- Pronóstico de ventas
- Análisis presupuestario
- Análisis del mercado de valores
- Proyecciones de rendimiento
- Control de procesos y calidad
- Estudios de inventario
- Proyecciones de carga de trabajo
- Estudios de utilidad
- Análisis del censo

## Modelado de series temporales

Hemos analizado varios elementos diferentes de series de tiempo que, según la aplicación, es posible que deban incluirse en un buen modelo de series de tiempo.
- Autocorrelación
- Seasonality
- Tendencias
- Componente aleatorio (ruido)

Un tipo de modelo que es capaz de capturar procesos autocorrelacionados con componentes aleatorios es un **modelo autorregresivo (AR)**.

### Modelo autorregresivo (AR)

La estructura de un modelo AR (1) está dada por

$$
y_{t}=B_{0}+B_{1} y_{t-1}+w_{t}
$$

Donde $y_{t}$ es la serie de tiempo que está modelando, $w_{t}$ es ruido blanco, y en este modelo de regresión, la variable de respuesta en el período de tiempo anterior $\left(y_{t-1}\right)$ se ha convertido en el predictor y los errores $\left(w_{t}\right)$ tienen nuestras suposiciones habituales sobre errores en una regresión lineal simple modelo (es decir, están distribuidos normalmente)

El **orden** de un modelo autorregresivo (AR) es el número de valores inmediatamente anteriores en la serie que se utilizan para predecir el valor en el momento actual. Entonces, el modelo anterior es una autorregresión de primer orden, escrito como **AR (1)**.

Si queremos predecir $y$ este año $\left(y_{t}\right)$ usando medidas de temperatura global en los dos años anteriores $\left(y_{t-1}, y_{t-2}\right)$, entonces el modelo autorregresivo para hacerlo sería:

$$
y_{t}=B_{0}+B_{1} y_{t-1}+B_{2} y_{t-2}+w_{t}
$$

Este modelo es una autorregresión de segundo orden, escrito como **AR (2)**, ya que el valor en el tiempo $\left(y_{t}\right)$ se predice a partir de los valores en los tiempos $(t-1)$ y $(t-2)$. De manera más general, una autorregresión de k-ésimo orden, escrita como **AR (k)**, es una regresión lineal múltiple en la que el valor de la serie en cualquier momento $t$ es una función (lineal) de los valores en veces $t-{1}, {t}-{2}, \ldots, {t}-{k}$.

#### Elección del orden para un modelo autorregresivo

¿Cómo sabemos qué orden elegir $(\mathbf{k})$ para un modelo autorregresivo?

Recuerde la ecuación para la función de autocorrelación:

Dadas las medidas, $Y_{1}, Y_{2}, \ldots, Y_{N}$ en el tiempo $t_{1}, t_{2}, \ldots, t_{N}$, la autocorrelación para un retraso de $k$ es:

$$
r_{k}=\frac{\sum_{i=1}^{N-k}\left(Y_{i}-\bar{Y}\right)\left(Y_{i+k}-\bar{Y}\right)}{\sum_{i=1}^{N}\left(Y_{i}-\bar{Y}\right)^{2}}
$$

Cuando graficamos la función de autocorrelación (ACF) (coeficientes de correlación $\boldsymbol{r}_{\boldsymbol{k}}$ en función de lag $\mathrm{k}$), a menudo obtenemos algo que se ve así, que muestra la "memoria" del proceso de series de tiempo decayendo con el tiempo.

<img src="images/autocorrelation_vs_k.png" width="500">

#### Función de autocorrelación parcial (PACF)

Una medida relacionada es una función de autocorrelación parcial de series de tiempo (PACF). La autocorrelación parcial en el retardo $\mathrm{k}$ es la autocorrelación entre ${y}_{{t}}$ y ${y}_{{t}-{k}}$ que no se explica por los retardos de $1$ a $\mathrm{k}-1$.

Es de esperar que tenga sentido que en un proceso de series de tiempo autocorrelacionado, la correlación entre ${y}_{{t}}$ y ${y}_{{t}-{k}}$ esté influenciada por la correlación entre ${y}_{{t}}$ y $y_{t-1}, y_{t}$ y $y_{t-2}, y_{t}$ y $y_{t-3}, \ldots$ y así sucesivamente.

El PACF es una forma de eliminar esos efectos intermedios y aislar la parte del retraso entre $y_{t}$ y $y_{t-k}$ que no depende de otros pasos de tiempo.

Específicamente, las autocorrelaciones parciales son **útiles para identificar el orden (k) de un modelo autorregresivo**.

En teoría, la autocorrelación parcial de un proceso $\mathrm{AR}(\mathrm{k})$ debería ser cero en el retardo $k+1$ y mayor.

Si la gráfica de autocorrelación indica que un modelo AR puede ser apropiado, entonces se examina la gráfica de autocorrelación parcial de muestra para ayudar a identificar el orden. Buscamos el punto en la gráfica donde las autocorrelaciones parciales esencialmente se vuelven cero.

##### Ejemplo: datos de precios de acciones de Google
<img src="images/google-stock-price.png" width="500">

Podemos trazar el *diagrama de dispersión* de $y_t$ y $y_{t-1}$:

<img src="images/google-stock-price-lag0-lag1.png" width="500">

Ahora analizaremos las gráficas de autocorrelación y autocorrelación parcial.

<img src="images/google-stock-price-ACF-PACF.png" width="800">

**Pregunta:** ¿Cuáles son las conclusiones de los gráficos anteriores?

La gráfica de las autocorrelaciones (izquierda) definitivamente exhibe un patrón no aleatorio y los valores altos en rezagos anteriores sugieren un modelo autorregresivo. Dado que los valores son tan altos para tantos valores más bajos de retraso, también examinamos la gráfica de autocorrelaciones parciales (derecha). Aquí notamos que hay un pico significativo en un retraso de 1 y picos mucho más bajos para los retrasos posteriores. Por lo tanto, un modelo AR (1) probablemente sería factible para este conjunto de datos.

### Moving Average (MA) Model

Otro enfoque común para modelar modelos de series de tiempo univariantes es el modelo de media móvil (MA). Un término de media móvil en un modelo de serie temporal es un error pasado (multiplicado por un coeficiente).

Sea $w_{t} \sim N\left(0, \sigma_{w}^{2}\right)$, lo que significa que $w_{t}$ se distribuyen de forma idéntica e independiente, cada una con una distribución normal que tiene una media de 0 y la misma varianza. Un modelo de promedio móvil de primer orden $\mathrm{MA}(1)$ es:

$$
Y_{t}=\mu+w_{t}+\theta_{1} w_{t-1}
$$

Un modelo de media móvil de segundo orden $\mathrm{MA}(2)$ es:

$$
Y_{t}=\mu+w_{t}+\theta_{1} w_{t-1}+\theta_{2} w_{t-2}
$$

Un modelo de media móvil de orden ${q}^{\text {th }}$ $\mathrm{MA}(\mathrm{q})$ es:

$$
Y_{t}=\mu+w_{t}+\theta_{1} w_{t-1}+\theta_{2} w_{t-2} \ldots+\theta_{q} w_{t-q}
$$

Las siguientes son las **propiedades teóricas de una serie de tiempo con un modelo MA (1)**:

- La media es $\mathrm{E}\left[y_{t}\right]=\mu$
- La varianza es $\operatorname{Var}\left(y_{t}\right)=\sigma_{W}^{2}\left(1+\theta_{1}^{2}\right)$
- La función de autocorrelación (ACF) es:
$\rho_{1}=\frac{\theta_{1}}{1+\theta_{1}^{2}}$ y $\rho_{h}=0$ para $h \geq 2$

Tenga en cuenta que el *único valor distinto de cero* en el ACF teórico es para el retraso 1. Todas las demás autocorrelaciones son 0. Por lo tanto, un ACF con una autocorrelación significativa solo en el retraso 1 es un indicador de un posible modelo MA (1).

Asimismo, un ACF con una autocorrelación significativa en los retrasos 1 y 2 es un indicador de un posible modelo MA (2).

##### Ejemplo de modelo de media móvil (MA)

Suponga que un modelo MA (1) es:

$$
y_{t}=10+w_{t}+0.7 w_{t-1}
$$

Sea $w_{t} \sim N(0,1)$ (distribución normal con media $=0$ y varianza $=1$). Eso significa $\mu=10$ y $\theta_{1}=0.7$.

El ACF teórico viene dado por: $\rho_{1}=\frac{0.7}{1+0.7^{2}}=.4698$ y $\rho_{h}=0$ para $h \geq 2$

Además, la gráfica teórica del ACF para el proceso MA (1) anterior es:

<img src="images/theoretical_ACF.gif" width="400">

En la práctica, una muestra no suele proporcionar un patrón de autocorrelación tan claro. Podemos simular valores de muestra aleatorios de $n=100$ usando el modelo $y_{t}=10$ $+w_{t}+.7 w_{t-1}$ donde $w_{t} \sim N(0,1)$

Para esta simulación, sigue una gráfica de series de tiempo de los datos de muestra. No podemos decir mucho de esta trama.

<img src="images/practical_ACF.gif" width="400">

A continuación, se muestra el ACF de muestra para los datos simulados. Vemos un "pico" en el retraso 1 seguido de valores generalmente no significativos para los retrasos más allá del 1. Tenga en cuenta que el ACF de muestra no coincide con el patrón teórico del $\mathrm{MA}(1)$ subyacente, que es que todas las autocorrelaciones para los retrasos después de 1 serán 0. Una muestra diferente tendría un ACF de muestra ligeramente diferente que se muestra a continuación, pero probablemente tendría las mismas características generales.

<img src="images/simulated_ACF.gif" width="400">

**Por lo tanto, de manera similar a como usamos la función de autocorrelación parcial para obtener el orden correcto para un modelo AR, usamos la función de autocorrelación para obtener el orden correcto para un modelo MA.**

### ARIMA models

<img src="images/ARIMA_diagram.png" width="700">

Los modelos ARIMA, también llamados modelos Box-Jenkins, son modelos que posiblemente pueden incluir términos autorregresivos, términos de promedio móvil y "operaciones de diferenciación". Se utilizan varias abreviaturas:

- Cuando un modelo **solo incluye términos autorregresivos**, puede denominarse modelo AR. Cuando un modelo **solo implica términos de media móvil**, se puede denominar modelo MA.

- **Cuando no se trata de diferenciación**, se puede utilizar la abreviatura ARMA.

En la mayoría de las librerías, **los elementos del modelo se especifican en el orden $(\mathrm{AR}$, diferenciación, orden MA)**.

- Un modelo con (solo) dos términos AR se especificaría como un ARIMA de orden $(2,0,0)$

- Un modelo MA (2) se especificaría como un ARIMA de orden $(0,0,2)$.

- Un modelo con un término AR, una primera diferencia y un término MA tendría el orden $(1,1,1)$

##### Identificación de la estructura de un posible modelo

Se deben considerar tres elementos para determinar una primera estimación de un modelo ARIMA:

1. Una gráfica de series de tiempo de los datos
2. El ACF
3. Y el PACF

##### Gráfico de series de tiempo de la serie observada.

Si hay una tendencia lineal hacia arriba o hacia abajo obvia, puede ser necesaria una des-tendencia lineal de la primera diferencia. Los datos también se pueden suavizar si es necesario.

### Algunos consejos para elegir una estructura de modelo basada en PACF y ACF

Primero: si todas las autocorrelaciones no son significativas, entonces la serie es aleatoria (ruido blanco; el orden es importante, pero los datos son independientes y están distribuidos de manera idéntica). Ha terminado en ese punto.

##### Ejemplo: AR (1)
Los modelos AR tienen PACF teóricos con valores distintos de cero en los términos AR en el modelo y valores cero en otros lugares. El ACF se reducirá a cero de alguna manera.

<img src="images/example_AR1.png" width="400">

##### Ejemplo AR (2)
Un AR (2) tiene un ACF sinusoidal que converge a 0.

<img src="images/example_AR2.png" width="400">

##### Ejemplo MA (1)

Los modelos MA tienen ACF teóricos con valores distintos de cero en los términos MA en el modelo y valores cero en otros lugares.

<img src="images/example_MA1.png" width="400">

##### Ejemplo ARMA (1,1)

Los modelos ARMA (incluidos los términos AR y MA) tienen ACF y PACF que se reducen a 0. Estos son los más complicados porque el orden no será particularmente obvio. Básicamente, solo tiene que adivinar que es posible que se necesiten uno o dos términos de cada tipo y luego ver qué sucede cuando estima el modelo.

<img src="images/example_ARMA11.png" width="400">

##### Algunos consejos adicionales

- Si el ACF y el PACF no se reducen, sino que tienen valores que permanecen cerca de 1 durante muchos retrasos, la serie no es estacionaria y se necesitará diferenciar. **Pruebe una primera diferencia** y luego observe el ACF y PACF de los datos diferenciados.

- Si ha tomado las primeras diferencias y todas las autocorrelaciones no son significativas, entonces la serie se llama **caminata aleatoria** y ya está.

- Un modelo posible para una caminata aleatoria es $y_{t}=y_{t-1}+w_{t}$ (sin deriva) o $y_{t}=\alpha+y_{t-1}+w_{t}$ (con deriva $\boldsymbol{\alpha}$) Los datos son dependientes y no están distribuidos de manera idéntica; de hecho, tanto la media como la varianza aumentan con el tiempo.

### Ajuste del modelo

Los coeficientes del modelo para un modelo AR, MA o ARMA se estiman mediante métodos de máxima verosimilitud (no entraremos en detalle, es similar a lo que hemos visto en temas anteriores, pueden leerlo en las referencias). usted).

La esencia es que queremos encontrar los coeficientes a continuación que minimicen el valor al cuadrado de todos los términos de "error" o ruido blanco. $\left(\sum_{t=1}^{n} w_{t}\right)$

<img src="images/model_fitting.png" width="400">

## Referencias

- https://www.itl.nist.gov/div898/handbook/pmc/section4/pmc4.htm

- https://online.stat.psu.edu/stat510/

