# Estacionariedade em Séries Temporais 

Componentes de uma série temporal:

- Tendência: Uma tendência existe quando há um aumento ou diminuição de longo prazo nos dados. Não precisa ser linear. Às vezes, nos referiremos a uma tendência como “mudança de direção”, quando ela pode passar de uma tendência crescente para uma tendência decrescente.

- Sazonalidade: Um padrão sazonal ocorre quando uma série temporal é afetada por fatores sazonais, como a época do ano ou o dia da semana. A sazonalidade é sempre de um período fixo e conhecido.

- Ciclo e o Termo de erro: Um ciclo ocorre quando os dados exibem aumentos e quedas que não são de uma frequência fixa. Essas flutuações geralmente são devidas a condições econômicas e geralmente estão relacionadas ao “ciclo de negócios”. A duração dessas flutuações é geralmente de pelo menos 2 anos.

Quando decompomos uma série temporal em componentes, geralmente combinamos a tendência e o ciclo em um único componente de ciclo de tendência (geralmente chamado apenas de tendência para simplificar).

Assim, podemos pensar em uma série temporal como compreendendo três componentes: um componente de ciclo de tendência, um componente sazonal e um componente restante/termo de erro, em que este último representa qualquer outra coisa na série temporal, além dos outros componentes.

$$ y_t = \ S_t +  \ T_t  +  \ R_t $$


Onde, no tempo t, y_t é uma série temporal, \ T_t é uma tendência, \ S_t é um efeito sazonal e \ R_t é um termo de erro.

Alternativamente, temos a decomposição multiplicativa:

$$ y_t = \ S_t  \cdot  \ T_t  \cdot  \ R_t $$

A decomposição aditiva é a mais adequada se a magnitude das flutuações sazonais, ou a variação em torno do ciclo de tendência, não varia com o nível da série temporal.

Quando a variação no padrão sazonal, ou a variação em torno do ciclo de tendência, parece ser proporcional ao nível da série temporal, então uma decomposição multiplicativa é mais apropriada. Decomposições multiplicativas são comuns em séries temporais econômicas.

# Tipos de processos
Ao avaliar um processo, devemos ter em mente qual o comportamento de suas distribuição, e portanto, das funções da distribuição:

1) Função da média: 

$$ u_t = E[y_t] $$

2) Função da Variância:
$$ \sigma^2 = Var[y_t] $$

3) Função da autocovariância/autocorrelação

$$ \gamma = \mathbb{E}[(y_t - \mu)(y_{t-k} - \mu)] \quad \rho = \frac{\gamma}{\sigma^2} $$

# Processos Estacionários

Uma série temporal estacionária é aquela cujas propriedades estatísticas não dependem do momento em que a série é observada. Portanto, séries temporais com tendências ou sazonalidades não são estacionárias - a tendência e a sazonalidade afetarão o valor da série temporal em momentos diferentes.

Por outro lado, uma série de ruído branco é estacionária - não importa quando você a observe, ela deve parecer muito semelhante em qualquer ponto no tempo.

Alguns casos podem ser confusos - uma série temporal com comportamento cíclico (mas sem tendência ou sazonalidade) é estacionária. Isso ocorre porque os ciclos não têm um comprimento fixo, portanto, antes de observarmos a série, não podemos ter certeza de onde estarão os picos e vales dos ciclos.

Em geral, uma série temporal estacionária não terá padrões previsíveis a longo prazo. Os gráficos das séries mostrarão que a série é aproximadamente horizontal (embora algum comportamento cíclico seja possível), com variância constante.

A estacionariedade descreve o conceito de que a forma como uma série temporal está se alterando permanecerá a mesma no futuro. Em termos matemáticos, uma série temporal é estacionária quando suas propriedades estatísticas são independentes do tempo:

- Média constante;

- Variância constante;

- Covariância é independente do tempo.

Outro tipo de estacionariedade é a estacionariedade estrita, que implica que amostras de tamanho idêntico têm distribuições idênticas. Como a estacionariedade estrita é restritiva é rara, concentraremos apenas na estacionariedade no sentido amplo.

Alguns modelos de previsão de séries temporais (por exemplo, modelos autorregressivos) requerem uma série temporal estacionária, pois são mais fáceis de modelar devido às suas propriedades estatísticas constantes. Portanto, é recomendado tornar a série temporal estacionária caso ela não seja.

# Processos Não Estacionários

Um processo estocástico é considerado não estacionário se suas propriedades estatísticas variarem ao longo do tempo. Isso pode incluir tendências, flutuações sazonais ou mudanças estruturais.

Um processo não estacionário pode apresentar média e/ou variância que mudam ao longo do tempo, tornando suas propriedades estatísticas dependentes do tempo. Esses processos são mais complexos de modelar e prever, uma vez que suas características estatísticas estão em constante evolução.

# Como verificar a estacionariedade?

Uma raiz unitária é uma tendência estocástica, isto é, um passeio aleatório com drif. Como o comportamento aleatório não pode ser previsto, isso significa:

- Presença de raiz unitária: não estacionária (imprevisível);

- Ausência de raiz unitária: estacionária.

Existem vários testes de raiz unitária que você pode usar para verificar a estacionariedade, dentre eles temos: 

- Teste de Dickey-Fuller Aumentado (ADF);

- Teste de Kwiatkowski-Phillips-Schmidt-Shin (KPSS).

# Teste de Dickey-Fuller Aumentado

As hipóteses para o teste de Dickey-Fuller Aumentado (ADF) são:

- Hipótese nula (H0): A série temporal não é estacionária porque há uma raiz unitária (se o valor-p > 0,05);

- Hipótese alternativa (H1): A série temporal é estacionária porque não há raiz unitária (se o valor-p ≤ 0,05).


In [1]:
# Importar bibliotecas
import numpy as np
from bcb import sgs
import statsmodels.api as sm
from statsmodels.tsa.stattools import adfuller
from statsmodels.tsa.stattools import kpss

In [2]:
tabela = sgs.get(
    codes = {"selic": 4390,
             "ipca": 433},
    start = "2005-01-01",
    end= "2024-06-06"
).dropna()
tabela

Unnamed: 0_level_0,selic,ipca
Date,Unnamed: 1_level_1,Unnamed: 2_level_1
2005-01-01,1.38,0.58
2005-02-01,1.22,0.59
2005-03-01,1.53,0.61
2005-04-01,1.41,0.87
2005-05-01,1.50,0.49
...,...,...
2023-12-01,0.89,0.56
2024-01-01,0.97,0.42
2024-02-01,0.80,0.83
2024-03-01,0.83,0.16


In [5]:
# Realizar o teste ADF
adf_ipca_ct = adfuller(tabela["ipca"], maxlag = 3, regression = "ct")

In [6]:
# Imprimir valores
print("Teste ADF com drift e tendência do IPCA")
print("Estatística do teste: ", adf_ipca_ct[0])
print("Valor Crítico:")
for key, value in adf_ipca_ct[4].items():
    print(key, ": ", value)


Teste ADF com drift e tendência do IPCA
Estatística do teste:  -7.795622963132762
Valor Crítico:
1% :  -3.998504541286253
5% :  -3.429669078807414
10% :  -3.1383184448027004


In [7]:
# Realizar o teste ADF
adf_selic_ct = adfuller(tabela["selic"], maxlag = 3, regression = "ct")

In [9]:
# Imprimir valores
print("Teste ADF com drift e tendência da SELIC")
print("Estatística do teste: ", adf_selic_ct[0])
print("Valor Crítico:")
for key, value in adf_selic_ct[4].items():
    print(key, ": ", value)


Teste ADF com drift e tendência da SELIC
Estatística do teste:  -2.3333739414154917
Valor Crítico:
1% :  -3.9990347583703216
5% :  -3.4299237913352556
10% :  -3.138467743111241
