In [41]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import statsmodels.api as sm

#### Função `testar_estacionariedade_serie_temporal`

Testa a estacionariedade de uma série temporal usando o teste Augmented Dickey-Fuller (ADF).

Parâmetros:
    - `dataframe`: DataFrame contendo a série temporal.
    - `coluna_serie_temporal`: Nome da coluna contendo os valores da série temporal.
    - `alpha`: Nível de significância para o teste ADF (valor crítico para rejeição da hipótese nula).

Retorna:
    - `True` se a série for estacionária (hipótese nula rejeitada), `False` caso contrário.


obs: retirada de vazao-predicao.ipynb

In [42]:
def testar_estacionariedade_serie_temporal(dataframe, coluna_serie_temporal, alpha=0.05):
    """
    Testa a estacionariedade de uma série temporal usando o teste Augmented Dickey-Fuller (ADF).
    
    Parâmetros:
    - dataframe: DataFrame contendo a série temporal.
    - coluna_serie_temporal: Nome da coluna contendo os valores da série temporal.
    - alpha: Nível de significância para o teste ADF (valor crítico para rejeição da hipótese nula).

    Retorna:
    - True se a série for estacionária (hipótese nula rejeitada), False caso contrário.
    """
    fraction = 0.10

    sampled_df = dataframe.sample(frac=fraction, random_state=42)

    # Realiza o teste ADF
    resultado_teste = sm.tsa.adfuller(sampled_df[coluna_serie_temporal], autolag='AIC')

    # Extrai o valor-p do resultado do teste
    p_valor = resultado_teste[1]

    # Compara o valor-p com o nível de significância (alpha)
    if p_valor <= alpha:
        return True  # A série é estacionária
    else:
        return False  # A série não é estacionária

In [43]:
# Série temporal estacionária
np.random.seed(42)  # Para garantir a reprodutibilidade dos resultados
data_estacionaria = pd.Series(np.random.normal(loc=0, scale=1, size=100))

# DataFrame com série temporal estacionária
df_estacionario = pd.DataFrame({'Estacionario': data_estacionaria})
print("Série temporal estacionária:")
print(df_estacionario)

Série temporal estacionária:
    Estacionario
0       0.496714
1      -0.138264
2       0.647689
3       1.523030
4      -0.234153
..           ...
95     -1.463515
96      0.296120
97      0.261055
98      0.005113
99     -0.234587

[100 rows x 1 columns]


In [44]:
testar_estacionariedade_serie_temporal(df_estacionario, 'Estacionario')

True

In [45]:
# Série temporal não estacionária
np.random.seed(100)  # Outra semente para dados diferentes
data_nao_estacionaria = pd.Series(np.arange(100) + np.random.normal(loc=0, scale=1, size=100))

# DataFrame com série temporal não estacionária
df_nao_estacionario = pd.DataFrame({'NaoEstacionario': data_nao_estacionaria})
print("\nSérie temporal não estacionária:")
print(df_nao_estacionario)


Série temporal não estacionária:
    NaoEstacionario
0         -1.749765
1          1.342680
2          3.153036
3          2.747564
4          4.981321
..              ...
95        95.003017
96        95.923977
97        97.003958
98        97.814986
99        96.512848

[100 rows x 1 columns]


In [46]:
testar_estacionariedade_serie_temporal(df_nao_estacionario, 'NaoEstacionario')

False