# Técnicas de Previsão de Séries Temporais

Imagine que você seja solicitado a analisar dados climáticos. Seu empregador pediu que você criasse um modelo para prever a temperatura de amanhã.

* O que teria maior poder explicativo sobre o clima de amanhã?
    - Hoje?

In [None]:
import pandas as pd
import statsmodels.api as sm

# Carrega o conjunto de dados Vega
df = pd.read_csv("https://raw.githubusercontent.com/stanfordnlp/plot-interface/master/public/data/sf-temps.csv")

# Define a data como índice
df['date'] = pd.to_datetime(df['date'])
df.set_index('date', inplace=True)


# Calcula a temperatura média mensal
monthly_avg_temp = df.resample('M').mean()
monthly_avg_temp = monthly_avg_temp.diff()
monthly_avg_temp = monthly_avg_temp.dropna()
# Exibe as primeiras linhas da temperatura média mensal
monthly_avg_temp.plot()


df = monthly_avg_temp

In [None]:
from statsmodels.tsa.ar_model import AutoReg

# Garante que os dados sejam apropriados para a modelagem
df['temp'] = df['temp'].dropna()  # Remove quaisquer valores ausentes

# Ajusta um Modelo Autorregressivo (modelo AR)
ar_model = AutoReg(df['temp'], lags=3)
ar_result = ar_model.fit()

print(ar_result.summary())

# Modelos Autorregressivos (AR)

## O que é um Modelo AR?
- Um **modelo autorregressivo (AR)** é um tipo de modelo estatístico usado para previsão em dados de séries temporais.
- Ele prevê o comportamento futuro com base no comportamento passado.
- O modelo é denominado "autoregressivo" porque regride a variável em relação a si mesma.

## Formulação de um Modelo AR
- O modelo AR é definido como:

$
Y_t = c + x_1 Y_{t-1} + x_2 Y_{t-2} + ... + x_p Y_{t-p} + \epsilon_t$

onde,
- $Y_t$ é o valor no instante \( t \),
- $c$ é uma constante,
- $x_1, x_2, ..., x_p$ são os parâmetros do modelo,
- $p$ é a ordem do modelo AR,
- $\epsilon_t$ é o ruído branco.

## Médias Móveis

Agora imagine que você está tentando entender o tempo e prever como estará amanhã. Uma maneira de fazer isso é observar como o tempo mudou nos últimos dias. O modelo de Média Móvel (MM) faz algo semelhante com os dados.

Em um modelo de MM, em vez de olhar diretamente para os dados em si (como a temperatura diária), observamos os "erros" cometidos em previsões anteriores. "Erro" aqui significa o quanto erramos em nossas previsões anteriores. Por exemplo, se previmos que a temperatura de ontem seria de 21°C, mas na verdade foi de 22°C, o erro é de 0°C.

O modelo de MM diz que a melhor previsão para a temperatura de hoje é uma combinação desses erros passados. Então, é como dizer: "Sei que errei alguns graus nos últimos dias, deixe-me usar essa informação para fazer uma estimativa melhor hoje."

In [None]:
### O modelo MA em ação

ma_model = sm.tsa.ARIMA(df['temp'], order=(0, 0, 1))
ma_result = ma_model.fit()

# Exibe o resumo do modelo MA
print(ma_result.summary())

# Modelos de Média Móvel (MM)

## O que é um Modelo de MM?

- Um **modelo de Média Móvel (MM)** é uma abordagem estatística usada para prever dados de séries temporais.
- Ele prevê valores futuros com base nos erros (diferenças entre os valores reais e previstos) de previsões passadas.

## Como funciona?
- Em vez de usar valores passados ​​da série diretamente, o modelo de MM utiliza os erros de previsão passados.
- Um erro de previsão é a diferença entre o valor real e o valor previsto em um ponto no tempo anterior.

## Formulação do Modelo
- O modelo de MA é definido como:

$Y_t = \mu + ε_t + θ_1 ε_{t-1} + θ_2 ε_{t-2} + ... + θ_q ε_{t-q}$

onde,
- $Y_t$ é o valor no instante $t$,
- $\mu$ é a média da série,
- $ε_t$ é o erro de previsão no instante `t`,
- $θ_1, θ_2, ..., θ_q$ são os parâmetros do modelo,
- $q$ é a ordem do modelo de MA.

In [None]:
# Carrega o conjunto de dados Vega
df = pd.read_csv("https://raw.githubusercontent.com/stanfordnlp/plot-interface/master/public/data/co2-concentration.csv")

# Definir a data como índice
df['Date'] = pd.to_datetime(df['Date'])
df.set_index('Date', inplace=True)

# Calcular a temperatura média mensal
monthly_avg_co = df.resample('M').mean()

# Exibir as primeiras linhas da temperatura média mensal
monthly_avg_co = monthly_avg_co.diff()


In [None]:
monthly_avg_co.plot()

In [None]:
### O modelo MA em ação

ma_model = sm.tsa.ARIMA(monthly_avg_co['CO2'], order=(1, 0, 1))
ma_result = ma_model.fit()

# Exibe o resumo do modelo MA
print(ma_result.summary())

In [None]:
### O modelo MA em ação

ma_model = sm.tsa.ARIMA(monthly_avg_co['CO2'], order=(2, 0, 1))
ma_result = ma_model.fit()

# Exibe o resumo do modelo MA
print(ma_result.summary())

## Modelos de Média Móvel Integrada Autorregressiva (ARIMA)

Agora podemos falar sobre os dois modelos e combiná-los. Ou seja, podemos modelar tanto o termo de erro quanto a média móvel.

In [None]:
import pandas as pd

# Carrega o conjunto de dados Vega
df = pd.read_csv("https://raw.githubusercontent.com/stanfordnlp/plot-interface/master/public/data/co2-concentration.csv")

# Definir a data como índice
df['Date'] = pd.to_datetime(df['Date'])
df.set_index('Date', inplace=True)

# Calcula a temperatura média mensal
monthly_avg_co = df.resample('M').mean()

# Exibe as primeiras linhas da temperatura média mensal
monthly_avg_co = monthly_avg_co.diff()


In [None]:
import statsmodels.api as sm


ma_model = sm.tsa.ARIMA(monthly_avg_co['CO2'], order=(1, 0, 1))
ma_result = ma_model.fit()

# Exibe o resumo do modelo MA
print(ma_result.summary())

# ARIMA Sazonal (SARIMA)

In [None]:
import pandas as pd
import statsmodels.api as sm

# Carrega o conjunto de dados Vega
df = pd.read_csv("https://raw.githubusercontent.com/stanfordnlp/plot-interface/master/public/data/co2-concentration.csv")

# Define a data como índice e converter para data e hora
df['Date'] = pd.to_datetime(df['Date'])
df.set_index('Date', inplace=True)

# Reamostra para média mensal e calcula a primeira diferença para torná-la estacionária
monthly_avg_co = df.resample('M').mean()
monthly_avg_co_diff = monthly_avg_co.diff().dropna()

In [None]:
df.plot()

In [None]:

# Defina o modelo SARIMA - ajuste os parâmetros p, d, q e seasonal_order conforme necessário
# Parâmetros de exemplo: p=1, d=1, q=1 para a parte não sazonal;
# P=1, D=1, Q=1, s=12 para a parte sazonal (assumindo sazonalidade anual)
model = sm.tsa.SARIMAX(monthly_avg_co_diff, 
                       order=(2, 1, 1), 
                       seasonal_order=(1, 1, 1, 12))

# Ajuste o modelo
sarima_result = model.fit()

# Exiba o sumário do modelo
print(sarima_result.summary())
