# Séries Temporais

Escolhendo o Melhor Método


Padrões Lineares Simples: ARIMA ou Exponential Smoothing.


Padrões Lineares com Sazonalidade: SARIMA ou ETS.


Padrões Não Lineares: Modelos de árvore de decisão como Random Forest ou XGBoost.


Dependências de Longo Prazo: LSTMs ou Transformers.


Fatores Exógenos Complexos: XGBoost, LightGBM ou Redes Neurais.


Recomendado testar diferentes modelos, usar validação cruzada e métricas como MAE (Mean Absolute Error) ou RMSE (Root Mean Squared Error) para avaliar o desempenho.

# 1. Modelos Estatísticos Clássicos

## ARIMA (AutoRegressive Integrated Moving Average)
Quando usar: Se os dados têm uma tendência linear ou sazonalidade. ARIMA é útil para séries temporais estacionárias (dados flutuam em torno de uma mesma média e variância). *Se não for estacionário, usar o parâmetro *d* para aplicar diferenciação. 

**Vantagens:** Simplicidade e boa performance em dados lineares. 

**Desvantagens:** Não lida bem com padrões não lineares ou com muitos fatores exógenos. 

**Como usar:** O modelo pode ser ajustado para capturar dependências temporais, sazonalidade e tendências. 

**Importante:** Parâmetros **p**,**d** e **q**, usar o auto.arima() para achar os com as menores métricas AIC,AICc e BIC.

In [None]:
from statsmodels.tsa.arima.model import ARIMA
model = ARIMA(df['coluna'], order=(p,d,q))
model_fit = model.fit()
pred = model_fit.forecast(steps=10)

## SARIMA (Seasonal ARIMA)
**Quando usar:** Se os dados apresentam sazonalidade, além de tendências e padrões autorregressivos.


**Vantagens:** Estende o ARIMA para capturar padrões sazonais.


**Desvantagens:** Pode ser difícil de ajustar os parâmetros sazonais.


**Como usar:** Adicione parâmetros sazonais ao modelo ARIMA.

## Exponential Smoothing (ETS)
**Quando usar:** Para séries temporais com tendência ou sazonalidade que precisam de suavização.


**Vantagens:** Bom para capturar tendências e sazonalidade com uma abordagem simples.


**Desvantagens:** Não captura bem padrões complexos.


**Como usar:** Implementado através do método Holt-Winters.

In [None]:
from statsmodels.tsa.holtwinters import ExponentialSmoothing
model = ExponentialSmoothing(df['coluna'], seasonal='add', seasonal_periods=12)
model_fit = model.fit()
pred = model_fit.forecast(steps=10)

# 2. Modelos de Aprendizado de Máquina

## Random Forest Regressor

**Quando usar:** Se houver fatores exógenos e a série temporal não for linear.


**Vantagens:** Capta interações não lineares entre as variáveis.


**Desvantagens:** Pode não capturar bem a dependência temporal a longo prazo.


**Como usar:** Construa um modelo com as variáveis temporais e outras variáveis explicativas (como lag features).

In [None]:
from sklearn.ensemble import RandomForestRegressor
model = RandomForestRegressor()
model.fit(X_train, y_train)
pred = model.predict(X_test)

## XGBoost/LightGBM
**Quando usar:** Para séries temporais com dependências não lineares e várias variáveis explicativas.


**Vantagens:** Alto desempenho, especialmente em problemas com alta dimensionalidade e interações complexas.


**Desvantagens:** Requer otimização dos hiperparâmetros para bons resultados.


**Como usar:** Semelhante ao Random Forest, você pode treinar o modelo com features temporais (lags, médias móveis, etc.).

In [None]:
import xgboost as xgb
model = xgb.XGBRegressor()
model.fit(X_train, y_train)
pred = model.predict(X_test)

# 3. Modelos Baseados em Redes Neurais

## LSTM (Long Short-Term Memory)

**Quando usar:** Para séries temporais com longas dependências temporais, como fluxos de caixa complexos, onde padrões sazonais ou de tendência são menos lineares.


**Vantagens:** Captura bem padrões a longo prazo e dinâmicas temporais complexas.


**Desvantagens:** Requer mais dados e recursos computacionais. Pode ser mais difícil de treinar e ajustar.


**Como usar:** Redes LSTM funcionam bem quando as dependências entre os dados em diferentes intervalos de tempo são complexas.

In [None]:
from keras.models import Sequential
from keras.layers import LSTM, Dense

model = Sequential()
model.add(LSTM(50, return_sequences=True, input_shape=(timesteps, features)))
model.add(LSTM(50))
model.add(Dense(1))
model.compile(optimizer='adam', loss='mse')
model.fit(X_train, y_train, epochs=10, batch_size=32)

## Transformer Models
**Quando usar:** Para séries temporais com dados complexos, muitos fatores exógenos ou interdependências entre variáveis.


**Vantagens:** Desempenho de ponta em tarefas sequenciais e temporais. Captura relações a longo prazo sem necessidade de manter sequências explícitas, como nas LSTMs.


**Desvantagens:** Alta complexidade e demanda computacional.


**Como usar:** Modelos transformers podem ser treinados com grandes datasets e são adequados para dados complexos e multivariados.

# 4. Modelos Híbridos

**Quando usar:** Quando os dados apresentam padrões complexos que não são completamente capturados por um único tipo de modelo.


**Como fazer:** Combine abordagens, por exemplo, um modelo estatístico para capturar a sazonalidade e uma rede neural para capturar padrões não lineares.

# Métricas

Testar diferentes modelos, usar validação cruzada e métricas como **MAE (Mean Absolute Error)** ou **RMSE (Root Mean Squared Error)** para avaliar o desempenho.

$$
\text{MAE} = \frac{1}{n} \sum_{i=1}^{n} \left| y_i - \hat{y}_i \right|
$$


In [None]:
from sklearn.metrics import mean_absolute_error, mean_squared_error
import numpy as np

# Exemplo de valores
y_test = [10, 12, 14, 16, 18, 20]  
y_pred = [11, 12, 13, 16, 19, 21]  

# Cálculo do Mean Absolute Error (MAE)
mae = mean_absolute_error(y_test, y_pred)
print(f"Mean Absolute Error (MAE): {mae}")

# Cálculo do Root Mean Squared Error (RMSE)
rmse = np.sqrt(mean_squared_error(y_test, y_pred))
print(f"Root Mean Squared Error (RMSE): {rmse}")

# Exemplo

In [None]:
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import GridSearchCV, KFold
from sklearn.metrics import make_scorer, mean_absolute_error
import numpy as np

# Exemplo de dados (substitua com seus próprios dados)
X = np.random.rand(100, 2)  # Exemplo de features aleatórias
y = np.random.rand(100)  # Exemplo de valores alvo aleatórios

# 1. Definindo o modelo base
model = RandomForestRegressor(random_state=42)

# 2. Definindo os parâmetros para o Grid Search
param_grid = {
    'n_estimators': [50, 100, 200],  # Número de árvores na floresta
    'max_depth': [None, 10, 20, 30]  # Profundidade máxima das árvores
}

# 3. Definindo o scorer para o MAE
mae_scorer = make_scorer(mean_absolute_error, greater_is_better=False)

# 4. Configurando o Grid Search com K-Fold
kf = KFold(n_splits=5, shuffle=True, random_state=42)
grid_search = GridSearchCV(estimator=model, param_grid=param_grid, scoring=mae_scorer, cv=kf)

# 5. Executando o Grid Search
grid_search.fit(X, y)

# 6. Obtendo os melhores parâmetros e o melhor MAE
print("Melhores parâmetros encontrados:")
print(grid_search.best_params_)

print(f"Melhor MAE encontrado: {-grid_search.best_score_}")

# 7. Treinando o modelo com os melhores parâmetros e avaliando em um conjunto de teste separado
# (Dividindo os dados em treino e teste novamente para a avaliação final)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Treinando o modelo com os melhores parâmetros
best_model = grid_search.best_estimator_
best_model.fit(X_train, y_train)

# Fazendo previsões e avaliando o modelo final
y_pred = best_model.predict(X_test)
mae_test = mean_absolute_error(y_test, y_pred)
print(f"Mean Absolute Error (MAE) no conjunto de teste: {mae_test}")
