# üìä Tutorial 1: Introdu√ß√£o ao Time Series Forecasting Engine

Este notebook fornece uma introdu√ß√£o pr√°tica ao uso do Time Series Forecasting Engine, cobrindo:
1. Carregamento e visualiza√ß√£o de dados
2. Pr√©-processamento b√°sico
3. Treinamento de modelos simples
4. Avalia√ß√£o e visualiza√ß√£o de resultados

## Instala√ß√£o

Certifique-se de ter o pacote instalado:
```bash
pip install -e .
```

In [None]:
# Imports necess√°rios
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings('ignore')

# Configura√ß√µes de visualiza√ß√£o
plt.style.use('seaborn-v0_8-whitegrid')
plt.rcParams['figure.figsize'] = (14, 6)

print("‚úì Imports realizados com sucesso!")

## 1. Gerando Dados de Exemplo

Vamos criar uma s√©rie temporal sint√©tica com:
- Tend√™ncia linear
- Sazonalidade anual e semanal
- Ru√≠do aleat√≥rio

In [None]:
def generate_sample_data(n_points=365*2, start_date='2020-01-01'):
    """
    Gera dados de s√©rie temporal sint√©tica.
    
    Par√¢metros:
    - n_points: n√∫mero de pontos (dias)
    - start_date: data inicial
    """
    dates = pd.date_range(start=start_date, periods=n_points, freq='D')
    
    # Componentes
    trend = np.linspace(100, 200, n_points)  # Tend√™ncia crescente
    seasonal_yearly = 20 * np.sin(2 * np.pi * np.arange(n_points) / 365)  # Sazonalidade anual
    seasonal_weekly = 10 * np.sin(2 * np.pi * np.arange(n_points) / 7)   # Sazonalidade semanal
    noise = np.random.normal(0, 5, n_points)  # Ru√≠do
    
    # Combina√ß√£o
    values = trend + seasonal_yearly + seasonal_weekly + noise
    
    return pd.Series(values, index=dates, name='vendas')

# Gerar dados
data = generate_sample_data()

print(f"Dados gerados: {len(data)} observa√ß√µes")
print(f"Per√≠odo: {data.index[0]} a {data.index[-1]}")
print(f"\nPrimeiras 5 observa√ß√µes:")
print(data.head())

## 2. Visualiza√ß√£o Inicial

In [None]:
# Importar o visualizador
import sys
sys.path.insert(0, '../')
from src.visualization import TimeSeriesVisualizer

visualizer = TimeSeriesVisualizer()

# Plotar s√©rie temporal
fig = visualizer.plot_time_series(
    data,
    title="S√©rie Temporal de Vendas",
    show_trend=True
)
plt.show()

print("\nEstat√≠sticas descritivas:")
print(data.describe())

## 3. Divis√£o Treino/Teste

Para s√©ries temporais, sempre dividimos os dados respeitando a ordem temporal.

In [None]:
# Divis√£o 80/20
train_size = int(len(data) * 0.8)
train = data[:train_size]
test = data[train_size:]

print(f"Conjunto de treino: {len(train)} observa√ß√µes ({train.index[0]} a {train.index[-1]})")
print(f"Conjunto de teste: {len(test)} observa√ß√µes ({test.index[0]} a {test.index[-1]})")

# Visualizar divis√£o
plt.figure(figsize=(14, 6))
plt.plot(train.index, train.values, label='Treino', color='blue', alpha=0.7)
plt.plot(test.index, test.values, label='Teste', color='green', alpha=0.7)
plt.axvline(x=train.index[-1], color='red', linestyle='--', label='Divis√£o')
plt.xlabel('Data')
plt.ylabel('Vendas')
plt.title('Divis√£o Treino/Teste')
plt.legend()
plt.grid(True, alpha=0.3)
plt.show()

## 4. Pr√©-processamento B√°sico

In [None]:
from src.preprocessing import TimeSeriesPreprocessor

preprocessor = TimeSeriesPreprocessor()

# Verificar valores faltantes
print(f"Valores faltantes: {train.isna().sum()}")

# Detectar outliers
outliers_mask = preprocessor.detect_outliers(train, method='iqr', threshold=3.0)
print(f"Outliers detectados: {outliers_mask.sum()}")

# Remover outliers
train_clean = preprocessor.remove_outliers(train, method='iqr', threshold=3.0)
print(f"Dados ap√≥s remo√ß√£o de outliers: {len(train_clean)} observa√ß√µes")

# Testar estacionariedade
is_stationary, test_result = preprocessor.test_stationarity(train_clean)
print(f"\nTeste de Estacionariedade (ADF):")
print(f"  Estacion√°rio: {is_stationary}")
print(f"  Estat√≠stica ADF: {test_result['adf_statistic']:.4f}")
print(f"  p-valor: {test_result['p_value']:.4f}")

## 5. Modelo ARIMA

Vamos treinar um modelo ARIMA com sele√ß√£o autom√°tica de par√¢metros.

In [None]:
from src.models import ARIMAForecaster

# Criar e treinar modelo
arima = ARIMAForecaster(auto_select=True)
print("Treinando modelo ARIMA...")
arima.fit(train_clean)
print("‚úì Modelo treinado!")

# Fazer previs√µes
predictions = arima.predict(steps=len(test))
print(f"\nPrevis√µes geradas: {len(predictions)} pontos")

# Obter intervalos de confian√ßa
pred_with_intervals = arima.predict_with_intervals(steps=len(test), confidence=0.95)
predictions, lower_bound, upper_bound = pred_with_intervals
print("‚úì Intervalos de confian√ßa calculados")

## 6. Avalia√ß√£o do Modelo

In [None]:
from src.evaluation import ModelEvaluator

evaluator = ModelEvaluator()

# Calcular m√©tricas
metrics = evaluator.calculate_metrics(test.values, predictions.values)

print("M√©tricas de Erro:")
print(f"  MAE (Erro Absoluto M√©dio):          {metrics['MAE']:.2f}")
print(f"  RMSE (Raiz do Erro Quadr√°tico):     {metrics['RMSE']:.2f}")
print(f"  MAPE (Erro Percentual Absoluto):    {metrics['MAPE']:.2f}%")
print(f"  sMAPE (MAPE Sim√©trico):             {metrics['sMAPE']:.2f}%")
print(f"  R¬≤ (Coeficiente de Determina√ß√£o):   {metrics['R2']:.4f}")
print(f"  MASE (Erro Absoluto Escalado):      {metrics['MASE']:.4f}")

## 7. Visualiza√ß√£o dos Resultados

In [None]:
# Plot da previs√£o
fig = visualizer.plot_forecast(
    train_clean,
    test,
    predictions,
    lower_bound,
    upper_bound,
    title="ARIMA: Previs√£o vs Real"
)
plt.show()

In [None]:
# An√°lise de res√≠duos
if hasattr(arima, 'residuals_') and arima.residuals_ is not None:
    fig = visualizer.plot_residuals(arima.residuals_)
    plt.show()
    
    # Estat√≠sticas dos res√≠duos
    residual_stats = evaluator.residual_analysis(arima, test, predictions)
    print("\nAn√°lise de Res√≠duos:")
    print(f"  M√©dia: {residual_stats['mean']:.4f}")
    print(f"  Desvio padr√£o: {residual_stats['std']:.4f}")
    print(f"  Normalmente distribu√≠do: {residual_stats['is_normal']}")
    print(f"  Ru√≠do branco (sem autocorrela√ß√£o): {residual_stats['is_white_noise']}")

## 8. Modelo Prophet

Agora vamos testar o Prophet, que √© especialmente bom para capturar m√∫ltiplas sazonalidades.

In [None]:
from src.models import ProphetForecaster

# Criar e treinar modelo
prophet = ProphetForecaster(
    yearly_seasonality=True,
    weekly_seasonality=True,
    daily_seasonality=False
)

print("Treinando modelo Prophet...")
prophet.fit(train_clean)
print("‚úì Modelo treinado!")

# Fazer previs√µes
prophet_predictions = prophet.predict(steps=len(test))
prophet_pred_intervals = prophet.predict_with_intervals(steps=len(test), confidence=0.95)
prophet_predictions, prophet_lower, prophet_upper = prophet_pred_intervals

# Avaliar
prophet_metrics = evaluator.calculate_metrics(test.values, prophet_predictions.values)

print("\nM√©tricas Prophet:")
print(f"  MAE:   {prophet_metrics['MAE']:.2f}")
print(f"  RMSE:  {prophet_metrics['RMSE']:.2f}")
print(f"  MAPE:  {prophet_metrics['MAPE']:.2f}%")

In [None]:
# Visualizar Prophet
fig = visualizer.plot_forecast(
    train_clean,
    test,
    prophet_predictions,
    prophet_lower,
    prophet_upper,
    title="Prophet: Previs√£o vs Real"
)
plt.show()

## 9. Compara√ß√£o de Modelos

In [None]:
# Comparar modelos
models = [arima, prophet]
comparison = evaluator.compare_models(models, train_clean, test)

print("\nCompara√ß√£o de Modelos:")
print(comparison)

# Visualizar compara√ß√£o
fig = visualizer.plot_model_comparison(comparison, metric='RMSE')
plt.show()

## 10. Cross-Validation

Valida√ß√£o cruzada para s√©ries temporais.

In [None]:
# Criar novo modelo para CV
cv_model = ARIMAForecaster(auto_select=True)

# Realizar cross-validation
print("Executando cross-validation (pode demorar alguns minutos)...")
cv_results = evaluator.time_series_cv(
    model=cv_model,
    data=data,
    n_splits=5,
    test_size=30
)

print("\nResultados de Cross-Validation:")
print(f"  RMSE: {cv_results['RMSE_mean']:.2f} ¬± {cv_results['RMSE_std']:.2f}")
print(f"  MAE:  {cv_results['MAE_mean']:.2f} ¬± {cv_results['MAE_std']:.2f}")
print(f"  MAPE: {cv_results['MAPE_mean']:.2f}% ¬± {cv_results['MAPE_std']:.2f}%")

## Conclus√£o

Neste tutorial, voc√™ aprendeu:

1. ‚úÖ Como gerar e visualizar dados de s√©ries temporais
2. ‚úÖ Como realizar pr√©-processamento b√°sico
3. ‚úÖ Como treinar modelos ARIMA e Prophet
4. ‚úÖ Como avaliar modelos usando m√∫ltiplas m√©tricas
5. ‚úÖ Como comparar diferentes modelos
6. ‚úÖ Como usar cross-validation para s√©ries temporais

### Pr√≥ximos Passos

- **Tutorial 2:** Deep Learning com LSTM
- **Tutorial 3:** Modelos Ensemble
- **Tutorial 4:** Pr√©-processamento Avan√ßado
- **Tutorial 5:** Casos de Uso Reais