# üöÄ Framework de RL para Previs√£o de Ciclos Econ√¥micos

**Framework avan√ßado que combina Reinforcement Learning com modelos supervisionados para previs√£o de s√©ries temporais.**

Este notebook demonstra o uso completo no Google Colab.

---

## üìã Conte√∫do
1. Setup e Instala√ß√£o
2. Gera√ß√£o de Dados
3. Cria√ß√£o de Modelos Base
4. Ambiente de RL
5. Treinamento do Agente
6. Avalia√ß√£o e Resultados
7. Visualiza√ß√µes

## 1Ô∏è‚É£ Setup e Instala√ß√£o

Clone o reposit√≥rio e instale depend√™ncias (leva ~2 minutos).

In [None]:
# Clone reposit√≥rio
!git clone https://github.com/cbaracho200/Previs-o-ciclos-Econ-mico.git
%cd Previs-o-ciclos-Econ-mico

# Instala depend√™ncias
!pip install -q torch gymnasium statsmodels pmdarima xgboost pandas numpy matplotlib seaborn tqdm scikit-learn

print("\n‚úÖ Instala√ß√£o conclu√≠da!")

### Imports e Configura√ß√£o

In [None]:
import sys
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings('ignore')

# Configura√ß√£o de estilo
plt.style.use('default')
plt.rcParams['figure.figsize'] = (12, 6)

# Adiciona src ao path
sys.path.insert(0, '/content/Previs-o-ciclos-Econ-mico')

# Imports do framework
from src.utils.data_utils import generate_synthetic_data, split_data
from src.models.arima_model import ARIMAPredictor
from src.models.lstm_model import LSTMPredictor
from src.models.xgboost_model import XGBoostPredictor
from src.models.ensemble_predictor import EnsemblePredictor
from src.environments.timeseries_env import TimeSeriesEnv
from src.agents.rl_agent import RLAgent
from src.training.trainer import RLTrainer
from src.utils.visualization import plot_predictions, plot_coefficients
from src.utils.metrics import calculate_metrics

print("‚úÖ Imports realizados com sucesso!")

## 2Ô∏è‚É£ Gera√ß√£o de Dados

Gera dados sint√©ticos de s√©ries temporais com tend√™ncia, sazonalidade e ru√≠do.

In [None]:
# Gera dados sint√©ticos
print("Gerando dados sint√©ticos...")
data = generate_synthetic_data(
    n_points=300,
    trend=0.05,
    seasonality_amplitude=15.0,
    seasonality_period=12,
    noise_std=3.0,
    seed=42
)

# Divide dados
train_data, val_data, test_data = split_data(
    data, 
    train_ratio=0.7, 
    val_ratio=0.15
)

print(f"‚úÖ Dados gerados: {len(data)} pontos")
print(f"   ‚Ä¢ Treino: {len(train_data)} pontos")
print(f"   ‚Ä¢ Valida√ß√£o: {len(val_data)} pontos")
print(f"   ‚Ä¢ Teste: {len(test_data)} pontos")

# Visualiza dados
plt.figure(figsize=(14, 6))
plt.plot(data['date'], data['value'], linewidth=2, label='Dados Completos', alpha=0.8)
plt.axvline(x=train_data['date'].iloc[-1], color='red', linestyle='--', 
            linewidth=2, label='Fim Treino', alpha=0.7)
plt.axvline(x=val_data['date'].iloc[-1], color='orange', linestyle='--', 
            linewidth=2, label='Fim Valida√ß√£o', alpha=0.7)
plt.xlabel('Data', fontsize=12)
plt.ylabel('Valor', fontsize=12)
plt.title('S√©rie Temporal Sint√©tica - Divis√£o dos Dados', fontsize=14, fontweight='bold')
plt.legend(fontsize=10)
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()

# Estat√≠sticas descritivas
print("\nüìä Estat√≠sticas dos dados:")
print(data['value'].describe())

## 3Ô∏è‚É£ Cria√ß√£o de Modelos Base

Cria tr√™s modelos supervisionados:
- **ARIMA**: Captura tend√™ncias lineares e sazonalidades
- **LSTM**: Captura depend√™ncias de longo prazo
- **XGBoost**: Captura rela√ß√µes n√£o-lineares

In [None]:
print("üîß Criando modelos base...\n")

models = [
    ARIMAPredictor(
        order=(2, 1, 2), 
        name="ARIMA"
    ),
    LSTMPredictor(
        lookback=12, 
        hidden_size=32, 
        num_layers=2, 
        epochs=30,  # Reduzido para Colab
        batch_size=16,
        name="LSTM"
    ),
    XGBoostPredictor(
        lookback=12, 
        n_estimators=50,
        max_depth=4,
        name="XGBoost"
    )
]

print(f"‚úÖ {len(models)} modelos criados:")
for model in models:
    print(f"   ‚Ä¢ {model.name}")

### Cria√ß√£o e Treinamento do Ensemble

In [None]:
print("üîÑ Criando e treinando ensemble...\n")

ensemble = EnsemblePredictor(models)
ensemble.fit(train_data['value'])

print("\n‚úÖ Ensemble criado e treinado!")
print(f"\nüìä Pesos iniciais (iguais): {ensemble.get_weights()}")

## 4Ô∏è‚É£ Ambiente de RL

Cria o ambiente Gymnasium customizado para otimiza√ß√£o de s√©ries temporais.

In [None]:
print("üåç Criando ambiente de RL...\n")

FORECAST_HORIZON = 6  # Previs√£o de 6 meses √† frente
WINDOW_SIZE = 24      # Janela de observa√ß√£o de 24 pontos

env = TimeSeriesEnv(
    data=train_data,
    forecast_horizon=FORECAST_HORIZON,
    window_size=WINDOW_SIZE,
    n_coefficients=len(models),
    max_steps=50
)

print(f"‚úÖ Ambiente criado com sucesso!")
print(f"\nüìã Configura√ß√£o:")
print(f"   ‚Ä¢ Horizonte de previs√£o: {env.forecast_horizon} meses")
print(f"   ‚Ä¢ Janela de observa√ß√£o: {env.window_size} pontos")
print(f"   ‚Ä¢ N√∫mero de coeficientes: {env.n_coefficients}")
print(f"   ‚Ä¢ Dimens√£o do estado: {env.observation_space.shape[0]}")
print(f"   ‚Ä¢ Dimens√£o da a√ß√£o: {env.action_space.shape[0]}")

### Cria√ß√£o do Agente RL (PPO)

In [None]:
print("ü§ñ Criando agente RL (PPO)...\n")

state_dim = env.observation_space.shape[0]
action_dim = env.action_space.shape[0]

agent = RLAgent(
    state_dim=state_dim,
    action_dim=action_dim,
    learning_rate=3e-4,
    gamma=0.99,
    gae_lambda=0.95,
    clip_epsilon=0.2,
    hidden_dim=128,
    device='cpu'  # Mude para 'cuda' se tiver GPU habilitada
)

print(f"‚úÖ Agente PPO criado!")
print(f"\nüß† Arquitetura:")
print(f"   ‚Ä¢ Dimens√£o do estado: {state_dim}")
print(f"   ‚Ä¢ Dimens√£o da a√ß√£o: {action_dim}")
print(f"   ‚Ä¢ Camadas ocultas: 128 neur√¥nios")
print(f"   ‚Ä¢ Algoritmo: Proximal Policy Optimization (PPO)")

## 5Ô∏è‚É£ Treinamento do Agente

‚è∞ **Aten√ß√£o**: Esta c√©lula pode levar 5-10 minutos no Colab gratuito.

O agente aprender√° os melhores coeficientes para combinar os modelos.

In [None]:
print("üéØ Iniciando treinamento do agente RL...\n")
print("‚è∞ Tempo estimado: 5-10 minutos no Colab gratuito\n")

trainer = RLTrainer(env, agent, ensemble)

# Treinamento (reduzido para Colab)
history = trainer.train(
    n_episodes=100,      # Use 200-500 em produ√ß√£o
    max_steps=50,
    eval_frequency=25,
    save_frequency=50,
    verbose=True
)

print("\n" + "="*80)
print("üéâ TREINAMENTO CONCLU√çDO!")
print("="*80)

## 6Ô∏è‚É£ Avalia√ß√£o e Resultados

Avalia o agente treinado e extrai os melhores coeficientes.

In [None]:
print("üìä Avaliando modelo treinado...\n")

# Avalia√ß√£o
eval_results = trainer.evaluate(
    n_episodes=10, 
    deterministic=True, 
    verbose=True
)

# Extrai melhores coeficientes
best_coefficients = trainer.get_best_coefficients()

if best_coefficients is not None:
    print(f"\n{'='*60}")
    print("üèÜ MELHORES COEFICIENTES ENCONTRADOS")
    print(f"{'='*60}")
    for i, (model, coef) in enumerate(zip(models, best_coefficients)):
        print(f"   {model.name:12s}: {coef:.4f} ({coef*100:.1f}%)")
    print(f"{'='*60}\n")
    
    # Atualiza ensemble com melhores coeficientes
    ensemble.update_weights(best_coefficients)
    print("‚úÖ Ensemble atualizado com coeficientes otimizados!")
else:
    print("‚ö†Ô∏è Coeficientes n√£o dispon√≠veis, usando pesos iguais.")

### Teste no Conjunto de Teste

In [None]:
print("üß™ Testando no conjunto de teste...\n")

# Retreina ensemble com treino + valida√ß√£o
full_train_data = pd.concat([train_data, val_data])
ensemble.fit(full_train_data['value'])

# Faz previs√£o
forecast_horizon = 12
predictions = ensemble.predict(steps=forecast_horizon)

# Limita ao tamanho dos dados de teste
actual_values = test_data['value'].values[:forecast_horizon]
predictions = predictions[:len(actual_values)]

# Calcula m√©tricas
metrics = calculate_metrics(actual_values, predictions)

# Exibe resultados
print(f"\n{'='*70}")
print(f"{'RESULTADOS NO CONJUNTO DE TESTE':^70}")
print(f"{'='*70}")
print(f"\nüìà M√©tricas de Precis√£o:")
print(f"   ‚Ä¢ MAPE (Mean Absolute % Error): {metrics['mape']:8.2f}%")
print(f"   ‚Ä¢ RMSE (Root Mean Squared Error): {metrics['rmse']:8.4f}")
print(f"   ‚Ä¢ MAE  (Mean Absolute Error):     {metrics['mae']:8.4f}")
print(f"   ‚Ä¢ R¬≤   (Coef. Determina√ß√£o):      {metrics['r2']:8.4f}")
print(f"   ‚Ä¢ Acur√°cia Direcional:            {metrics['directional_accuracy']:8.2f}%")
print(f"\n{'='*70}\n")

# Interpreta√ß√£o
if metrics['mape'] < 5:
    interpretation = "üåü EXCELENTE!"
elif metrics['mape'] < 10:
    interpretation = "‚úÖ MUITO BOM!"
elif metrics['mape'] < 15:
    interpretation = "üëç BOM!"
else:
    interpretation = "‚ö†Ô∏è ACEIT√ÅVEL (pode melhorar com mais treinamento)"

print(f"üí° Interpreta√ß√£o: {interpretation}")
print(f"\nMAPE < 5% = Excelente | 5-10% = Muito Bom | 10-15% = Bom | >15% = Aceit√°vel")

## 7Ô∏è‚É£ Visualiza√ß√µes

Gera gr√°ficos detalhados dos resultados.

In [None]:
# Visualiza√ß√£o 1: Previs√µes vs Valores Reais
print("üìä Gerando visualiza√ß√µes...\n")

plot_predictions(
    actual_values,
    predictions,
    title=f"Ensemble Otimizado por RL - Teste (MAPE: {metrics['mape']:.2f}%)"
)

In [None]:
# Visualiza√ß√£o 2: Coeficientes Otimizados
if best_coefficients is not None:
    plot_coefficients(
        best_coefficients,
        model_names=[m.name for m in models],
        title="Coeficientes Otimizados pelo Agente RL (PPO)"
    )
else:
    print("‚ö†Ô∏è Coeficientes n√£o dispon√≠veis para visualiza√ß√£o.")

In [None]:
# Visualiza√ß√£o 3: Hist√≥rico de Treinamento
trainer.plot_training_progress()

### Compara√ß√£o: Antes vs Depois do RL

In [None]:
# Compara ensemble com pesos iguais vs otimizados
print("üîÑ Comparando resultados...\n")

# Ensemble com pesos iguais
ensemble_equal = EnsemblePredictor(models, weights=np.ones(len(models)))
ensemble_equal.fit(full_train_data['value'])
predictions_equal = ensemble_equal.predict(steps=len(actual_values))

# M√©tricas do ensemble com pesos iguais
metrics_equal = calculate_metrics(actual_values, predictions_equal)

# Tabela de compara√ß√£o
print(f"\n{'='*80}")
print(f"{'COMPARA√á√ÉO: ENSEMBLE COM PESOS IGUAIS vs OTIMIZADO POR RL':^80}")
print(f"{'='*80}")
print(f"\n{'M√©trica':<25} {'Pesos Iguais':>15} {'Otimizado RL':>15} {'Melhoria':>15}")
print(f"{'-'*80}")

for metric_name in ['mape', 'rmse', 'mae', 'r2']:
    equal_val = metrics_equal[metric_name]
    optim_val = metrics[metric_name]
    
    if metric_name == 'r2':
        improvement = ((optim_val - equal_val) / abs(equal_val)) * 100
        print(f"{metric_name.upper():<25} {equal_val:>15.4f} {optim_val:>15.4f} {improvement:>+14.1f}%")
    else:
        improvement = ((equal_val - optim_val) / equal_val) * 100
        print(f"{metric_name.upper():<25} {equal_val:>15.4f} {optim_val:>15.4f} {improvement:>+14.1f}%")

print(f"{'-'*80}")
print(f"\nüí° Valores positivos em 'Melhoria' indicam que o RL otimizou o ensemble!")
print(f"{'='*80}\n")

## üíæ Salvando Resultados

Opcional: Salve o modelo treinado no Google Drive.

In [None]:
# Descomente para salvar no Google Drive

# from google.colab import drive
# drive.mount('/content/drive')

# # Salva checkpoint
# import os
# save_dir = '/content/drive/MyDrive/rl_forecasting_models'
# os.makedirs(save_dir, exist_ok=True)

# # Salva modelo
# agent.save(f'{save_dir}/agent_model.pt')
# print(f"‚úÖ Modelo salvo em: {save_dir}")

# # Salva coeficientes
# if best_coefficients is not None:
#     np.save(f'{save_dir}/best_coefficients.npy', best_coefficients)
#     print(f"‚úÖ Coeficientes salvos!")

print("\nüí° Descomente o c√≥digo acima para salvar no Google Drive.")

## üéØ Pr√≥ximos Passos

### 1. Use seus pr√≥prios dados
```python
from google.colab import files
uploaded = files.upload()
data = pd.read_csv(list(uploaded.keys())[0])
# Certifique-se de ter uma coluna 'value'
```

### 2. Ajuste hiperpar√¢metros
- Aumente `n_episodes` para melhor treinamento (200-500)
- Ajuste `learning_rate` do agente (1e-4 a 1e-3)
- Modifique `forecast_horizon` (6-12 meses)

### 3. Adicione mais modelos
```python
from statsmodels.tsa.holtwinters import ExponentialSmoothing
# Implemente seu pr√≥prio modelo baseado em BasePredictor
```

### 4. Ative GPU no Colab
- `Runtime > Change runtime type > GPU`
- Mude `device='cuda'` no agente

---

## üìö Documenta√ß√£o Completa

Visite o [README do projeto](https://github.com/cbaracho200/Previs-o-ciclos-Econ-mico) para mais informa√ß√µes!

---

**Desenvolvido com ‚ù§Ô∏è para previs√£o de ciclos econ√¥micos usando Reinforcement Learning**