# üöÄ In√≠cio R√°pido - Sistema de Previs√£o de Mercado Imobili√°rio

Este notebook demonstra como usar o **Sistema DSGE-RL** para fazer previs√µes do mercado imobili√°rio de Vit√≥ria/ES.

## O que voc√™ vai aprender:
- Como carregar dados de mercado
- Como executar o pipeline de previs√£o
- Como visualizar resultados
- Como interpretar o √≠ndice IDCI-VIX
- Como gerar previs√µes de 12 meses

**Design:** Gr√°ficos minimalistas em preto e branco para relat√≥rios profissionais

In [None]:
# Importa√ß√µes
import sys
sys.path.append('../src')

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings('ignore')

# Importar sistema
from pipeline import VitoriaForecastPipeline
from utils.plot_results import plot_all_results, print_summary

# Configura√ß√£o de estilo minimalista
plt.style.use('grayscale')
plt.rcParams['figure.figsize'] = (14, 6)
plt.rcParams['font.size'] = 10
plt.rcParams['axes.grid'] = True
plt.rcParams['grid.alpha'] = 0.3

print("‚úì Sistema importado com sucesso")
print(f"  Vers√£o: Pipeline Vit√≥ria/ES Forecast v1.0")

## 1. Carregar Dados de Mercado

O sistema espera um DataFrame com s√©ries temporais mensais. 

**Vari√°veis t√≠picas:**
- `preco_m2`: Pre√ßo m√©dio por m¬≤
- `lancamentos`: N√∫mero de lan√ßamentos
- `credito_imob`: Cr√©dito imobili√°rio
- `emprego_construcao`: Emprego na constru√ß√£o civil
- `massa_salarial`: Massa salarial
- `pib_es`: PIB do Esp√≠rito Santo
- `selic`: Taxa Selic

In [None]:
# ============================================================================
# OP√á√ÉO 1: Carregar seus dados (descomente e ajuste o caminho)
# ============================================================================
# df = pd.read_csv('../data/raw/dados_mercado.csv', index_col=0, parse_dates=True)
# df = pd.read_parquet('../data/raw/dados_mercado.parquet')

# ============================================================================
# OP√á√ÉO 2: Usar dados sint√©ticos para demonstra√ß√£o
# ============================================================================
print("Gerando dados sint√©ticos para demonstra√ß√£o...")
print("(Substitua por seus dados reais usando as linhas acima)\n")

np.random.seed(42)
dates = pd.date_range('2010-01-01', periods=120, freq='MS')

# Simula tend√™ncias e ciclos do mercado
trend = np.linspace(0, 2, 120)  # Tend√™ncia de crescimento
cycle = 0.5 * np.sin(2 * np.pi * np.arange(120) / 12)  # Ciclo anual

df = pd.DataFrame({
    'preco_m2': trend + cycle + 0.2 * np.random.randn(120).cumsum(),
    'lancamentos': 0.8 * trend + 0.3 * cycle + 0.15 * np.random.randn(120).cumsum(),
    'credito_imob': 0.9 * trend + 0.4 * cycle + 0.1 * np.random.randn(120).cumsum(),
    'emprego_construcao': 0.7 * trend + 0.2 * cycle + 0.2 * np.random.randn(120).cumsum(),
    'massa_salarial': 0.6 * trend + 0.1 * cycle + 0.15 * np.random.randn(120).cumsum(),
    'pib_es': 0.85 * trend + 0.25 * cycle + 0.1 * np.random.randn(120).cumsum(),
    'selic': -0.3 * trend + 0.1 * np.random.randn(120).cumsum(),
}, index=dates)

# Visualizar dados
print(f"üìä DADOS CARREGADOS")
print("="*60)
print(f"Per√≠odo: {df.index[0].strftime('%Y-%m')} a {df.index[-1].strftime('%Y-%m')}")
print(f"Observa√ß√µes: {len(df)}")
print(f"Vari√°veis: {len(df.columns)}")
print(f"\nColunas: {', '.join(df.columns)}")

df.head()

In [None]:
# Visualizar s√©ries originais
fig, axes = plt.subplots(3, 3, figsize=(16, 10))
fig.suptitle('S√©ries Temporais do Mercado Imobili√°rio', fontsize=16, fontweight='bold')

for i, col in enumerate(df.columns):
    ax = axes[i // 3, i % 3]
    ax.plot(df.index, df[col], color='black', linewidth=2)
    ax.set_title(col.replace('_', ' ').title(), fontweight='bold')
    ax.set_xlabel('')
    ax.grid(True, alpha=0.3)
    ax.tick_params(axis='x', rotation=45)

# Remover eixos extras
for i in range(len(df.columns), 9):
    axes[i // 3, i % 3].axis('off')

plt.tight_layout()
plt.show()

print("‚úì S√©ries carregadas e visualizadas")

## 2. Configurar e Executar Pipeline

O pipeline executa automaticamente:
1. **Pr√©-processamento**: Torna s√©ries estacion√°rias
2. **Sele√ß√£o de vari√°veis**: Identifica as mais relevantes via Granger
3. **Constru√ß√£o do IDCI-VIX**: √çndice de confian√ßa do mercado (0-10)
4. **Treinamento de modelos**: ARIMA, Ridge, Lasso, Random Forest, etc.
5. **Previs√µes**: Gera previs√µes de 12 meses
6. **Ensemble**: Combina modelos para melhor acur√°cia

In [None]:
# Criar pipeline
pipeline = VitoriaForecastPipeline(
    max_vars=5,              # N√∫mero de vari√°veis a selecionar
    forecast_horizon=12,      # Previs√£o de 12 meses
    ar_order=2,              # Ordem autorregressiva
    verbose=True             # Mostrar progresso
)

print("\n‚úì Pipeline configurado")
print(f"  ‚Ä¢ Vari√°veis m√°ximas: {pipeline.max_vars}")
print(f"  ‚Ä¢ Horizonte de previs√£o: {pipeline.forecast_horizon} meses")
print(f"  ‚Ä¢ Ordem AR: {pipeline.ar_order}")

In [None]:
# Executar pipeline completo
results = pipeline.run_full_pipeline(
    df,
    models_to_train=['arima', 'ridge', 'lasso', 'random_forest', 'quantile'],
    ensemble_method='weighted_avg'
)

## 3. Visualizar Resultados

### 3.1 √çndice IDCI-VIX

O **IDCI-VIX** (√çndice Din√¢mico de Confian√ßa Imobili√°ria - Vit√≥ria) √© um indicador de 0 a 10 que resume o estado do mercado:
- **0-3**: Mercado pessimista
- **3-7**: Mercado neutro
- **7-10**: Mercado otimista

In [None]:
# Visualizar IDCI-VIX
fig, ax = plt.subplots(1, 1, figsize=(14, 6))

ax.plot(results['idci_vix'].index, results['idci_vix'], 
        color='black', linewidth=2.5, label='IDCI-VIX')

# Adicionar zonas
ax.axhspan(0, 3, alpha=0.1, color='black', label='Pessimista')
ax.axhspan(3, 7, alpha=0.05, color='gray', label='Neutro')
ax.axhspan(7, 10, alpha=0.1, color='lightgray', label='Otimista')

# Valor atual
valor_atual = results['idci_vix'].iloc[-1]
ax.axhline(y=valor_atual, color='gray', linestyle='--', linewidth=2, 
           label=f'Atual: {valor_atual:.2f}')

ax.set_title('IDCI-VIX: √çndice de Confian√ßa do Mercado Imobili√°rio', 
             fontsize=14, fontweight='bold', pad=15)
ax.set_xlabel('Data', fontweight='bold')
ax.set_ylabel('IDCI-VIX (0-10)', fontweight='bold')
ax.set_ylim(0, 10)
ax.legend(loc='best')
ax.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# Estat√≠sticas
print("\nüìä ESTAT√çSTICAS DO IDCI-VIX")
print("="*60)
print(f"Valor atual: {valor_atual:.2f}")
print(f"M√©dia hist√≥rica: {results['idci_vix'].mean():.2f}")
print(f"M√≠nimo: {results['idci_vix'].min():.2f}")
print(f"M√°ximo: {results['idci_vix'].max():.2f}")
print(f"Desvio padr√£o: {results['idci_vix'].std():.2f}")

### 3.2 Previs√µes dos Modelos

In [None]:
# Comparar previs√µes de todos os modelos
fig, ax = plt.subplots(1, 1, figsize=(14, 7))

# Hist√≥rico
ax.plot(results['idci_vix'].index, results['idci_vix'], 
        color='black', linewidth=2.5, label='Hist√≥rico', zorder=10)

# Gerar datas futuras para previs√µes
last_date = results['idci_vix'].index[-1]
future_dates = pd.date_range(last_date + pd.DateOffset(months=1), 
                             periods=pipeline.forecast_horizon, 
                             freq='MS')

# Previs√µes de cada modelo
colors = {'arima': 'darkgray', 'ridge': 'gray', 'lasso': 'lightgray', 
          'random_forest': 'silver', 'quantile': 'darkgray'}
linestyles = {'arima': '--', 'ridge': '-.', 'lasso': ':', 
              'random_forest': '--', 'quantile': '-.'}

for model_name, forecast in results['forecasts'].items():
    if model_name.endswith('_quantiles'):
        continue
    
    if 'forecast' in forecast.columns:
        ax.plot(future_dates, forecast['forecast'], 
                color=colors.get(model_name, 'gray'),
                linestyle=linestyles.get(model_name, '-'),
                linewidth=1.5, alpha=0.7,
                label=f'{model_name.upper()}')

# Ensemble (destaque)
ax.plot(future_dates, results['ensemble']['forecast'], 
        color='black', linewidth=3, linestyle='-',
        marker='o', markersize=6, markerfacecolor='white',
        label='ENSEMBLE', zorder=11)

# Linha vertical separando hist√≥rico de previs√£o
ax.axvline(x=last_date, color='black', linestyle=':', linewidth=1.5, alpha=0.5)
ax.text(last_date, ax.get_ylim()[1]*0.95, ' Previs√£o ‚Üí', 
        fontsize=10, fontweight='bold', va='top')

ax.set_title('Previs√µes de 12 Meses - Compara√ß√£o de Modelos', 
             fontsize=14, fontweight='bold', pad=15)
ax.set_xlabel('Data', fontweight='bold')
ax.set_ylabel('IDCI-VIX', fontweight='bold')
ax.legend(loc='best', ncol=2)
ax.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print("‚úì Previs√µes visualizadas")

### 3.3 Vari√°veis Selecionadas

O sistema selecionou automaticamente as vari√°veis mais importantes via teste de Granger:

In [None]:
print("\nüéØ VARI√ÅVEIS SELECIONADAS")
print("="*60)
for i, var in enumerate(results['selected_vars'], 1):
    print(f"  {i}. {var}")

# Visualizar contribui√ß√£o
fig, ax = plt.subplots(1, 1, figsize=(12, 5))

# Calcular correla√ß√£o com IDCI-VIX
correlacoes = []
for var in results['selected_vars']:
    corr = results['data_stationary'][var].corr(results['idci_vix'])
    correlacoes.append(abs(corr))

# Plot
bars = ax.barh(range(len(results['selected_vars'])), correlacoes,
               color='black', alpha=0.7, edgecolor='white', linewidth=2)

ax.set_yticks(range(len(results['selected_vars'])))
ax.set_yticklabels(results['selected_vars'])
ax.invert_yaxis()
ax.set_xlabel('Correla√ß√£o Absoluta com IDCI-VIX', fontweight='bold')
ax.set_title('Import√¢ncia das Vari√°veis Selecionadas', fontweight='bold', pad=15)
ax.grid(True, alpha=0.3, axis='x')

# Adicionar valores
for i, (bar, corr) in enumerate(zip(bars, correlacoes)):
    ax.text(corr, i, f' {corr:.3f}', va='center', fontweight='bold')

plt.tight_layout()
plt.show()

## 4. Resumo Executivo

In [None]:
print("\n" + "="*80)
print("üìä RESUMO EXECUTIVO - PREVIS√ÉO DO MERCADO IMOBILI√ÅRIO")
print("="*80)

print("\nüéØ INDICADOR ATUAL")
print("-"*80)
idci_atual = results['idci_vix'].iloc[-1]
print(f"IDCI-VIX Atual: {idci_atual:.2f}")

if idci_atual < 3:
    print("Status: üî¥ PESSIMISTA - Mercado em retra√ß√£o")
elif idci_atual < 7:
    print("Status: üü° NEUTRO - Mercado est√°vel")
else:
    print("Status: üü¢ OTIMISTA - Mercado em expans√£o")

print("\nüìà PREVIS√ïES")
print("-"*80)
ensemble_12m = results['ensemble']['forecast'].iloc[0]
variacao_12m = ((ensemble_12m - idci_atual) / idci_atual) * 100

print(f"Previs√£o 12 meses (Ensemble): {ensemble_12m:.2f}")
print(f"Varia√ß√£o esperada: {variacao_12m:+.1f}%")

if variacao_12m > 5:
    print("Tend√™ncia: ‚ÜóÔ∏è ALTA - Expectativa de crescimento")
elif variacao_12m < -5:
    print("Tend√™ncia: ‚ÜòÔ∏è BAIXA - Expectativa de retra√ß√£o")
else:
    print("Tend√™ncia: ‚Üí EST√ÅVEL - Manuten√ß√£o do patamar")

print("\nüé≤ MODELOS")
print("-"*80)
print(f"Modelos treinados: {len(results['models'])}")
print(f"Vari√°veis utilizadas: {len(results['selected_vars'])}")
print(f"Per√≠odo analisado: {len(results['idci_vix'])} meses")

print("\nüí° RECOMENDA√á√ïES")
print("-"*80)
if idci_atual >= 7 and variacao_12m > 0:
    print("‚Ä¢ Momento favor√°vel para lan√ßamentos")
    print("‚Ä¢ Demanda aquecida")
    print("‚Ä¢ Considerar estrat√©gias de precifica√ß√£o premium")
elif idci_atual <= 3 and variacao_12m < 0:
    print("‚Ä¢ Cautela em novos investimentos")
    print("‚Ä¢ Foco em liquidez e VGV")
    print("‚Ä¢ Revisar estrat√©gia de marketing e vendas")
else:
    print("‚Ä¢ Monitorar indicadores mensalmente")
    print("‚Ä¢ Manter estrat√©gia equilibrada")
    print("‚Ä¢ Preparar cen√°rios alternativos")

print("\n" + "="*80)

## 5. Salvar Resultados

In [None]:
# Criar diret√≥rio se n√£o existir
import os
os.makedirs('../data/processed', exist_ok=True)

# Salvar IDCI-VIX
results['idci_vix'].to_csv('../data/processed/idci_vix.csv', header=True)

# Salvar previs√µes ensemble
forecast_df = pd.DataFrame({
    'data': future_dates,
    'previsao': results['ensemble']['forecast'].values
})
forecast_df.to_csv('../data/processed/previsao_ensemble_12m.csv', index=False)

# Salvar todas as previs√µes
all_forecasts = pd.DataFrame(index=future_dates)
for model_name, forecast in results['forecasts'].items():
    if not model_name.endswith('_quantiles') and 'forecast' in forecast.columns:
        all_forecasts[model_name] = forecast['forecast'].values
all_forecasts['ensemble'] = results['ensemble']['forecast'].values
all_forecasts.to_csv('../data/processed/previsoes_todos_modelos.csv')

print("‚úì Resultados salvos em data/processed/")
print("  ‚Ä¢ idci_vix.csv - S√©rie hist√≥rica do √≠ndice")
print("  ‚Ä¢ previsao_ensemble_12m.csv - Previs√£o combinada")
print("  ‚Ä¢ previsoes_todos_modelos.csv - Todas as previs√µes")

## üìö Pr√≥ximos Passos

Agora que voc√™ sabe usar o sistema b√°sico, explore:

1. **02_previsao_precos.ipynb** - Previs√£o detalhada de pre√ßos por m¬≤
2. **03_analise_cenarios.ipynb** - Simula√ß√£o de diferentes cen√°rios econ√¥micos
3. **04_otimizacao_parametros.ipynb** - Compara√ß√£o e otimiza√ß√£o de modelos

---

## üí° Dicas

- **Dados reais**: Substitua os dados sint√©ticos pelos seus dados hist√≥ricos
- **Atualiza√ß√£o**: Execute mensalmente com dados novos
- **Valida√ß√£o**: Compare previs√µes passadas com valores realizados
- **Customiza√ß√£o**: Ajuste par√¢metros do pipeline conforme necess√°rio