
---

### üß™ Script: Aurum Backtest Engine (Verified)

> **Fase:** Valida√ß√£o / Simula√ß√£o
> **Arquivo Alvo:** N/A (Gera Relat√≥rios e Gr√°ficos em Tempo Real)

Este script executa uma simula√ß√£o hist√≥rica rigorosa (*Backtesting*) utilizando o framework **Backtrader**. Ele consome o hist√≥rico de scores gerado pelo motor de intelig√™ncia e simula o comportamento de uma carteira que compra sistematicamente as empresas com maior "Aurum Quality Score".

### üéØ Objetivos

1. **Prova de Conceito:** Verificar se a estrat√©gia de "Alta Qualidade + Bom Sentimento" supera o mercado ou protege o capital.
2. **Teste de Estresse:** Medir o risco m√°ximo (`Max Drawdown`) em per√≠odos de crise.
3. **Valida√ß√£o de Execu√ß√£o:** Garantir que a l√≥gica de rebalanceamento mensal e custos de transa√ß√£o seja realista.

### üèóÔ∏è Arquitetura de Simula√ß√£o (Flowchart)

O fluxo simula a passagem do tempo, m√™s a m√™s, tomando decis√µes de compra e venda baseadas puramente no Score.

```mermaid
flowchart TD
    %% --- INPUT ---
    Input[("<b>Input: Scored History</b><br/>aurum_scored_history.parquet")]

    %% --- PREPARA√á√ÉO ---
    subgraph Prep ["1. Prepara√ß√£o de Dados"]
        Load["<b>Carregamento & Tipagem</b><br/>Convers√£o Float/Date"]
        Sanity["<b>Filtro de Sanidade</b><br/>Banir Tickers com Splits Errados<br/>(>100% ou <-80%)"]
        TimeFilter["<b>Janela Temporal</b><br/>Ex: 2023-2025"]
    end

    %% --- MOTOR BACKTRADER ---
    subgraph Engine ["2. Backtrader Engine (Cerebro)"]
        Feed["<b>Data Feeds</b><br/>Inje√ß√£o de 70+ Ativos"]
        
        subgraph Strategy ["L√≥gica da Estrat√©gia"]
            Signal["<b>Sinal (Mensal)</b><br/>Ler Aurum Score"]
            Rank["<b>Ranking</b><br/>Ordenar Top 10"]
            Rebal["<b>Rebalanceamento</b><br/>Vender Perdedores<br/>Comprar Vencedores"]
        end
        
        Broker["<b>Broker Simulado</b><br/>Caixa: R$ 100k<br/>Comiss√£o: 0.05%"]
    end

    %% --- RESULTADOS ---
    subgraph Output ["3. Relat√≥rios"]
        Metrics["<b>M√©tricas de Risco</b><br/>Sharpe, Drawdown, ROI"]
        Plot["<b>Gr√°fico de Patrim√¥nio</b><br/>Curva de Capital"]
    end

    %% --- LIGA√á√ïES ---
    Input --> Load --> Sanity --> TimeFilter
    TimeFilter --> Feed --> Engine
    Feed --> Signal --> Rank --> Rebal
    Rebal --> Broker --> Metrics & Plot

```

### ‚öôÔ∏è Detalhes da Estrat√©gia (`AurumVerifiedStrategy`)

A estrat√©gia √© classificada como **Long-Only Systematic Ranking** (Comprada, Sistem√°tica e baseada em Ranking).

#### 1. Regra de Entrada (Buy)

* **Frequ√™ncia:** Mensal (`rebalance_days = 1`).
* **Crit√©rio:** Selecionar os **Top N** ativos (ex: Top 10) com o maior `aurum_quality_score`.
* **Aloca√ß√£o:** Pesos iguais (`Equal Weight`). Se Top 10, compra 9.5% do capital em cada (deixando margem de seguran√ßa para taxas).

#### 2. Regra de Sa√≠da (Sell)

* Se um ativo sai do Top N (porque seu score caiu ou outros subiram), ele √© **vendido integralmente** no pr√≥ximo rebalanceamento.
* Isso garante que a carteira sempre reflita a "Nata" da qualidade, descartando empresas que pioraram seus fundamentos ou tiveram not√≠cias ruins.

#### 3. Gest√£o de Risco

* **Diversifica√ß√£o:** O limite de concentra√ß√£o √© definido pelo `top_n`.
* **Filtro de Sanidade:** Antes de come√ßar, o script remove tickers com varia√ß√µes de pre√ßo irreais (ex: 900% em um m√™s) que poderiam distorcer o resultado final com lucros falsos.

## üìÇ Outputs (Sa√≠das)

Diferente dos scripts anteriores, este n√£o gera um arquivo `.parquet`, mas sim **Informa√ß√£o Decis√≥ria**:

1. **Console Log:** Um di√°rio detalhado de cada opera√ß√£o (Data, Compra, Venda, Caixa).
2. **M√©tricas Financeiras:**
* **ROI (Retorno):** Lucro total percentual.
* **Sharpe Ratio:** Retorno ajustado ao risco (Efici√™ncia).
* **Max Drawdown:** A pior queda enfrentada (Seguran√ßa).


3. **Gr√°fico (Plot):** Visualiza√ß√£o da curva de patrim√¥nio ao longo do tempo.

### üöÄ Como Executar

Este √© o "Grand Finale" do projeto.

```bash
python src/step_09_backtest_final_verified.py

```

### üìã Exemplo de Log de Execu√ß√£o

```text
2025-06-30 | TOP 10 ESCOLHIDOS: ['WEGE3.SA', 'PSSA3.SA', 'ITUB4.SA'...]
2025-07-31 | VENDENDO VALE3.SA (Saiu do Portfolio)
...
üèÜ RESULTADO FINAL - AURUM
Saldo Final:    R$ 106,496.62
Retorno Total:  6.50%
Max Drawdown:   3.17%

```

---

In [7]:
import backtrader as bt
import pandas as pd
import os
import logging
import numpy as np

# Configura√ß√£o de Log
logging.basicConfig(format='%(asctime)s - %(message)s', level=logging.INFO)


In [8]:
# --- CONFIGURA√á√ÉO GERAL ---
DATA_FILE = "../data/aurum_final_scores/aurum_scored_history.parquet"
INITIAL_CASH = 100000.0
COMISSAO = 0.0005

In [9]:

# --- 1. CLASSE DE DADOS (IMPORTA√á√ÉO SEGURA) ---
class AurumVerifiedData(bt.feeds.PandasData):
    """
    Classe de dados customizada para ler o arquivo Aurum Scored.
    Removemos colunas de texto (grades) para evitar erros no Backtrader.
    """
    lines = ('aurum_score',) 
    
    params = (
        ('datetime', None),
        ('open', 'Adj Close'),
        ('high', 'Adj Close'),
        ('low', 'Adj Close'),
        ('close', 'Adj Close'),
        ('volume', -1),       
        ('openinterest', -1),
        ('aurum_score', 'aurum_quality_score'),
    )


In [10]:
class AurumVerifiedStrategy(bt.Strategy):
    params = (
        ('top_n', 5),        
        ('rebalance_days', 1),   
    )

    def log(self, txt, dt=None):
        """Fun√ß√£o auxiliar para imprimir com a data da simula√ß√£o"""
        dt = dt or self.datas[0].datetime.date(0)
        print(f'{dt.isoformat()} | {txt}')

    def __init__(self):
        self.timer = 0
        self.inds = {}
        for d in self.datas:
            self.inds[d] = d.aurum_score

    def next(self):
        self.timer += 1
        if self.timer < self.params.rebalance_days:
            return
        self.timer = 0
        
        self.log(f'--- REBALANCEAMENTO (Cash: {self.broker.get_cash():.2f}) ---')

        candidates = []
        for d in self.datas:
            if len(d) > 0 and d.aurum_score[0] > 0 and d.close[0] > 0:
                candidates.append((d, d.aurum_score[0]))
        
        candidates.sort(key=lambda x: x[1], reverse=True)
        
        top_picks = [item[0] for item in candidates[:self.params.top_n]]
        
        pick_names = [d._name for d in top_picks]
        self.log(f'TOP {self.params.top_n} ESCOLHIDOS: {pick_names}')
        
        for d in self.datas:
            pos = self.getposition(d).size
            if pos > 0:
                if d not in top_picks:
                    self.log(f'VENDENDO {d._name} (Saiu do Portfolio)')
                    self.close(d)
        
        if len(top_picks) > 0:
            target_pct = 0.95 / len(top_picks)
            for d in top_picks:
                self.order_target_percent(d, target=target_pct)

In [11]:
def filtrar_tickers_problematicos(df, limite_alta=1.0, limite_baixa=-0.8):
    print("üßπ Iniciando Filtro de Sanidade...")
    tickers_antes = df['ticker'].nunique()
    
    df['retorno_check'] = df.groupby('ticker')['Adj Close'].pct_change()
    
    bad_tickers = df[
        (df['retorno_check'] > limite_alta) | 
        (df['retorno_check'] < limite_baixa)
    ]['ticker'].unique()
    
    if len(bad_tickers) > 0:
        print(f"üö´ BANINDO {len(bad_tickers)} tickers problem√°ticos: {list(bad_tickers)}")
        df = df[~df['ticker'].isin(bad_tickers)].copy()
    
    print(f"‚úÖ Tickers restantes: {df['ticker'].nunique()}")
    return df

In [12]:
def run_verified_backtest():
    print("--- ü¶Å BACKTEST FINAL VERIFICADO: PROJETO AURUM ---")
    
    if not os.path.exists(DATA_FILE):
        print(f"‚ùå Erro Cr√≠tico: Arquivo {DATA_FILE} n√£o encontrado.")
        return

    cerebro = bt.Cerebro()

    try:
        df = pd.read_parquet(DATA_FILE)
        
        df['date'] = pd.to_datetime(df['date'])
        df['Adj Close'] = pd.to_numeric(df['Adj Close'], errors='coerce')
        df['aurum_quality_score'] = pd.to_numeric(df['aurum_quality_score'], errors='coerce')
        
        df = df.dropna(subset=['date', 'ticker', 'Adj Close', 'aurum_quality_score'])
        df = df.sort_values('date')
        
    except Exception as e:
        print(f"‚ùå Erro ao ler dataset: {e}")
        return

    df = filtrar_tickers_problematicos(df)
    
    start_date = '2023-01-01'
    end_date = '2025-12-31'
    
    mask = (df['date'] >= start_date) & (df['date'] <= end_date)
    df_final = df.loc[mask]
    
    if df_final.empty:
        print("‚ö†Ô∏è O filtro de data retornou vazio. Verifique as datas do arquivo.")
        return

    tickers = df_final['ticker'].unique()
    print(f"\nüìà Carregando hist√≥rico de {len(tickers)} ativos ({start_date} a {end_date})...")
    
    for t in tickers:
        df_t = df_final[df_final['ticker'] == t].copy()
        df_t = df_t.set_index('date').sort_index()
        
        if len(df_t) < 6: continue
        
        data = AurumVerifiedData(dataname=df_t, name=t)
        cerebro.adddata(data)

    cerebro.addstrategy(AurumVerifiedStrategy, top_n=10)
    cerebro.broker.setcash(INITIAL_CASH)
    cerebro.broker.setcommission(commission=COMISSAO)
    
    cerebro.addanalyzer(bt.analyzers.SharpeRatio, _name='sharpe', riskfreerate=0.11, timeframe=bt.TimeFrame.Months)
    cerebro.addanalyzer(bt.analyzers.DrawDown, _name='dd')
    cerebro.addanalyzer(bt.analyzers.Returns, _name='ret')

    print(f"\nüí∞ Saldo Inicial: R$ {INITIAL_CASH:,.2f}")
    results = cerebro.run()
    strat = results[0]
    
    val = cerebro.broker.getvalue()
    roi = ((val - INITIAL_CASH) / INITIAL_CASH) * 100
    
    print("\n" + "="*40)
    print(f"üèÜ RESULTADO FINAL - AURUM")
    print("="*40)
    print(f"Saldo Final:    R$ {val:,.2f}")
    print(f"Lucro L√≠quido:  R$ {val - INITIAL_CASH:,.2f}")
    print(f"Retorno Total:  {roi:.2f}%")
    
    try:
        s_val = strat.analyzers.sharpe.get_analysis()['sharperatio']
        dd_val = strat.analyzers.dd.get_analysis()['max']['drawdown']
        
        s_str = f"{s_val:.3f}" if s_val is not None else "N/A"
        print(f"Sharpe Ratio:   {s_str}")
        print(f"Max Drawdown:   {dd_val:.2f}%")
    except:
        print("M√©tricas de Risco n√£o puderam ser calculadas.")

    print("\nüìâ Gerando gr√°fico de patrim√¥nio...")
    try:
        cerebro.plot(style='line', iplot=False, volume=False)
    except Exception as e:
        print(f"‚ö†Ô∏è Aviso: N√£o foi poss√≠vel plotar o gr√°fico. ({e})")

if __name__ == "__main__":
    run_verified_backtest()

--- ü¶Å BACKTEST FINAL VERIFICADO: PROJETO AURUM ---
üßπ Iniciando Filtro de Sanidade...
üö´ BANINDO 19 tickers problem√°ticos: ['COGN3.SA', 'PRIO3.SA', 'GOAU4.SA', 'USIM5.SA', 'FLRY3.SA', 'PCAR3.SA', 'MGLU3.SA', 'AZZA3.SA', 'SLCE3.SA', 'PSSA3.SA', 'CPLE3.SA', 'IRBR3.SA', 'LREN3.SA', 'CSAN3.SA', 'CPLE5.SA', 'UGPA3.SA', 'TOTS3.SA', 'CEAB3.SA', 'TEND3.SA']
‚úÖ Tickers restantes: 75

üìà Carregando hist√≥rico de 75 ativos (2023-01-01 a 2025-12-31)...

üí∞ Saldo Inicial: R$ 100,000.00
2025-06-30 | --- REBALANCEAMENTO (Cash: 100000.00) ---
2025-06-30 | TOP 10 ESCOLHIDOS: ['MULT3.SA', 'ALOS3.SA', 'BRKM5.SA', 'CXSE3.SA', 'SUZB3.SA', 'IGTI11.SA', 'TIMS3.SA', 'CURY3.SA', 'VALE3.SA', 'VIVA3.SA']
2025-07-01 | --- REBALANCEAMENTO (Cash: 24079.17) ---
2025-07-01 | TOP 10 ESCOLHIDOS: ['MULT3.SA', 'ALOS3.SA', 'BRKM5.SA', 'CXSE3.SA', 'SUZB3.SA', 'IGTI11.SA', 'TIMS3.SA', 'CURY3.SA', 'VALE3.SA', 'VIVA3.SA']
2025-07-31 | --- REBALANCEAMENTO (Cash: 24079.17) ---
2025-07-31 | TOP 10 ESCOLHIDOS: ['MULT