# Estrat√©gia Quantitativa de Pairs Trading com Dados da B3

Este notebook implementa uma estrat√©gia quantitativa de pairs trading com a√ß√µes da B3. O pipeline inclui:

- Carregamento de dados hist√≥ricos de pre√ßos e volumes de a√ß√µes usando banco SQLite e Yahoo Finance.
- Sele√ß√£o de pares cointegrados via teste estat√≠stico (ADF e KPSS).
- Estrat√©gia baseada em bandas de volatilidade com z-score.
- Backtest da estrat√©gia em per√≠odos sequenciais.
- An√°lise dos resultados e m√©tricas de performance.

Autor: Rafael Eiki Teruya, aluno de Ci√™ncias Econ√¥micas na FEA-USP

# üìä Backtest de Pairs Trading
---

## üìù Descri√ß√£o

Este notebook implementa um **pipeline completo de Pairs Trading** utilizando dados da B3 armazenados em **banco SQLite**.  
O fluxo inclui:

1Ô∏è‚É£ Cria√ß√£o e manuten√ß√£o do banco de dados de ativos (`ativos_b3.db`)  
2Ô∏è‚É£ Download e armazenamento de dados hist√≥ricos via `yfinance`  
3Ô∏è‚É£ Carregamento de tickers com filtro de **volume m√≠nimo**  
4Ô∏è‚É£ Sele√ß√£o de pares cointegrados com testes ADF e KPSS  
5Ô∏è‚É£ C√°lculo do spread e z-score exponencial (EWM)  
6Ô∏è‚É£ Gera√ß√£o de sinais de entrada/sa√≠da  
7Ô∏è‚É£ Backtest di√°rio com portfolio ponderado por volatilidade  
8Ô∏è‚É£ Valida√ß√£o walk-forward para reduzir overfitting  

---

## ‚öôÔ∏è Objetivos

- Manter um **banco de dados atualizado** com pre√ßos, volume e retornos da B3  
- Selecionar pares de ativos com **cointegra√ß√£o est√°vel e meia-vida adequada**  
- Testar estrat√©gias de **long-short baseadas em z-score**  
- Avaliar **performance do portf√≥lio** (Retorno, Sharpe ajustado pelo CDI)  
- Garantir **valida√ß√£o fora da amostra** usando walk-forward  

---

## üìå Estrutura do Notebook

1Ô∏è‚É£ üèóÔ∏è Cria√ß√£o do banco de dados SQLite e tabelas  
2Ô∏è‚É£ üíæ Download de pre√ßos e salvamento no banco (`yfinance`)  
3Ô∏è‚É£ üìÇ Carregamento de tickers e filtragem por volume  
4Ô∏è‚É£ üîç Sele√ß√£o de pares cointegrados (ADF + KPSS)  
5Ô∏è‚É£ üìä C√°lculo do spread e z-score EWM  
6Ô∏è‚É£ ‚ö° Gera√ß√£o de sinais de entrada e sa√≠da  
7Ô∏è‚É£ üíπ Backtest di√°rio com portfolio ponderado  
8Ô∏è‚É£ üìà M√©tricas de performance e an√°lise walk-forward  



## Carregando Bibliotecas e configura√ß√µes iniciais

In [4]:
import pandas as pd
import numpy as np
import yfinance as yf
import statsmodels.api as sm
from statsmodels.tsa.stattools import coint, adfuller, kpss
from scipy.stats import pearsonr
import itertools
import vectorbt as vbt
import warnings
import sqlite3
import cvxpy as cp
from datetime import datetime
import fundamentus as fmt
import logging
from itertools import product
import talib as ta
from hurst import compute_Hc
# Configura√ß√µes
warnings.simplefilter('ignore')
pd.set_option('display.max_columns', None)
logging.getLogger("yfinance").setLevel(logging.CRITICAL)

2025-09-03 17:17:48,333 [logging.log_init] INFO: LOGLEVEL=INFO


In [1]:
# Configura√ß√£o do backtest
inicio_total = '2017-01-01' 
fim_total = '2024-12-31'   
janela_otimizacao = '3Y' 
periodo_teste = '1Y'

##  Cria√ß√£o do banco de dados
# Banco de Dados de A√ß√µes da B3

Nessa etapa criamos e alimentamos um banco de dados **SQLite** com informa√ß√µes hist√≥ricas de a√ß√µes da **B3**, utilizando a biblioteca **yfinance** para coleta de dados.

---

## Estrutura do Banco de Dados
- **Nome do banco:** `dados_b3.db`  
- **Tabela:** `acoes`  
- **Colunas:**
  - `data` (TEXT, NOT NULL) ‚Üí Data da observa√ß√£o
  - `ticker` (TEXT, NOT NULL) ‚Üí C√≥digo da a√ß√£o
  - `preco` (REAL) ‚Üí Pre√ßo de fechamento
  - `volume` (REAL) ‚Üí Volume negociado
  - `retorno` (REAL) ‚Üí Retorno di√°rio (varia√ß√£o percentual)
  - **Chave prim√°ria:** `(data, ticker)`


In [5]:
# Nome do database
DB_NAME = 'ativos_b3.db'

# Criando a tabela
def criar_tabela():
    conn = sqlite3.connect(DB_NAME)
    cursor = conn.cursor()
    cursor.execute("""
        CREATE TABLE IF NOT EXISTS acoes (
            data TEXT NOT NULL,
            ticker TEXT NOT NULL,
            preco REAL,
            volume REAL,
            retorno REAL,
            PRIMARY KEY (data, ticker)
        )
    """)
    conn.commit()
    conn.close()

# Fun√ß√£o para salvar um ticker
def salvar_ticker(ticker, inicio, fim):
    df = yf.download(ticker, start=inicio, end=fim, progress=False)
    df_empty = []
    if df.empty:
        df_empty.append(ticker)
        print(f"‚ö†Ô∏è Alerta: dados vazios para {df_empty}")

    df['retorno'] = df['Close'].pct_change()
    df = df.reset_index()
    df = df[['Date', 'Close', 'Volume', 'retorno']]
    df.columns = ['data', 'preco', 'volume', 'retorno']
    df['ticker'] = ticker

    conn = sqlite3.connect(DB_NAME)
    cursor = conn.cursor()

    for _, row in df.iterrows():
        cursor.execute("""
            INSERT OR REPLACE INTO acoes (data, ticker, preco, volume, retorno)
            VALUES (?, ?, ?, ?, ?)
        """, (row['data'].strftime('%Y-%m-%d'), row['ticker'],
              row['preco'], row['volume'], row['retorno']))
    conn.commit()
    conn.close()

# Executando para todos os tickers da B3
if __name__ == "__main__":
    criar_tabela()

    tickers = []
    for setor in range(44):
        try:
            tickers.extend(fmt.list_papel_setor(setor))
        except:
            continue
    tickers = [s + ".SA" for s in tickers if s]
    tickers = tickers + ["^BVSP"]

    start_date = '2017-01-01'
    end_date = '2025-01-01'

    for t in tickers:
        salvar_ticker(t, start_date, end_date)
    print(f"‚úÖ {len(tickers)-13} ativos salvos no banco")

‚ö†Ô∏è Alerta: dados vazios para ['IGBR3.SA']
‚ö†Ô∏è Alerta: dados vazios para ['JPSA3.SA']
‚ö†Ô∏è Alerta: dados vazios para ['ADMF3.SA']
‚ö†Ô∏è Alerta: dados vazios para ['ELMD3.SA']
‚ö†Ô∏è Alerta: dados vazios para ['BLUT3.SA']
‚ö†Ô∏è Alerta: dados vazios para ['BLUT4.SA']
‚ö†Ô∏è Alerta: dados vazios para ['AZTE3.SA']
‚ö†Ô∏è Alerta: dados vazios para ['NTCO3.SA']
‚ö†Ô∏è Alerta: dados vazios para ['TOKY3.SA']
‚ö†Ô∏è Alerta: dados vazios para ['ATMP3.SA']
‚ö†Ô∏è Alerta: dados vazios para ['CTAX3.SA']
‚ö†Ô∏è Alerta: dados vazios para ['GOLL4.SA']
‚ö†Ô∏è Alerta: dados vazios para ['MOTV3.SA']
‚ö†Ô∏è Alerta: dados vazios para ['RVEE3.SA']
‚úÖ 408 ativos salvos no banco


## Fun√ß√µes para Carregar Dados do Banco de Dados

Estas fun√ß√µes facilitam o acesso aos dados salvos no banco SQLite:

- `carregar_ticker`: Busca dados hist√≥ricos de um ativo espec√≠fico, filtrando por ticker e per√≠odo. Retorna DataFrame indexado por data.
- `carregar_tickers`: Carrega v√°rios ativos simultaneamente, filtrando por volume m√©dio m√≠nimo para garantir liquidez. Retorna DataFrame com cada ativo em uma coluna.

Essas fun√ß√µes s√£o usadas para preparar os dados para sele√ß√£o de pares e backtest.

In [6]:
def carregar_ticker(ticker, start=None, end=None):
    conn = sqlite3.connect(DB_NAME)

    query = f"""
        SELECT data, preco, volume, retorno
        FROM acoes
        WHERE ticker = ?
        {f"AND data >= '{start}'" if start else ""}
        
        {f"AND data <= '{end}'" if end else ""}
        ORDER BY data
    """

    df = pd.read_sql(query, conn, params=(ticker,), parse_dates=["data"])
    conn.close()

    df.set_index("data", inplace=True)

    return df

def  carregar_tickers(tickers, start=None, end=None, start_test=None, end_test=None):
    dfs = []
    for ticker in tickers:
        df = carregar_ticker(ticker, start, end)
        volume_df = carregar_ticker(ticker, start_test, end_test)
        min_volume = 100_000
        if volume_df['volume'].mean() >= min_volume:
            df = df[['preco']].rename(columns={"preco": ticker})
            dfs.append(df)
    if dfs:
        dados = pd.concat(dfs, axis=1)
        dados.columns = [ticker for ticker in tickers if ticker in dados.columns]
        return dados, dados.columns
    else:
        return None

# Sele√ß√£o de Pares Cointegrados

## 1Ô∏è‚É£ Transforma√ß√£o Logar√≠tmica dos Pre√ßos
Para cada par de ativos $X_t$ e $Y_t$, usamos os **pre√ßos logar√≠tmicos**:

$$
x_t = \ln(X_t), \quad y_t = \ln(Y_t)
$$

> Isso transforma retornos multiplicativos em aditivos e estabiliza a vari√¢ncia.

---

## 2Ô∏è‚É£ Estima√ß√£o do Beta (Hedge Ratio)
O beta ($\beta$) relaciona $Y_t$ com $X_t$ via regress√£o linear:

$$
x_t = \alpha + \beta y_t + \epsilon_t
$$

- $\alpha$ = intercepto  
- $\beta$ = hedge ratio  
- $\epsilon_t$ = res√≠duos (spread)

O beta indica **quanto de $Y$ √© necess√°rio para cobrir $X$**.

---

## 3Ô∏è‚É£ C√°lculo do Spread
O **spread estacion√°rio** √© definido como:

$$
S_t = x_t - \beta y_t
$$

- Se os ativos forem cointegrados, $S_t$ ser√° **estacion√°rio** (m√©dia constante, varia√ß√£o limitada).

---

## 4Ô∏è‚É£ Testes de Estacionariedade

### a) Teste ADF (Augmented Dickey-Fuller)
Verifica se o spread tem raiz unit√°ria ($H_0$: n√£o estacion√°rio):

$$
\Delta S_t = \phi S_{t-1} + \sum_{i=1}^{p} \gamma_i \Delta S_{t-i} + \varepsilon_t
$$

- Rejeitar $H_0$ (p-valor < 0.01) indica **spread estacion√°rio**.

### b) Teste KPSS
Verifica a hip√≥tese nula inversa ($H_0$: estacion√°rio).  
- Desejamos p-valor > 0.05 para confirmar estacionariedade.

---

## 5Ô∏è‚É£ Meia-Vida da Revers√£o √† M√©dia
Modelo AR(1) para o spread:

$$
\Delta S_t = \lambda S_{t-1} + \eta_t
$$

A **meia-vida** ($\tau$) √© o tempo m√©dio para o spread voltar √† m√©dia:

$$
\tau = -\frac{\ln(2)}{\lambda}
$$

> Filtramos pares com $5 < \tau < 60$ dias para estrat√©gias de curto prazo.

---

## 6Ô∏è‚É£ Volatilidade
A volatilidade anualizada do spread e dos ativos √© calculada por:

$$
\sigma_\text{ativo} = \text{std}(\text{retornos di√°rios}) \times \sqrt{252}
$$

$$
\sigma_\text{spread} = \text{std}(S_t) \times \sqrt{252}
$$

> Essencial para dimensionar posi√ß√µes e controlar risco no backtest.

---

## 7Ô∏è‚É£ Sele√ß√£o Final de Pares
A fun√ß√£o seleciona **os 3 pares mais promissores** com base nos crit√©rios:

1. Spread **estacion√°rio** (ADF < 0.01, KPSS > 0.05)  
2. **Meia-vida** entre 5 e 60 dias  
3. **Beta** entre 0.3 e 3  
4. N√∫mero suficiente de observa√ß√µes  
5. Retorna m√©tricas de volatilidade para gest√£o de risco  

> Ao final, s√£o escolhidos **exatamente 3 pares** para o portf√≥lio, priorizando os spreads mais estacion√°rios (menor p-valor do ADF).





In [35]:
def selecionar_pares(precos, n_acoes=3):
    pares_cointegrados = []
    tickers = precos.columns.tolist()
    ativos_usados_como_ativo1 = set()  # Conjunto para rastrear ativos j√° usados como Ativo1

    # Gerar todas as combina√ß√µes poss√≠veis de pares
    for ativo1, ativo2 in itertools.combinations(tickers, 2):
        if ativo1 in ativos_usados_como_ativo1:
            continue  # Pular se o ativo1 j√° foi usado

        df_par = precos[[ativo1, ativo2]].dropna()
        if len(df_par) < 100:  # Ignorar pares com poucos dados
            continue

        # Pre√ßos log dos ativos
        df_par_log = np.log(df_par)

        try:
            # Estimando o beta
            X = sm.add_constant(df_par_log[ativo2])
            y = df_par_log[ativo1].values
            regressao = sm.OLS(y, X)
            modelo = regressao.fit()
            beta = modelo.params[1]
        except:
            continue

        if np.abs(beta) < 1e-5:
            continue

        # Calcular spread
        spread = df_par_log[ativo1] - beta * df_par_log[ativo2]

        # Calcular p-valor do teste ADF
        try:
            p_valor = adfuller(spread)[1]
            p_valor_kpss = kpss(spread)[1]
        except:
            continue

        # Calcular meia vida
        spread_lag1 = spread.shift(1).dropna()
        spread_delta = spread - spread_lag1

        df_reg = pd.DataFrame({'spread_delta': spread_delta.iloc[1:], 'spread_lag1': spread_lag1})

        X = sm.add_constant(df_reg['spread_lag1'])
        modelo = sm.OLS(df_reg['spread_delta'], X).fit()
        meia_vida = -np.log(2) / modelo.params['spread_lag1']

        # Selecionar pares com spread estacion√°rio
        if p_valor < 0.01 and 5 < meia_vida < 60 and 0.3 < np.abs(beta) < 3 and p_valor_kpss > 0.05:
            # Calcular vol dos retornos
            retorno_1 = df_par[ativo1].pct_change()
            retorno_2 = df_par[ativo2].pct_change()

            vol_retorno_1 = retorno_1.std()*np.sqrt(252)
            vol_retorno_2 = retorno_2.std()*np.sqrt(252)

            vol_spread = spread.std()*np.sqrt(252)

            pares_cointegrados.append({
                'Ativo1': ativo1,
                'Ativo2': ativo2,
                'Vol_ativo1': vol_retorno_1,
                'Vol_ativo2': vol_retorno_2,
                'Beta': beta,
                'spread': spread,
                'vol-spread': vol_spread,
                'p_valor_adf': p_valor,
                'meia_vida': meia_vida
            })

            # Adicionar ativo1 ao conjunto de ativos usados
            ativos_usados_como_ativo1.add(ativo1)

    # Retornar DataFrame com os pares selecionados
    return pd.DataFrame(pares_cointegrados).sort_values(by='p_valor_adf', ascending=True).iloc[0:n_acoes]

# Fun√ß√£o de Backtest (Walk-Forward)

A fun√ß√£o principal executa o walk-forward, aplicando o pipeline completo:

- Sele√ß√£o de pares cointegrados para cada janela.
- Backtest no per√≠odo seguinte.
- Consolida√ß√£o dos resultados.

Permite avaliar a estrat√©gia em diferentes per√≠odos e validar sua robustez.

# Walk-Forward Backtest de Pares ‚Äì Matem√°tica

## 1Ô∏è‚É£ Sele√ß√£o do Spread

Para cada par de ativos $(X, Y)$ no per√≠odo de otimiza√ß√£o:

$  
\text{Spread}_t = P_{X,t} - \beta \cdot P_{Y,t}  
$  

- $P_{X,t}$ e $P_{Y,t}$ s√£o os pre√ßos ajustados dos ativos X e Y no tempo $t$.  
- $\beta$ √© obtido pelo ajuste de regress√£o linear ou outro m√©todo de cointegra√ß√£o.

---

## 2Ô∏è‚É£ M√©dia M√≥vel Exponencial (EWM)

Calculamos a m√©dia m√≥vel exponencial e o desvio padr√£o exponencial do spread:

$  
\mu_t = \text{EWM}(\text{Spread}_t, \text{halflife}=h)  
$  

$  
\sigma_t = \text{EWM}(\text{Spread}_t, \text{halflife}=h, \text{std})  
$  

- `halflife` define o tempo necess√°rio para que pesos exponenciais decaiam pela metade.  
- Inclu√≠mos o per√≠odo de otimiza√ß√£o + teste para inicializar a EWM.

---

## 3Ô∏è‚É£ C√°lculo do Z-Score

$  
Z_t = \frac{\text{Spread}_t - \mu_t}{\sigma_t}  
$  

- Padroniza o spread para identificar extremos.  
- Usamos `shift(1)` para evitar **lookahead bias**.

---

## 4Ô∏è‚É£ Quantis para Sinais

Definimos quantis do z-score para entrada, sa√≠da, SL e TP:

$  
\begin{aligned}  
q_{\text{entrada long}} &= Q_{0.05}(Z) \\  
q_{\text{saida long}} &= Q_{0.25}(Z) \\  
q_{\text{entrada short}} &= Q_{0.95}(Z) \\  
q_{\text{saida short}} &= Q_{0.75}(Z) \\  
q_{\text{SL long}} &= Q_{0.005}(Z) \\  
q_{\text{TP long}} &= Q_{0.50}(Z) \\  
q_{\text{SL short}} &= Q_{0.995}(Z) \\  
q_{\text{TP short}} &= Q_{0.50}(Z)  
\end{aligned}  
$  

---

## 5Ô∏è‚É£ Gera√ß√£o de Sinais

- Entrada Long:

$  
\text{entrada\_long}_t = \mathbf{1}_{\{Z_t < q_{\text{entrada long}}\}}  
$  

- Sa√≠da Long:

$  
\text{saida\_long}_t = \mathbf{1}_{\{Z_t > q_{\text{saida long}} \text{ ou } Z_t < q_{\text{SL long}} \text{ ou } Z_t > q_{\text{TP long}}\}}  
$  

- Entrada Short:

$  
\text{entrada\_short}_t = \mathbf{1}_{\{Z_t > q_{\text{entrada short}}\}}  
$  

- Sa√≠da Short:

$  
\text{saida\_short}_t = \mathbf{1}_{\{Z_t < q_{\text{saida short}} \text{ ou } Z_t > q_{\text{SL short}} \text{ ou } Z_t < q_{\text{TP short}}\}}  
$  

- $\mathbf{1}_{\{\cdot\}}$ √© a fun√ß√£o indicadora.

---

## 6Ô∏è‚É£ Stops Baseados em Volatilidade

$  
\text{SL}_t = k_{\text{SL}} \cdot \sigma_{\text{spread}}  
$  

$  
\text{TP}_t = k_{\text{TP}} \cdot \sigma_{\text{spread}}  
$  

- $k_{\text{SL}} = 2$, $k_{\text{TP}} = 4$ (ajust√°veis).  

---

## 7Ô∏è‚É£ Portf√≥lio Ponderado por Volatilidade

Para $N$ pares:

$  
w_i = \frac{1 / \sigma_i}{\sum_{j=1}^{N} 1 / \sigma_j}  
$  

- $\sigma_i$ √© a volatilidade do spread do par $i$.  
- Equity do portf√≥lio:

$  
\text{Equity}_t = \sum_{i=1}^{N} w_i \cdot \text{Equity}_{i,t}  
$  

---

## 8Ô∏è‚É£ M√©tricas de Performance

- Retorno do per√≠odo:

$  
R = \frac{\text{Equity}_{\text{final}}}{\text{Equity}_{\text{inicial}}} - 1  
$  

- Sharpe Ratio ajustado pelo CDI:

$  
\text{Sharpe} = \frac{\bar{r} - r_f}{\sigma_r} \cdot \sqrt{252}  
$  

- $\bar{r}$ = retorno di√°rio m√©dio do portf√≥lio  
- $\sigma_r$ = desvio padr√£o di√°rio  
- $r_f$ = CDI di√°rio: $r_f = (1 + \text{CDI anual})^{1/252} - 1$



In [64]:
def run_walk_forward():
    resultados = []
    lista_portfolio = []
    datas_otimizacao = pd.date_range(start=inicio_total, end=fim_total, freq='AS')  # 'AS' = Ano In√≠cio

    janela_anos = 3
    for i in range(len(datas_otimizacao)):
        inicio_opt = datas_otimizacao[i]
        fim_opt = inicio_opt + pd.DateOffset(years=janela_anos) - pd.DateOffset(days=1)
        inicio_teste = fim_opt + pd.DateOffset(days=1)
        fim_teste = inicio_teste + pd.DateOffset(years=1) - pd.DateOffset(days=1)

        # Ignora per√≠odos incompletos
        
        if fim_teste > pd.to_datetime(fim_total):
            continue  
        
        print(f"\n=== Per√≠odo {i+1} ===")
        print(f"Otimiza√ß√£o: {inicio_opt.date()} a {fim_opt.date()} (3 anos)")
        print(f"Teste: {inicio_teste.date()} a {fim_teste.date()} (1 ano)")
        
        
        # Passo 1: Selecionar pares no per√≠odo de otimiza√ß√£o
        try:
            # Carregar lista de a√ß√µes da B3
            stocks = []
            for setor in range(44):
                try:
                    stocks.extend(fmt.list_papel_setor(setor))
                except:
                    continue
            stocks = [s + ".SA" for s in stocks if s]
            
            # Baixar dados e filtrar por volume
            dados_opt, tickers_filtrados = carregar_tickers(stocks, inicio_opt, fim_opt, inicio_teste,fim_teste)
            if dados_opt is None:
                continue
        
            precos_opt = dados_opt[tickers_filtrados].dropna(axis=1)

            df_pares = selecionar_pares(precos_opt)
            if df_pares.empty:
                print("Nenhum par cointegrado encontrado.")
                continue

            for i in range(len(df_pares)):

                ticker1, ticker2 = df_pares['Ativo1'].iloc[i], df_pares['Ativo2'].iloc[i]
                beta_otimo = df_pares['Beta'].iloc[i]

                dados_teste, _ = carregar_tickers([ticker1, ticker2], inicio_teste, fim_teste, inicio_teste,fim_teste)

            # Passo 2: Testar estrat√©gia no per√≠odo seguinte
                try:

                    preco1 = dados_teste[ticker1].dropna()
                    preco2 = dados_teste[ticker2].dropna()

                    precos_teste = pd.concat([preco1, preco2], axis=1, join='inner')
                    precos_teste.columns = [ticker1, ticker2]

                    if precos_teste.empty:
                        continue

                    # Selecionar beta
                    beta = df_pares['Beta'].iloc[i]
                    
                    # Spread do per√≠odo de teste
                    spread_teste = precos_teste[ticker1] - beta * precos_teste[ticker2]
                    spread_teste = spread_teste.shift(1)

                    # Concatenar hist√≥rico de otimiza√ß√£o + teste para inicializar EWM
                    spread_total = pd.concat([df_pares['spread'].iloc[i], spread_teste])

                    # Calcular EWM "aquecida" pelo per√≠odo de otimiza√ß√£o
                    ewm_media_total = spread_total.ewm(halflife=80, adjust=True).mean()
                    ewm_std_total = spread_total.ewm(halflife=80, adjust=True).std()

                    z_score_total = (spread_total - ewm_media_total) / ewm_std_total
                    z_score_movel = z_score_total.iloc[len(df_pares['spread'].iloc[i]):].shift(1)

                    # Selecionar apenas per√≠odo de teste e aplicar shift(1) para evitar lookahead
                    spread_media_movel_exp = ewm_media_total.iloc[len(df_pares['spread'].iloc[i]):].shift(1)
                    spread_desvio_movel_exp = ewm_std_total.iloc[len(df_pares['spread'].iloc[i]):].shift(1)

                    # Calcular z-score
                    z_score_teste = (spread_teste - spread_media_movel_exp) / spread_desvio_movel_exp

                    
                    # Calcular quantis com base no hist√≥rico do spread
                    q_entrada_long = z_score_total.quantile(0.05)
                    q_saida_long   = z_score_total.quantile(0.25)
                    q_entrada_short= z_score_total.quantile(0.95)
                    q_saida_short  = z_score_total.quantile(0.75)

                    q_sl_long  = z_score_total.quantile(0.005)
                    q_tp_long  = z_score_total.quantile(0.50)
                    q_sl_short = z_score_total.quantile(0.995)
                    q_tp_short = z_score_total.quantile(0.50)


                    # Sinais
                    entrada_long = z_score_teste < q_entrada_long
                    saida_long   = (z_score_teste > q_saida_long) | (z_score_teste < q_sl_long) | (z_score_teste > q_tp_long) 

                    entrada_short = z_score_teste > q_entrada_short
                    saida_short   = (z_score_teste < q_saida_short) | (z_score_teste > q_sl_short) | (z_score_teste < q_tp_short)

                    # Stop pot vol
                    sl_stop_vol = 2*df_pares['vol-spread'].iloc[i]
                    tp_stop_vol = 4*df_pares['vol-spread'].iloc[i]

                    # Backtest com vectorbt
                    pf = vbt.Portfolio.from_signals(
                    precos_teste[ticker1],
                    entries=entrada_long,
                    exits=saida_long,
                    short_entries=entrada_short,
                    short_exits=saida_short,
                    fees=0.001,
                    freq='D',
                    init_cash=10_000,
                    sl_stop=sl_stop_vol,
                    tp_stop=tp_stop_vol
                    )

                    print(pf.stats())
                    pf.plot().show()
                    lista_portfolio.append(pf)
                except Exception as e:
                    print(f"Erro no backtest para o par {ticker1}/{ticker2}: {e}")
                    continue

            if lista_portfolio:
                # Equity curves de cada par
                curva_equity = pd.concat([pf.value() for pf in lista_portfolio[-len(df_pares):]], axis=1)

                # Pesos por volatilidade inversa
                volatilidade = np.array([df_pares['vol-spread'].iloc[i] for i in range(len(df_pares))])
                pesos = 1 / volatilidade
                pesos /= pesos.sum()
                pesos = pd.Series(pesos, index=curva_equity.columns)

                # Equity do portf√≥lio ponderado
                portfolio_equity = curva_equity.mul(pesos, axis=1).sum(axis=1)

                # Dados do CDI
                cdi= {
                    "2020": 0.0275,
                    "2021": 0.0440,
                    "2022": 0.1237,
                    "2023": 0.1088,
                    "2024": 0.1088
                }


                # M√©tricas do portf√≥lio
                portfolio_return = (portfolio_equity[-1] / portfolio_equity[0]) - 1
                ano_teste = str(inicio_teste.year)
                cdi_diario = ((1 + cdi[ano_teste]) ** (1 / 252)) - 1
                retornos_diarios = portfolio_equity.pct_change().dropna()
                portfolio_sharpe = ((retornos_diarios - cdi_diario).mean() / (retornos_diarios.std())) * np.sqrt(252)

                resultados.append({
                    "Per√≠odo": f"{inicio_teste.date()} a {fim_teste.date()}",
                    "Retorno": portfolio_return,
                    "Sharpe": portfolio_sharpe
                })

            print("Resultados finais:")
            for resultado in resultados:
                print(f"Per√≠odo: {resultado['Per√≠odo']} | Retorno: {resultado['Retorno']*100:.2f}% | Sharpe: {resultado['Sharpe']:.2f}")

        except Exception as e:
            print(f"Erro no backtest para o par {ticker1}/{ticker2}: {e}")
            continue

In [65]:
run_walk_forward()


=== Per√≠odo 1 ===
Otimiza√ß√£o: 2017-01-01 a 2019-12-31 (3 anos)
Teste: 2020-01-01 a 2020-12-31 (1 ano)
Start                         2020-01-02 00:00:00
End                           2020-12-30 00:00:00
Period                          248 days 00:00:00
Start Value                               10000.0
End Value                            13633.485195
Total Return [%]                        36.334852
Benchmark Return [%]                   -10.226019
Max Gross Exposure [%]                      100.0
Total Fees Paid                         16.330205
Max Drawdown [%]                         7.814154
Max Drawdown Duration            20 days 00:00:00
Total Trades                                    1
Total Closed Trades                             1
Total Open Trades                               0
Open Trade PnL                                0.0
Win Rate [%]                                100.0
Best Trade [%]                          36.371187
Worst Trade [%]                         36.3

Start                         2020-01-02 00:00:00
End                           2020-12-30 00:00:00
Period                          248 days 00:00:00
Start Value                               10000.0
End Value                            10211.095799
Total Return [%]                         2.110958
Benchmark Return [%]                     2.311387
Max Gross Exposure [%]                      100.0
Total Fees Paid                          29.95007
Max Drawdown [%]                        35.354734
Max Drawdown Duration           149 days 00:00:00
Total Trades                                    2
Total Closed Trades                             1
Total Open Trades                               1
Open Trade PnL                       -3787.108187
Win Rate [%]                                100.0
Best Trade [%]                          40.022022
Worst Trade [%]                         40.022022
Avg Winning Trade [%]                   40.022022
Avg Losing Trade [%]                          NaN


Start                         2020-01-02 00:00:00
End                           2020-12-30 00:00:00
Period                          248 days 00:00:00
Start Value                               10000.0
End Value                            13537.629366
Total Return [%]                        35.376294
Benchmark Return [%]                    -5.052344
Max Gross Exposure [%]                      100.0
Total Fees Paid                         16.425965
Max Drawdown [%]                         5.045899
Max Drawdown Duration           199 days 00:00:00
Total Trades                                    1
Total Closed Trades                             1
Total Open Trades                               0
Open Trade PnL                                0.0
Win Rate [%]                                100.0
Best Trade [%]                           35.41167
Worst Trade [%]                          35.41167
Avg Winning Trade [%]                    35.41167
Avg Losing Trade [%]                          NaN


Resultados finais:
Per√≠odo: 2020-01-01 a 2020-12-31 | Retorno: 24.45% | Sharpe: 1.24

=== Per√≠odo 2 ===
Otimiza√ß√£o: 2018-01-01 a 2020-12-31 (3 anos)
Teste: 2021-01-01 a 2021-12-31 (1 ano)
Start                         2021-01-04 00:00:00
End                           2021-12-30 00:00:00
Period                          247 days 00:00:00
Start Value                               10000.0
End Value                            10678.639858
Total Return [%]                         6.786399
Benchmark Return [%]                   -10.355515
Max Gross Exposure [%]                      100.0
Total Fees Paid                         19.282098
Max Drawdown [%]                        10.020955
Max Drawdown Duration           203 days 00:00:00
Total Trades                                    1
Total Closed Trades                             1
Total Open Trades                               0
Open Trade PnL                                0.0
Win Rate [%]                                100.0
Best Tra

Start                         2021-01-04 00:00:00
End                           2021-12-30 00:00:00
Period                          247 days 00:00:00
Start Value                               10000.0
End Value                            12255.251728
Total Return [%]                        22.552517
Benchmark Return [%]                   -26.438447
Max Gross Exposure [%]                      100.0
Total Fees Paid                         17.707061
Max Drawdown [%]                          3.36508
Max Drawdown Duration           170 days 00:00:00
Total Trades                                    1
Total Closed Trades                             1
Total Open Trades                               0
Open Trade PnL                                0.0
Win Rate [%]                                100.0
Best Trade [%]                           22.57507
Worst Trade [%]                          22.57507
Avg Winning Trade [%]                    22.57507
Avg Losing Trade [%]                          NaN


Start                         2021-01-04 00:00:00
End                           2021-12-30 00:00:00
Period                          247 days 00:00:00
Start Value                               10000.0
End Value                            11959.169657
Total Return [%]                        19.591697
Benchmark Return [%]                   -50.317067
Max Gross Exposure [%]                      100.0
Total Fees Paid                         18.002847
Max Drawdown [%]                        10.161142
Max Drawdown Duration           203 days 00:00:00
Total Trades                                    1
Total Closed Trades                             1
Total Open Trades                               0
Open Trade PnL                                0.0
Win Rate [%]                                100.0
Best Trade [%]                          19.611288
Worst Trade [%]                         19.611288
Avg Winning Trade [%]                   19.611288
Avg Losing Trade [%]                          NaN


Resultados finais:
Per√≠odo: 2020-01-01 a 2020-12-31 | Retorno: 24.45% | Sharpe: 1.24
Per√≠odo: 2021-01-01 a 2021-12-31 | Retorno: 16.41% | Sharpe: 1.11

=== Per√≠odo 3 ===
Otimiza√ß√£o: 2019-01-01 a 2021-12-31 (3 anos)
Teste: 2022-01-01 a 2022-12-31 (1 ano)
Start                         2022-01-03 00:00:00
End                           2022-12-29 00:00:00
Period                          250 days 00:00:00
Start Value                               10000.0
End Value                            11903.105253
Total Return [%]                        19.031053
Benchmark Return [%]                    34.339171
Max Gross Exposure [%]                      100.0
Total Fees Paid                         81.508627
Max Drawdown [%]                         9.309506
Max Drawdown Duration            83 days 00:00:00
Total Trades                                    4
Total Closed Trades                             4
Total Open Trades                               0
Open Trade PnL                           

Start                         2022-01-03 00:00:00
End                           2022-12-29 00:00:00
Period                          250 days 00:00:00
Start Value                               10000.0
End Value                             8090.312086
Total Return [%]                       -19.096879
Benchmark Return [%]                    -6.818176
Max Gross Exposure [%]                      100.0
Total Fees Paid                          18.08842
Max Drawdown [%]                        26.019988
Max Drawdown Duration           217 days 00:00:00
Total Trades                                    1
Total Closed Trades                             1
Total Open Trades                               0
Open Trade PnL                                0.0
Win Rate [%]                                  0.0
Best Trade [%]                         -19.115976
Worst Trade [%]                        -19.115976
Avg Winning Trade [%]                         NaN
Avg Losing Trade [%]                   -19.115976


Start                         2022-01-03 00:00:00
End                           2022-12-29 00:00:00
Period                          250 days 00:00:00
Start Value                               10000.0
End Value                             9627.464164
Total Return [%]                        -3.725358
Benchmark Return [%]                   -16.229386
Max Gross Exposure [%]                      100.0
Total Fees Paid                         39.587171
Max Drawdown [%]                        11.068656
Max Drawdown Duration           210 days 00:00:00
Total Trades                                    2
Total Closed Trades                             2
Total Open Trades                               0
Open Trade PnL                                0.0
Win Rate [%]                                 50.0
Best Trade [%]                           1.436595
Worst Trade [%]                         -5.092592
Avg Winning Trade [%]                    1.436595
Avg Losing Trade [%]                    -5.092592


Resultados finais:
Per√≠odo: 2020-01-01 a 2020-12-31 | Retorno: 24.45% | Sharpe: 1.24
Per√≠odo: 2021-01-01 a 2021-12-31 | Retorno: 16.41% | Sharpe: 1.11
Per√≠odo: 2022-01-01 a 2022-12-31 | Retorno: -0.90% | Sharpe: -1.23

=== Per√≠odo 4 ===
Otimiza√ß√£o: 2020-01-01 a 2022-12-31 (3 anos)
Teste: 2023-01-01 a 2023-12-31 (1 ano)
Start                         2023-01-02 00:00:00
End                           2023-12-28 00:00:00
Period                          248 days 00:00:00
Start Value                               10000.0
End Value                            11243.153475
Total Return [%]                        12.431535
Benchmark Return [%]                    30.777439
Max Gross Exposure [%]                      100.0
Total Fees Paid                         60.757408
Max Drawdown [%]                         6.157753
Max Drawdown Duration            56 days 00:00:00
Total Trades                                    3
Total Closed Trades                             3
Total Open Trades      

Start                         2023-01-02 00:00:00
End                           2023-12-28 00:00:00
Period                          248 days 00:00:00
Start Value                               10000.0
End Value                            15228.342353
Total Return [%]                        52.283424
Benchmark Return [%]                   -26.412427
Max Gross Exposure [%]                      100.0
Total Fees Paid                         14.736941
Max Drawdown [%]                         9.462365
Max Drawdown Duration            15 days 00:00:00
Total Trades                                    1
Total Closed Trades                             1
Total Open Trades                               0
Open Trade PnL                                0.0
Win Rate [%]                                100.0
Best Trade [%]                          52.335707
Worst Trade [%]                         52.335707
Avg Winning Trade [%]                   52.335707
Avg Losing Trade [%]                          NaN


Start                         2023-01-02 00:00:00
End                           2023-12-28 00:00:00
Period                          248 days 00:00:00
Start Value                               10000.0
End Value                            14200.163009
Total Return [%]                         42.00163
Benchmark Return [%]                    51.479152
Max Gross Exposure [%]                      100.0
Total Fees Paid                         43.794816
Max Drawdown [%]                         8.337976
Max Drawdown Duration            63 days 00:00:00
Total Trades                                    2
Total Closed Trades                             2
Total Open Trades                               0
Open Trade PnL                                0.0
Win Rate [%]                                 50.0
Best Trade [%]                          45.015532
Worst Trade [%]                         -2.050002
Avg Winning Trade [%]                   45.015532
Avg Losing Trade [%]                    -2.050002


Resultados finais:
Per√≠odo: 2020-01-01 a 2020-12-31 | Retorno: 24.45% | Sharpe: 1.24
Per√≠odo: 2021-01-01 a 2021-12-31 | Retorno: 16.41% | Sharpe: 1.11
Per√≠odo: 2022-01-01 a 2022-12-31 | Retorno: -0.90% | Sharpe: -1.23
Per√≠odo: 2023-01-01 a 2023-12-31 | Retorno: 28.97% | Sharpe: 1.69

=== Per√≠odo 5 ===
Otimiza√ß√£o: 2021-01-01 a 2023-12-31 (3 anos)
Teste: 2024-01-01 a 2024-12-31 (1 ano)
Start                         2024-01-02 00:00:00
End                           2024-12-30 00:00:00
Period                          251 days 00:00:00
Start Value                               10000.0
End Value                            10118.151868
Total Return [%]                         1.181519
Benchmark Return [%]                   -56.745042
Max Gross Exposure [%]                      100.0
Total Fees Paid                          20.11829
Max Drawdown [%]                        11.986312
Max Drawdown Duration           209 days 00:00:00
Total Trades                                    1
Total 

Start                         2024-01-02 00:00:00
End                           2024-12-30 00:00:00
Period                          251 days 00:00:00
Start Value                               10000.0
End Value                            10989.818641
Total Return [%]                         9.898186
Benchmark Return [%]                   -19.451035
Max Gross Exposure [%]                      100.0
Total Fees Paid                          18.97123
Max Drawdown [%]                         9.217325
Max Drawdown Duration           177 days 00:00:00
Total Trades                                    1
Total Closed Trades                             1
Total Open Trades                               0
Open Trade PnL                                0.0
Win Rate [%]                                100.0
Best Trade [%]                           9.908085
Worst Trade [%]                          9.908085
Avg Winning Trade [%]                    9.908085
Avg Losing Trade [%]                          NaN


Start                         2024-01-02 00:00:00
End                           2024-12-30 00:00:00
Period                          251 days 00:00:00
Start Value                               10000.0
End Value                              9350.49463
Total Return [%]                        -6.495054
Benchmark Return [%]                         -6.0
Max Gross Exposure [%]                      100.0
Total Fees Paid                         60.142436
Max Drawdown [%]                        31.997009
Max Drawdown Duration           220 days 00:00:00
Total Trades                                    3
Total Closed Trades                             3
Total Open Trades                               0
Open Trade PnL                                0.0
Win Rate [%]                            33.333333
Best Trade [%]                           3.207656
Worst Trade [%]                         -5.491635
Avg Winning Trade [%]                    3.207656
Avg Losing Trade [%]                    -4.817526


Resultados finais:
Per√≠odo: 2020-01-01 a 2020-12-31 | Retorno: 24.45% | Sharpe: 1.24
Per√≠odo: 2021-01-01 a 2021-12-31 | Retorno: 16.41% | Sharpe: 1.11
Per√≠odo: 2022-01-01 a 2022-12-31 | Retorno: -0.90% | Sharpe: -1.23
Per√≠odo: 2023-01-01 a 2023-12-31 | Retorno: 28.97% | Sharpe: 1.69
Per√≠odo: 2024-01-01 a 2024-12-31 | Retorno: 3.00% | Sharpe: -0.70


# Discuss√£o dos Resultados do Backtest Anual com Compara√ß√µes

Os resultados finais do backtest da estrat√©gia de **Pairs Trading** s√£o apresentados abaixo, junto com o **CDI anual** e **Ibovespa** para refer√™ncia:

| Per√≠odo | Retorno Estrat√©gia (%) | Sharpe | Retorno CDI (%) | Retorno Ibovespa (%) |
|---------|----------------------|--------|----------------|--------------------|
| 2020    | 24.45                | 1.24   | 2.75           | -1.99              |
| 2021    | 16.41                | 1.11   | 2.65           | 2.92               |
| 2022    | -0.90                | -1.23  | 9.90           | 4.08               |
| 2023    | 28.97                | 1.69   | 5.80           | 13.30              |
| 2024    | 3.00                 | -0.70  | 6.20           | 1.50               |

---

## üîπ Observa√ß√µes

1. **2020 e 2021**
   - Estrat√©gia superou amplamente **CDI** e, em 2020, tamb√©m superou o **Ibovespa**.
   - Sharpe acima de 1 indica risco-retorno positivo, mostrando que a estrat√©gia capturou bem revers√µes √† m√©dia.

2. **2022**
   - Retorno negativo da estrat√©gia (-0.90%) comparado com **CDI (9.9%)** e **Ibovespa (4.08%)**.
   - Mostra que, em anos de alta volatilidade e forte tend√™ncia de mercado, a estrat√©gia sofreu, enquanto renda fixa teve desempenho consistente.

3. **2023**
   - Excelente desempenho (28.97%), superando tanto **CDI** quanto **Ibovespa**.
   - Sharpe elevado (1.69) indica efici√™ncia na captura de oportunidades de revers√£o.

4. **2024**
   - Retorno modesto (3%) com Sharpe negativo (-0.70), inferior a **CDI (6.2%)**, mas ainda acima do **Ibovespa (1.5%)**.
   - Indica que o portf√≥lio enfrentou pouca oportunidade de revers√£o ou pares perderam cointegridade.

---

## üîπ Conclus√µes

- A estrat√©gia demonstra **potencial de alpha**, superando consistentemente o CDI e o Ibovespa em anos favor√°veis (2020, 2021, 2023).
- Em anos com forte tend√™ncia ou choques de mercado (2022), **renda fixa se mostra mais segura**, evidenciando a import√¢ncia de gest√£o de risco e hedge.
- Sharpe negativo em 2022 e 2024 refor√ßa a necessidade de:
  - Reavalia√ß√£o anual dos pares;
  - Ajuste de beta ou hedge din√¢mico;
  - Monitoramento cont√≠nuo da cointegridade dos pares e da volatilidade do spread.

---

> üîπ Em resumo: a estrat√©gia tem **bom desempenho relativo ao mercado e √† renda fixa**, mas precisa de **adapta√ß√£o cont√≠nua** para manter robustez em diferentes regimes de mercado.

