## **3.5 - Cointegração**

#### *O que é cointegração e por que importa*

Em finanças e macroeconomia é comum lidar com **séries em nível não estacionárias**, como preços, índices, taxas de câmbio e variáveis agregadas. Apesar de cada série, individualmente, apresentar **tendência estocástica** (raiz unitária), um **conjunto** delas pode compartilhar um **relacionamento de equilíbrio de longo prazo**: existe uma **combinação linear não trivial** que é **estacionária**. Quando isso ocorre, dizemos que as séries são **cointegradas**.

Imagine dois preços de ativos que se movem com tendência e choques próprios, mas sujeitos a forças comuns (custos de arbitragem, substituição, fundamentos). Eles podem “**andar juntos**”: a **diferença ponderada** (o **spread**) oscila ao redor de um nível estável, mesmo que cada preço, isoladamente, não o faça. Esse spread estacionário é a assinatura da cointegração e sustenta estratégias de **reversão à média** (ex.: *pairs trading*), além de evitar **regressões espúrias** em níveis.

#### *Definições formais*

Uma série $\{X_t\}$ é dita **integrada de ordem $d$**, escrito $I(d)$, se a sua **$d$-ésima diferença** é **estacionária** (com variância finita) enquanto a $(d\!-\!1)$-ésima **não** é. Denotando o operador de diferença por $\nabla=(1-B)$, onde $BX_t=X_{t-1}$ é o operador de defasagem, temos:  
- $\nabla^d X_t \;=\; (1-B)^d X_t$ é $I(0)$ (estacionário);  
- $\nabla^{d-1} X_t$ **não** é estacionário.

O caso mais comum é **$I(1)$**: a série em **nível** é não estacionária (tipicamente com **raiz unitária**), mas a **primeira diferença** $\nabla X_t=X_t-X_{t-1}$ é estacionária. Exemplos: *random walk* com ou sem *drift* é $I(1)$; uma série já estacionária em nível é $I(0)$.

Seja $Z_t=(X_{1t},\dots,X_{nt})'$ um vetor de séries **integradas de ordem 1**, isto é, cada componente é $I(1)$ e suas diferenças são $I(0)$:
$$
\Delta X_{it} = X_{it} - X_{i,t-1} \quad \text{é estacionária para } i=1,\dots,n.
$$

Dizemos que $Z_t$ é **cointegrado** se existir um vetor não nulo $\beta\in\mathbb{R}^n$ tal que a **combinação de longo prazo**
$$
u_t \;=\; \beta' Z_t
$$
seja **estacionária** ($I(0)$). O processo $u_t$ é o **erro de equilíbrio** (ou **equação de cointegração**). O **número** de vetores de cointegração linearmente independentes é o **posto de cointegração** $r$ (com $0<r<n$).

Para o caso bivariado ($n=2$), a definição reduz-se a encontrar $\beta_1,\beta_2$ (não ambos zero) tais que
$$
u_t \;=\; \beta_1 X_t + \beta_2 Y_t \quad \text{é } I(0).
$$
Usa-se com frequência a **normalização** $u_t = X_t - \beta Y_t$ para interpretar $\beta$ como **hedge ratio**.


#### *Como detectar cointegração*

##### *1) Pré-condição: ordem de integração*
Antes de testar cointegração, verifique que as séries são **$I(1)$** (não estacionárias em nível, estacionárias em diferença), usando inspeção gráfica, ACF/PACF e testes de raiz unitária (ADF/PP/KPSS em versão apropriada).

##### *2) Testes de cointegração*

**Engle–Granger (EG)** 

É a porta de entrada quando você tem **duas séries** que parecem caminhar juntas no longo prazo, mas cada uma, sozinha, é não estacionária $I(1)$. A lógica é: se existe um **equilíbrio** entre elas, então a **diferença adequada** (o *spread*) deve **oscilar ao redor de um nível** e **voltar** quando se afasta. Para verificar isso, o EG faz duas etapas. Primeiro, você **estima a relação de longo prazo** por uma regressão em nível, por exemplo $X_t=\gamma+\beta Y_t+e_t$. Essa regressão não serve para inferir “causalidade” nem previsão direta; ela só tenta **achar o vetor $\beta$** que constrói o spread. Segundo, você **testa se os resíduos $\hat e_t$** dessa regressão são **estacionários**. Se os resíduos passam num **teste de raiz unitária** específico para EG (as tabelas críticas não são as do ADF padrão), a interpretação é: *o spread é estável*, portanto **há cointegração**; se não passam, provavelmente **não há**. A intuição é bem física: imagine duas partículas ligadas por um elástico; cada uma pode vagar, mas o elástico puxa a diferença de volta. O EG detecta justamente esse “puxão” olhando se $\hat e_t$ tem comportamento de **reversão à média**.

Esse procedimento tem sutilezas simples. Você precisa decidir **se inclui constante e/ou tendência** na regressão de longo prazo (isso depende do gráfico das séries). Também precisa escolher **lags** no teste de raiz unitária dos resíduos para lidar com autocorrelação de curto prazo. E como $\beta$ vem de uma regressão, o **sentido da normalização** importa para interpretar o *hedge ratio*: ao escrever $X_t-\beta Y_t$, você lê $\beta$ como “quantos $Y$” compensam um $X$ no spread.

**Johansen**

Generaliza a ideia quando você tem **duas ou mais séries** ao mesmo tempo e quer descobrir **quantos** relacionamentos de equilíbrio existem. Em vez de ajustar uma regressão e testar resíduos, o Johansen monta um **VAR em diferenças** que inclui um termo de **correção de erros**; esse termo é justamente a forma matricial do “elástico” de longo prazo. A matriz $\Pi=\alpha\beta'$ contém dois ingredientes: $\beta$ reúne os **vetores de cointegração** (as combinações lineares que criam *spreads* estacionários) e $\alpha$ mede as **velocidades de ajuste** (o quão forte cada série reage a um desvio do equilíbrio). O teste então olha para os **autovalores** associados a $\Pi$ e, por meio das estatísticas **Traço** e **Máx. Autovalor**, decide o **posto de cointegração $r$**: zero significa que **não há** equilíbrio comum; um significa **um** spread estável; maior que um indica **vários** spreads independentes. Com $r$ definido, o Johansen **entrega estimativas de $\beta$ e $\alpha$** de forma conjunta e consistente, o que é especialmente útil quando há mais de dois ativos e você quer construir **portfólios neutros** a esses equilíbrios.

Na leitura prática, EG é simples e funciona bem para **pares**: ache $\beta$, teste o spread, siga em frente. Se você lida com **vários ativos** ou quer permitir **múltiplos equilíbrios**, Johansen é o caminho natural. Em ambos os testes, três cuidados mantêm os resultados confiáveis: olhar o **gráfico** para decidir termos determinísticos (constante/tendência), escolher **lags** suficientes no VAR/teste de resíduos para capturar dinâmica de curto prazo e lembrar que **quebras estruturais** podem destruir um relacionamento de longo prazo que existia no passado. Em resumo, ambos procuram a mesma coisa — **um spread estacionário** —; o EG faz isso “resíduo a resíduo” para duas séries, enquanto o Johansen o faz de forma **vetorial**, estimando **quantos** spreads existem e **como** o sistema volta ao equilíbrio.

*Recomendamos fortemente que pesquisem mais sobre esses testes e, inclusive, como implementá-los em Python (infelizmente, por falta de mão de obra, não conseguimos fazer isso a tempo).*