### Efficient Influence Function (EIF) - Material Extra

Daniel de Abreu Pereira Uhr



A **Efficient Influence Function (EIF)** (ou **Fun√ß√£o de Influ√™ncia Eficiente**) √© o **objeto matem√°tico fundamental** que define:

1. o **estimador mais eficiente poss√≠vel** de um par√¢metro causal (como o ATE),
2. e as condi√ß√µes sob as quais esse estimador √© **sem vi√©s em primeira ordem** mesmo quando usamos ML flex√≠vel nas etapas auxiliares.

Quando queremos estimar um par√¢metro causal, por exemplo o efeito m√©dio do tratamento (ATE):

$$
\psi_0 = E[m_1(X) - m_0(X)]
$$

onde (m_d(X) = E[Y|D=d, X]),

temos duas fontes de incerteza:

* o erro de amostragem (ru√≠do estat√≠stico);
* e o erro de estima√ß√£o dos ‚Äúnuisance functions‚Äù (os modelos de ($E[Y|D,X]$) e ($P(D|X)$)).

A **Efficient Influence Function (EIF)** √© uma fun√ß√£o ($\phi(W; \psi_0)$) que mede **como o erro em cada observa√ß√£o influencia o erro total do estimador** de forma linearizada.
Ela √© o **derivado de Gateaux** (ou gradiente funcional) do par√¢metro ($\psi(P)$) em rela√ß√£o √† distribui√ß√£o de probabilidade ($P$).

**Defini√ß√£o**

Considere o espa√ßo de todas as distribui√ß√µes (P) para os dados ($W=(Y,D,X)$).
O par√¢metro de interesse √© uma fun√ß√£o ($\psi(P)$) (por exemplo, o ATE).

A **influence function** (IF) √© definida como:

$$
\phi(W; P) = \left. \frac{d}{d\epsilon} \psi(P_\epsilon) \right|_{\epsilon=0}
$$
\phi(W; P) = \left. \frac{d}{d\epsilon} \psi(P_\epsilon) \right|_{\epsilon=0}
$$
onde (P_\epsilon = (1 - \epsilon) P + \epsilon \delta_W).

üëâ Interpreta√ß√£o:
√â a **sensibilidade infinitesimal** do estimando (\psi(P)) a pequenas perturba√ß√µes na distribui√ß√£o amostral em torno de (P).

A **Efficient Influence Function (EIF)** √© a **influence function com menor vari√¢ncia** entre todas as IFs v√°lidas (isto √©, todas que t√™m esperan√ßa zero e derivam corretamente (\psi(P))).
Essa vari√¢ncia m√≠nima define o **semiparametric efficiency bound**.

---

## ‚öôÔ∏è 3. Exemplo concreto: o ATE

Para (D \in {0,1}), o EIF do ATE √©:

[
\phi(W; \eta) =
\left[
\frac{D}{p(X)} - \frac{1-D}{1-p(X)}
\right](Y - m(D,X)) + [m(1,X) - m(0,X)] - \psi
]

onde:

* (p(X) = P(D=1|X)) √© o propensity score,
* (m(d,X) = E[Y|D=d, X]) √© o outcome regression,
* (\eta = (m, p)) √© o vetor dos ‚Äúnuisance parameters‚Äù.

üëâ Esse objeto √© poderoso porque:

* (E[\phi(W; \eta_0)] = 0) no ponto verdadeiro;
* Ele √© **ortogonal**: pequenas varia√ß√µes em (m) ou (p) n√£o alteram (\psi) em primeira ordem;
* E ele **gera todos os estimadores eficientes** poss√≠veis (TMLE, AIPW, DR-DML, etc).

---

## üéØ 4. O papel pr√°tico da EIF

A EIF serve como a **base de constru√ß√£o** de todos os estimadores modernos de efeito causal:

| Estimador                | Como usa a EIF                                                            |
| ------------------------ | ------------------------------------------------------------------------- |
| **AIPW (Augmented IPW)** | Substitui (m, p) por ML e usa a m√©dia de (\phi(W; \hat\eta))              |
| **TMLE**                 | Ajusta (m) at√© que a m√©dia de (\phi(W; \hat\eta^*) = 0)                   |
| **DR-DML**               | Usa cross-fitting e estima (\psi) resolvendo (E_n[\phi(W; \hat\eta)] = 0) |
| **Causal Forests**       | Aproximam o EIF localmente em cada folha                                  |
| **G-formula**            | Impl√≠cita, sem ajuste pela EIF (por isso √© menos robusta)                 |

---

## üìà 5. Propriedades chave

1. **Esperan√ßa zero:**
   [
   E[\phi(W; \eta_0)] = 0
   ]

2. **Ortogonalidade:**
   [
   \frac{\partial E[\phi(W; \eta)]}{\partial \eta}\Big|_{\eta_0} = 0
   ]
   ‚Üí pequenos erros em ML n√£o afetam (\hat\psi).

3. **Vari√¢ncia m√≠nima:**
   [
   Var(\phi(W; \eta_0)) = \text{Semiparametric Efficiency Bound}
   ]

4. **Infer√™ncia assint√≥tica:**
   [
   \sqrt{n}(\hat\psi - \psi_0) \to N(0, Var(\phi(W; \eta_0)))
   ]
   ‚Üí Intervalos de confian√ßa v√™m diretamente da EIF.

---

## üß© 6. Rela√ß√£o entre TMLE, DR e DML

* **TMLE**: constr√≥i um modelo para (m(D,X)) e ajusta via *targeting* at√© satisfazer (E_n[\phi(W;\hat\eta)] = 0).
* **DR-DML**: usa cross-fitting e resolve a mesma equa√ß√£o, mas sem targeting iterativo.
* **Ambos estimam o mesmo par√¢metro** ‚Äî o ATE ‚Äî definido exatamente pela EIF acima.

---

## üîç 7. Interpreta√ß√£o intuitiva

Pense na EIF como o **"peso √≥timo"** que cada observa√ß√£o deve ter para corrigir vi√©s de confus√£o.

* O termo (\frac{D}{p(X)} - \frac{1-D}{1-p(X)}) ajusta o desequil√≠brio de propens√£o;
* O termo (Y - m(D,X)) corrige a predi√ß√£o;
* E (m(1,X) - m(0,X)) d√° o componente contrafactual esperado.

A m√©dia ponderada desses componentes √© o **efeito causal eficiente**.

---

## üìö 8. Refer√™ncias fundamentais

* van der Laan & Robins (2003). *Unified Methods for Causal Inference.* Springer.
* Chernozhukov et al. (2018). *Double Machine Learning for Treatment and Structural Parameters.* J. Econometrics.
* Kennedy, E. (2022). *Semiparametric Doubly Robust Targeted Learning: Bridging TMLE and DML.*

---

Se quiser, posso te mostrar **como derivar a EIF passo a passo** a partir da defini√ß√£o de ( \psi(P) = E[m_1(X) - m_0(X)] ), mostrando como surgem naturalmente os termos de regress√£o e pondera√ß√£o.
Quer que eu monte essa deriva√ß√£o formal completa?
