# Análisis Causal

Hasta ahora hemos usado el modelo de regresión para estudiar la relación entre una variable dependiente $y$ (*outcome*) y una o múltiples variables independientes $x$ (covariables o *covariates*). Sin embargo, **correlación no implica causalidad**.

En economía, y muchas otras disciplinas, queremos establecer relaciones causales. Es decir, nos interesa responder la pregunta **¿cuál es el efecto o impacto de $x$ en $y$?**

En el de modelo de regresión, el supuesto clave para interpretar nuestras estimaciones como efectos causales es:

$$E(\varepsilon | x) = 0$$

Por lo tanto, tratar de argumentar la validez de este supuesto concentrará nuestra atención.

## Modelo de Resultados Potenciales

Iniciamos nuestro estudio acerca de la causalidad entre variables con el modelo de resultados potenciales de Rubin. 

Suponga que nos interesa determinar el efecto causal de un tratamiento o política sobre una variable $y$. Definimos la variable $D_i$ como un indicador que toma el valor de 1 si el individuo $i$ recibió el tratamiento y 0 en caso contrario. Es decir, $D_i$ nos permite identificar los individuos tratados y los no tratados.

**En un mundo ideal** quisieramos observar el cambio (o **efecto**) en la variable $y_i$ en presencia de tratamiento ($D_i = 1$) y ausencia de tratamiento ($D_i = 0$). Es decir, el efecto del tratamiento para cada individuo $i$ es:

$$\tau_i = y_i(1) - y_i(0)$$

donde $y_i(1)$ es el valor que toma la variable de interés cuando $i$ es tratado y $y_i(0)$ es el valor que toma cuando $i$ no es tratado.

## Problema de Análisis Causal (*Observability Problem*)

Es evidente que no podemos observar $y_i(1)$ y $y_i(0)$ al mismo tiempo. 

**Para cada individuo solo observamos un valor $y_i$**, es decir, solo observamos $y_i(1)$ para los individuos tratados y solo observamos $y_i(0)$ para los individuos no tratados. Esto lo podemos resumir de la siguiente manera:

\begin{equation*}
y_i = y_i(1) \cdot D_i + y_i(0) \cdot (1 - D_i) =
    \left\{\begin{array}{lr}
    y_i(1), & \text{si } D_i = 1 \\
    y_i(0), & \text{si } D_i = 0 \\
    \end{array}\right.
\end{equation*}

Note que podemos reescribir $y_i$ cómo una función de regresión:

$$y_i = \underbrace{\hspace{3pt}\alpha\hspace{3pt}}_{E(y_i(0))} + \underbrace{\hspace{2pt}\tau_i\hspace{2pt}}_{y_i(1) - y_i(0)} D_i + \underbrace{\hspace{2pt}\varepsilon_i\hspace{2pt}}_{y_i(0) - E(y_i(0))}$$

## Parámetros de Interés

Debido a que no podemos determinar el efecto del tratamiento para cada individuo **nos concentraremos en el efecto promedio para una población** de estudio. Los siguientes son parámetros de interés que nos interesa considerar:

- **Efecto Promedio** (*ATE: Average Treatment Effect*): Relevante para programas universales

$$E(\tau_i) = E(y_i(1) - y_i(0)) = E(y_i(1)) - E(y_i(0))$$

- **Efecto Promedio en Tratados** (*ATT: Average Treatment on Treated*): Relevante para estimar la efectividad de una política (programa o tratamiento)

$$E(\tau_i | D_i = 1) = E(y_i(1)| D_i = 1) - \underbrace{E(y_i(0) | D_i = 1)}_{\text{Contrafactual}}$$

- **Efecto Promedio en No Tratados** (*ATU: Average Treatment on Untreated*): Relevate para estimar como una política puede afectar poblaciones no focalizadas (*spillovers*)

$$E(\tau_i | D_i = 0) = \underbrace{E(y_i(1)| D_i = 0)}_{\text{Contrafactual}} - E(y_i(0) | D_i = 0)$$

Es importante observar que el promedio contrafactual es un resultado hipotetico, pues no lo podemos observar.

## Modelo Regresión y Análisis Causal 

Supongamos por ahora que el efecto del programa es igual para todos los individuos, es decir, suponga que: 

$$\tau_i = \tau$$

De esta manera, nuestro modelo de regresión está dado por:

$$y_i = \alpha + \tau D_i + \varepsilon_i$$

Observe que 

$$E(y_i(1) | D_i = 1) = \alpha + \tau + E(\varepsilon_i | D_i = 1)$$
$$E(y_i(0) | D_i = 0) = \alpha + E(\varepsilon_i | D_i = 0)$$ 


## Sesgo de Autoselección 

A partir de esta ecuaciones podemos determinar que:

\begin{align*}
    \tau & = E(y_i(1) | D_i = 1) - E(y_i(0) | D_i = 0) + E(\varepsilon_i | D_i = 1) - E(\varepsilon_i | D_i = 0) \\\\
     & = E(y_i(1) | D_i = 1) - E(y_i(0) | D_i = 0) + \underbrace{E(y_i(0) | D_i = 1) - E(y_i(0) | D_i = 0)}_{\text{Sesgo de Autoselección}} \\
     & = ATT + \text{Sesgo de Autoselección} \\
\end{align*}

Observe que si $E(\varepsilon_i|D_i) = 0$, entonces

$$\tau = ATT = E(y_i(1) | D_i = 1) - E(y_i(0) | D_i = 0)$$

## Asignación Aleatoria a Tratamiento (RCT)

Asignar aleatoriamente el tratamiento implica que los factores observables y no observables que componen el término de error $\varepsilon_i$ son independiente de $D_i$. En otras palabras, 

$$E(\varepsilon_i | D_i) = E(\varepsilon_i) = 0$$

Si la asignación a tratamiento es aleatoria $D_i$ también es independiente de los resultados potenciales. Es decir, 

\begin{align*}
E(y_i | D_i = 1) - E(y_i | D_i = 0) & = E(y_i(1) | D_i = 1) - E(y_i(0) | D_i = 0) \\\\
& = E(y_i(1) | D_i = 1) - E(y_i(0) | {\color{red} D_i = 1}) \\\\
& = E(y_i(1) - y_i(0) | {\color{red} D_i = 1})\\\\
& = E(y_i(1) - y_i(0))\\
\end{align*}


