## 04 - Primeros modelos generativos controlados

En el capítulo anterior propusimos un método conocido comúnmente como **A/B testing** para garantizar que las estadísticas causales se podrían deducir utilizando únicamente los datos observados.  

Es muy importante insistir en que para lograr obtener una muestra con un A/B testing es necesario rehacer el muestreo $(X, Y)$, por lo cual estamos hablando más bien del diseño de nuestro experimento.

En esta sección hablaremos de algunos ejemplos de modelos matemáticos que incluyen funciones deterministas y distribuciones, los cuales también nos permitirán deducir cantidades causales utilizando únicamente este modelo.  

Estos modelos serán la base de los modelos causales que presentaremos en el siguiente módulo del curso.

En este capítulo nuevamente utilizaremos la misma notación para las variables contrafactuales.

---

#### Modelo I

Supongamos que tenemos dos variables aleatorias de Bernoulli e independientes:  
$$
X \perp Y
$$

A continuación mostramos una simulación casi perfecta de las hipótesis anteriores.

Consideremos la siguiente tabla con los datos observados:

| $X$ | $Y$  |
|:----:|:----:|
|  0   |  -1  |
|  0   |  1   |
|  2   |  -1  |
|  2   |  1   |

Con las hipótesis del problema de las promociones y los clientes churn del capítulo anterior, nos podríamos hacer la siguiente pregunta contrafactual:  

Supongamos que un cliente ha recibido la promoción pero a pesar de ello ha decidido abandonar su suscripción.  
¿Qué hubiera pasado si ese cliente no hubiera recibido la promoción?  
En particular:  
 
$$
P\bigl(Y^*(0) = +1 \mid X = 2, Y = -1\bigr)
$$

Utilizando el modelo generativo anterior es bastante sencillo responder a esta pregunta siguiendo el siguiente razonamiento:

1. Los registros en los que $X = 2, Y = -1$ son una cuarta parte de la base de datos, están en el tercer renglón de nuestra base de datos.

2. Si modificamos la variable $X$ para que ahora valga 0, ya que las variables son independientes ($X \perp Y$), nada cambiaría en la variable $Y$, lo cual significa que la probabilidad que queremos calcular es igual a 0.


#### Modelo II

Para este segundo modelo vamos a suponer que tenemos dos variables aleatorias de Bernoulli e independientes:  
$$
X \perp Z
$$

En el proceso generativo también supondremos que existe una tercera variable $Y$ que cumple la siguiente relación funcional, donde la función "sign" envía a los números positivos al $+1$ y a los números negativos al $-1$:

$$
Y = \operatorname{sign}\bigl(X \cdot Z + (1 - X)(1 - Z)\bigr)
$$

Al simular este modelo generativo obtenemos la siguiente base de datos:

| $X$ | $Z$ | $Y$  |
|:----:|:----:|:----:|
|  0   |  0   |  1   |
|  0   |  2   | -1   |
|  2   |  0   | -1   |
|  2   |  2   |  1   |
|  0   |  0   |  1   |
|  0   |  2   | -1   |
|  2   |  0   | -1   |
|  2   |  2   |  1   |

Es interesante notar que en ambos modelos las variables observadas $(X, Y)$ son idénticas, lo cual significa que esto es una tarea complicada para el científico de datos.

Nuevamente nos gustaría responder la siguiente pregunta contrafactual (la misma que en el modelo anterior):

Supongamos que un cliente ha recibido la promoción pero a pesar de ello ha decidido abandonar su suscripción.  
¿Qué hubiera pasado si ese cliente no hubiera recibido la promoción?  

¿Si ese cliente no hubiera recibido la promoción nos habría abandonado?
La siguiente cantidad nos podría ayudar a contestar esa pregunta:

$$
P\bigl(Y^*(0) = +1 \mid X = 2, Y = -1\bigr)
$$

---


Utilizando el modelo generativo anterior también podemos calcular esta cantidad siguiendo el siguiente razonamiento:

1. Los registros en los que $X = 2, Y = -1$ son una cuarta parte de la base de datos, están en el tercer renglón y en el séptimo de la base de datos.

2. La observación importante es que, de acuerdo a este modelo, aquellos registros que abandonaron y sí recibieron la promoción son exactamente aquellos para los que la variable $Z = 0$.

3. Ahora supongamos que intervenimos la variable $X$ cambiándola por un $0$, gracias a la observación anterior la muestra que ahora nos interesa son aquellos registros donde $X = 0, Z = 0$ y en este caso la variable $Y$ siempre será igual a $+1$. Si lo desean verificar, son el primer y quinto registro en la base de datos.

4. Por lo anterior, en este segundo modelo podemos deducir que

$$
P\bigl(Y^*(0) = +1 \mid X = 2, Y = -1\bigr) = 1
$$

precisamente lo contrario que en el Modelo I.

### Knowleadge Checkpoint 

¿En cuál problema considera usted que se pueden utilizar los métodos de esta semana? Por favor describa el problema y los datos de manera detallada sin revelar información confidencial. 

En la semana vimos ejemplos de modelos binarios tanto para X y para Y, otro ejemplo puede ser:
El uso de GPT de forma regular (sí / no) para el aprendizaje vs. examen de validación (aprobatorio, no-aprobatorio)

En el curso se introdujeron las variables contrafacturales Y*(0) e Y*(2). ¿Si las variables objetivo tuvieran 4 clases y las variables explicativas tuvieran 3 clases distintas, ¿cuáltas variables confrafactuales habrían?

Vamos a pensar en: 
$$P\bigl(Y^*(0) = +1 \mid X = 2, Y = -1\bigr) = 1 $$

Sabemos que para X=2, Y=-1, Z siempre es 0.

| $X$ | $Z$ | $Y$  |
|:----:|:----:|:----:|
|  2   |  0   | -1   |
|  2   |  0   | -1   |


------
Entonces buscamos $P\bigl(Y^*(0) = +1 \mid Z=0 \bigr) $, lo que sabemos que Y siempre = 1, en este caso.


| $X$ | $Z$ | $Y$  |
|:----:|:----:|:----:|
|  0   |  0   |  1   |
|  0   |  0   |  1   |
