# Generación de muestras a partir del modelo de una red bayesiana
### Bogdan Kaleb García Rivera 
\
Diseñe e implemente un programa en el que utilizando los parámetros de una Red Bayesiana (estructura y probabilidades condicionales especificados en clase) así como un generador de valores aleatorios con distribución uniforme genere un conjunto de instancias de las variables y posteriormente las cuantifique para verificar a parir de los datos se pueden obtener los parámetros del modelo. Generar una cantidad "adecuada" de observaciones, datos, de tal manera que al cuantificar los valores de probabilidad estos se aproximen lo más posible a los valores de probabilidad establecidos en el modelo.

### 1) Generar instancias de las variables y cuantificar cuantos realizaciones de cada posible valores del conjunto de variables se obtuvieron.

In [None]:
import random
def genera_aleatorios(longitud = 1000):
  estados = [(0,0,0), (0,0,1), (0,1,0), (0,1,1), (1,0,0), (1,0,1), (1,1,0), (1,1,1)]
  cuenta_estados = [0,0,0,0,0,0,0,0]
  for i in range(longitud):
    x1 = random.random()
    x2 = random.random()
    x3 = random.random()

    if x1 <= 0.4:
      x1 = 0
    else:
      x1 = 1

    if x2 <= 0.2:
      x2 = 0
    else:
      x2 = 1

    if x1 == 0:
      if x3 <= 0.1:
        x3 = 0
      else:
        x3 = 1
    else:
      if x3 <= 0.6:
        x3 = 0
      else:
        x3 = 1
    edo = (x1,x2,x3)
    indice = estados.index(edo)
    cuenta_estados[indice] += 1
  return(cuenta_estados), estados

cuenta_edos,estados = genera_aleatorios(longitud=100000)
print("[X1 X2 X3]")
for i in range(len(estados)):
  print(estados[i], cuenta_edos[i])

[X1 X2 X3]
(0, 0, 0) 782
(0, 0, 1) 7264
(0, 1, 0) 3269
(0, 1, 1) 28881
(1, 0, 0) 7200
(1, 0, 1) 4809
(1, 1, 0) 28935
(1, 1, 1) 18860


## 2) A partir de las cantidades obtenidas en el punto anterior determinar las probabilidades condicionales del modelo.


In [None]:
# P(X3=0 | X1=0)
cuenta_x1_0 = sum(cuenta_edos[i] for i in range(len(estados)) if estados[i][0] == 0)
cuenta_x1_0_x3_0 = sum(cuenta_edos[i] for i in range(len(estados)) if estados[i][0] == 0 and estados[i][2] == 0)
p_x3_0_dado_x1_0 = cuenta_x1_0_x3_0 / cuenta_x1_0
print("P(X3=0 | X1=0):", p_x3_0_dado_x1_0)

# P(X3=1 | X1=0)
cuenta_x1_0_x3_1 = sum(cuenta_edos[i] for i in range(len(estados)) if estados[i][0] == 0 and estados[i][2] == 1)
p_x3_1_dado_x1_0 = cuenta_x1_0_x3_1 / cuenta_x1_0
print("P(X3=1 | X1=0):", p_x3_1_dado_x1_0)


# P(X3=0 | X1=1)
cuenta_x1_1 = sum(cuenta_edos[i] for i in range(len(estados)) if estados[i][0] == 1)
cuenta_x1_1_x3_0 = sum(cuenta_edos[i] for i in range(len(estados)) if estados[i][0] == 1 and estados[i][2] == 0)
p_x3_0_dado_x1_1 = cuenta_x1_1_x3_0 / cuenta_x1_1
print("P(X3=0 | X1=1):", p_x3_0_dado_x1_1)

# P(X3=1 | X1=1)
cuenta_x1_1_x3_1 = sum(cuenta_edos[i] for i in range(len(estados)) if estados[i][0] == 1 and estados[i][2] == 1)
p_x3_1_dado_x1_1 = cuenta_x1_1_x3_1 / cuenta_x1_1
print("P(X3=1 | X1=1):", p_x3_1_dado_x1_1)



P(X3=0 | X1=0): 0.10078117225594586
P(X3=1 | X1=0): 0.8992188277440541
P(X3=0 | X1=1): 0.6042237977392817
P(X3=1 | X1=1): 0.39577620226071836


## 3) Comparar los resultados del punto anterior con los parámetros del modelo. ¿Cuántas realizaciones se utilizaron?

De acuerdo al modelo sugerido con sus probabilidades, los valores fueron sumamente cercanos a lo teórico (0.1, 0.9, 0.6, 0.4 respectivamente). Se inició el proceso realizando únicamente 10 muestras y de ahí se agregaban potencias de 10, es decir 100, 1000, 10000 muestras, comportandose mejor a partir de 1000 muestras. El último resultado se realizó con 100,000 muestras, obteniendo probabilidades muy cercanas a lo que dicta la teoría.  

## 4) ¿Cómo podría utilizar estos resultados para determinar la estructura de una Red Bayesiana?

Para determinar la estructura de la red bayesiana se puede realizar el cálculo de las probabilidades dada ciertas variables. Por ejemplo, se puede realizar la probabilidad de X1 con respecto de X2 y se debe verificar que sus probabilidades son independientes. Esto se logra realizando un cálculo de cada una de las probabilidades de las variables y multiplicándolas, dando como resultado algo cercano a la probabilidad teórica. Por ejemplo

$$P(X1=0, X2=0) ≈ 0.4 * 0.2 = 0.08 $$

Si se hace el cálculo de todos los datos y se realiza de forma empírica, la probabilidad debería ser cercana a 0.08.

Ese proceso se puede realizar para cada una de las variables. De igual forma, para determinar si es dependiente se puede realizar el mismo procedimiento con las variables pero ahora con dependencia, es decir:

$$P(X,Y|Z) \neq P(X|Z) \cdot P(Y|Z).$$

Si cumple con lo anterior entonces se puede decir que es un grafo conectado en esos dos puntos (X1 y X3).