## Practica método de Muestreo aleatorio para la inferencia en Redes Bayesianas

En esta práctica vamos a programar el método de muestreo aleatorio para la inferencia en Redes Bayesianas. 

En el método del muestreo aleatorio se generan N ejemplos de la distribución de la RB. Estos ejemplos se generan muestreando cada nodo de la red de arriba a abajo. Después,se utilizan las muestras que contienen la evidencia = e y la querie para estimar la probabilidad condicionada.

## Nodos y Grafos 
Para implementar los nodos de una Red Bayesiana y el Grafo vamos a utilizar clases y diccionarios de python. En la siguiente celda la clase nodo representa un nodo de la Red Bayesiana. Como información tiene:
- padres: lista donde se almacenan los nodos padres
- hijos: lista donde se almacenan los nodos hijos
- p: lista con la tabla de probabilidades
- state: El estado de la variable. En principio como es una variable aletaria desconocemos su valor, por eso se inicia a None. Si 'vemos' el valor de la variable, es decir si esa variable es una evidencia, conocemos su valor. Entonces podremos cambiar el estado al valor de la variable. En esta práctica las variables son binarias, por lo tanto el estado podrá ser 0 (positivo) o 1 (negativo).
- num_states: el número de posibles estados
- states: los valores de los estados (como vamos a trabajar con variables binarias los estados serán 0 o 1.


In [1]:
import random
class nodo:
    def __init__(self, padres, hijos, p):
        self.padres = padres
        self.hijos = hijos
        self.p = p
        
        self.num_states = 2
        self.states = [0, 1]
        self.state = None
        
    
    def sample(self, estado_padres):
        prob = random.random()
        if (len(estado_padres) == 0):
            if (prob < self.p[0]):
                self.state = 0
            else:
                self.state = 1
        elif (len(estado_padres) == 1):
            if prob < self.p[estado_padres[0]][0]:
                self.state = 0
            else:
                self.state = 1
        else:
            if prob < self.p[estado_padres[0]][estado_padres[1]][0]:
                self.state = 0
            else:
                self.state = 1

            

En esta práctica vamos a trabajar con la RB que tenía las variables Nublado, Aspersor, Lluvia y Mojado. En la siguiente celda definimos la distribución de probabilidad de la variable Nublado y creamos un objeto nodo. Las listas de hijos y padres continen la información de las relaciones entre las variables. Vamos a crear unas etiquetas, valores enteros, para identificar cada nodo:
- Nublado: 0
- Aspersor: 1
- Lluvia: 2
- Mojado: 3

In [2]:
# Nublado
pN = [0.5, 0.5]
Nublado = nodo([], [1,2], pN)

In [3]:
# Aspersor
pA = [[0.1, 0.9], [0.5, 0.5]] #probabilidad de que A=true/false dado que N=true o false (N es padre de A)
Aspersor = nodo([0],[3], pA)

Si quiero ver la probabilidad de que el aspersor se encienda si el cielo está nublado:

In [4]:
# pongo el estado de nublado a positivo:
Nublado.state = 0
print(Aspersor.p[Nublado.state][0]) #primera variable para decir si nublado, y segunda para ver aspersor encendido

0.1


Completa la tabla con la distribución de la variable Lluvia y la variable Mojado y crea sus nodos:

In [5]:
# Lluvia
pL = [[0.8,0.2],[0.3,0.7]]
Lluvia = nodo([0],[3],pL)

In [6]:
#Mojado
pM = [[[1,0],[0.9,0.1]],[[0.9,0.1],[0.01,0.99]]]
Mojado = nodo([1,2],[],pM)

Pon los estados de aspersor y lluvia con valor 1 y comprueba la probabilidad de que el suelo esté mojado condicionado a no aspersor y no lluvia: 

In [7]:
Aspersor.state = 1
Lluvia.state = 1
print(Mojado.p[Aspersor.state][Lluvia.state][0])


0.01


El Grafo lo guardamos en un diccionario en el que la clave es la etiqueta de cada nodo y el valor es el propio nodo:

In [8]:
Grafo = {0: Nublado, 1:Aspersor, 2:Lluvia, 3:Mojado}

In [9]:
# Esta función pasa los estados de cada nodo del grafo a un diccionario y lo imprime
def imprime(g):
    totalstate={}
    for nodo in g.keys():
        totalstate[nodo] = g[nodo].state
    print(totalstate)
imprime(Grafo)

{0: 0, 1: 1, 2: 1, 3: None}


Crea una función que recorra todos los nodos de un grafo y ponga todos sus estados a None:

In [10]:
def reset_grafo(g):
    totalstate={}
    for nodo in g.keys():
        g[nodo].state = None
    return g
g = reset_grafo({0: Nublado, 1:Aspersor, 2:Lluvia, 3:Mojado})

Ahora vamos implementar un recorrido en anchura del grafo para generar una muestra. El objetivo es ir recorriendo en anhura los nodos del grafo, y en cada nodo mediante un número aleatorio modificar el estado del nodo. Para modificar el estado del nodo, primero debes volver a la celda inicial y completar el método sample(). Este nuevo nodo tiene como parámetro una lista con los estados de los nodos padres para poder acceder a la probabilidad condicionada y cambia el estado del nodo a 0 o 1 dependiendo del valor aleatorio que se genera dentro del método. Ten en cuenta que en nuestro ejemplo hay un nodo que no tiene ningún padre, otros nodos tiene un padre y otro nodo tiene dos padres. 
Comprueba que el método sample funciona:

In [21]:
Mojado.sample([0,1])
print(Mojado.state)

0
{0: 0, 1: 1, 2: 0, 3: 0}


Completa la función recorrido_anchura en que recorras el grafo en anchura. Utiliza la versión iterativa con la que trabajamos en búsquedas con la lista de abiertos y cerrados. En este caso cada vez que tengas un nodo en actual se llama al método sample y se cambia el estado de ese nodo. Al acabar de recorrer el grafo, todas las variables tendrán un estado, es decir se habrá generado una muestra aleatoria. El nodo que se pasa como parámetro es el nodo raiz del grafo.

In [31]:
from collections import deque
def recorrido_anchura(node, graph):
    abiertos = deque([node])
    cerrados = []
    actual = None
    while (len(abiertos) > 0):
        actual = abiertos.popleft()
        cerrados.append(actual)
        estado_padres =  []
        for i in range(len(actual.padres)):
            estado_padres.append(graph[actual.padres[i]].state)
        actual.sample(estado_padres)
        sucesores = actual.hijos
        nuevos_sucesores = []
        for sucesor in sucesores:
            sucesor = graph[sucesor]
            if not sucesor in abiertos and not sucesor in cerrados:
                nuevos_sucesores.append(sucesor)
        abiertos.extend(nuevos_sucesores)
    return graph
reset_grafo(Grafo)
imprime(recorrido_anchura(Nublado, Grafo))

{0: 0, 1: 1, 2: 1, 3: 1}


Cada muestra la vamos a representar mediante un diccionario, por ejemplo este diccionario es una muestra:

{0:1, 1:0, 2:1, 3:0}

Crea una función que primero resetea el grafo, después realiza un recorrido en anchura y finalmente devuelve una muestra con los estados de los nodos del grafo.

In [25]:
def sample_grafo(node, graph):
    reset_grafo(graph)
    states = recorrido_anchura(node,graph)
    return states
imprime(sample_grafo(Nublado,Grafo))

{0: 1, 1: 1, 2: 1, 3: 1}


Finalmente vamos a a crear una función que realice la inferencia aproximada utilizando el método del muestreo con rechazo. La función tendrá como parámetros una query, una evidencia y un grafo. Las queries y las evidencias las vamos a representar mediante diccionarios, por ejemplo: Si queremos saber $P(+m|\neg n)$ entonces:
- query = {3:0} # El valor de la variable Mojado es 0.
- evidencia = {0:1} # El valor de la variable Nublado es 1.


Si nos preguntan $P(+Ll| +a, +m)$
- query = {2:0}
- evidence = {1:0, 3:0}


In [32]:
def match (graph, predicate):
    for keys in predicate:
        if graph[keys].state != predicate[keys]:
            return False
    return True

def infer(query, evidence, graph, num = 20000):
    n_evidence = 0
    n_query_and_evidence = 0
    for i in range(num):
        sample = sample_grafo(Nublado,graph)
        if (match(sample,evidence)):
            n_evidence += 1
            if (match(sample,query)):
                n_query_and_evidence += 1
    return n_query_and_evidence / n_evidence
print(infer({2:0},{1:0, 3:0},Grafo))

0.41617143886187646


Comprueba $P(+m|\neg n)$ y $P(+Ll| +a, +m)$ con los resultados que hemos obtenido utilizando el método de enumeración.

In [33]:
print(infer({3:0},{0:1},Grafo))
print(infer({2:0},{1:0, 3:0},Grafo))


0.6040060090135203
0.4100515006215592
