# **REDES BAYESIANAS**

### Probabilidad condicional

Siempre que tengamos dos variables aleatorias $A$ y $B$, la probabilidad condicional de $A$ dado $B$ se define como:

$$P(A/B) = \frac{P(A,B)}{P(B)}$$

Y, por supuesto, taambién es posible definir la probabilidad condicional de $B$ dado $A$:

$$P(B/A) = \frac{P(A,B)}{P(A)}$$

También podemos definir la probabilidad conjunta de $A$ y $B$ como:

$$P(A,B) = P(A/B)P(B) = P(B/A)P(A)$$

En el caso de tener tres variables aleatorias $A$, $B$ y $C$, la probabilidad condicionada de $A$ dado $B$ y $C$ se define como:

$$P(A/B,C) = \frac{P(A,B,C)}{P(B,C)}$$

Y, por supuesto, también es posible definir, por ejemplo, la probabilidad condicionada de $A$ y $B$ dado $C$:

$$P(A,B/C) = \frac{P(A,B,C)}{P(C)}$$


### DCC: Tabla completa de probabilidades conjuntas

Si tenemos un cojunto de variables aleatorias, la tabla completa de probabilidades conjuntas recoge cada una de las posibles combinaciones de valores de las variables aleatorias y la probabilidad conjunta de que ocurran dichos valores. Por ejemplo, si tenemos las variables aleatorias **Dolor**, **Caries** y **Hueco**, la tabla completa de probabilidades conjuntas sería:

<table>
<tr>
    <td></td> <td><b>dolor</b></td> <td><b>dolor</td> <td><b>¬dolor</td> <td><b>¬dolor</td>
</tr>
<tr>
    <td></td> <td><b>hueco</b></td> <td><b>¬hueco</b></td> <td><b>hueco</b></td> <td><b>¬hueco</b></td>
</tr>
<tr>
    <td><b>caries</b></td> <td>0.108</td> <td>0.012</td> <td>0.072</td> <td>0.008</td>
</tr>
<tr>
    <td><b>¬caries</b></td> <td>0.016</td> <td>0.064</td> <td>0.144</td> <td>0.576</td>
</tr>
</table>

A partir de esta tabla es posible calcular la probabilidad conjunta de cualquier combinación de valores de las variables aleatorias. Por ejemplo, la probabilidad conjunta de que el paciente tenga dolor, tenga huecos y no tenga caries es:

$$P(dolor, hueco, ¬caries) = 0.016$$

Y la probabilidad conjunta de que el paciente tenga dolor y no tenga caries es:

$$P(dolor, ¬caries) = P(dolor, ¬caries, hueco) + P(dolor, ¬caries, ¬hueco) = 0.016 + 0.064 = 0.08$$

Vemos en este último ejemplo que la probabilidad conjunta de que el paciente tenga dolor y no tenga caries es la suma de las probabilidades conjuntas de que el paciente tenga dolor, no tenga caries y huecos más la probabilidad conjunta de que el paciente tenga dolor, no tenga caries y no tenga huecos. Por tanto, el cálculo de probabilidades conjuntas cuando no especificamos el valor de todas las variables aleatorias debe realizarse a partir de la suma de las combinaciones posibles de valores de las variables aleatorias que no se especifican. Esto nos lleva a la regla de marginalización:

$$ P(Y) = \sum_{z} P(Y, z) $$

A partir de la DCC es posible calcular la probabilidad condicional de cualquier variable aleatoria. Por ejemplo, la probabilidad condicional de que el paciente tenga dolor dado que tiene huecos y no tiene caries es:

$$P(dolor/hueco, ¬caries) = \frac{P(dolor, hueco, ¬caries)}{P(hueco, ¬caries)} = \frac{0.016}{0.016 + 0.144} = 0.1$$

### Regla del producto

Supongamos que tenemos cuatro variables aleatorias $A$, $B$, $C$ y $D$, la probabilidad conjunta de estas variables aleatorias la podemos determinar a partir de la regla del producto:

$$P(A,B,C,D) = P(A/B,C,D)P(B,C,D) = P(A/B,C,D)P(B/C,D)P(C,D) = P(A/B,C,D)P(B/C,D)P(C/D)P(D)$$

### Independencia de variables aleatorias

Dos variables aleatorias $A$ y $B$ son independientes si:

$$P(A/B) = P(A)$$ 

y 

$$P(B/A) = P(B)$$

Por tanto, si $A$ y $B$ son independientes, entonces:

$$P(A,B) = P(A/B)P(B) = P(A)P(B)$$

Cuando tenemos tres variables aleatorias $A$, $B$ y $C$, si $A$ y $B$ son independientes, entonces:

$$P(A/B,C) = P(A/C)$$



## **Red bayesiana**

<img src="rb.svg" >

Para este ejemplo, nuestra DCC tendría 32 celdas. Por la regla del producto, la probabilidad conjunta de todas las variables aleatorias sería:

$$P(J, M, A, R, T) = P(J/M,A,R,T)P(M/A,R,T)P(A/R,T)P(R/T)P(T)$$

Teniendo en cuenta que la variable $J$ solo depende de $A$, tenemos que:

$$P(J/M,A,R,T) = P(J/A)$$

Así mismo, $M$ solo depende de $A$, $A$ depende de $R$ y $T$, y que $T$ y $R$ no dependen de ninguna otra variable aleatoria, por tanto tenemos que:

$$P(M/A,R,T) = P(M/A)$$

$$P(R/T) = P(R)$$

Finalmente, tenemos que:

$$P(J, M, A, R, T) = P(J/A)P(M/A)P(A/R,T)P(R)P(T)$$

### Ejemplo

Supongamos que queremos calcular la probabilidad de $R$ si tenemos que Juan y María han llamado a la policía.

$$ P(R|j,m) = \alpha \langle P(r|j,m), P(\neg r|j,m) \rangle = \alpha \langle \sum_{t} \sum_{a} P(r,t,a,j,m), \sum_{t} \sum_{a} P(\neg r,t,a,j,m) \rangle =$$

$$ = \alpha \langle \sum_{t} \sum_{a} P(r)P(t)P(a|r,t)P(j|a)P(m|a), \sum_{t} \sum_{a} P(\neg r)P(t)P(a|\neg r,t)P(j|a)P(m|a) \rangle $$

Podemos sacar factores comunes:

$$ = \alpha \langle P(r) \sum_{t} P(t) \sum_{a} P(a|r,t)P(j|a)P(m|a), P(\neg r) \sum_{t} P(t) \sum_{a} P(a|\neg r,t)P(j|a)P(m|a) \rangle $$

Una vez hechos los cálculos, tenemos que:

$$ P(R|j,m) = \alpha \langle 0.00059224, 0.0014919 \rangle = \langle 0.284, 0.716 \rangle $$

### Ejercicios propuestos

1. Calcula las siguientes probabilidades:

-  Que Juan llame a la policía si María ha llamado a la policía.
-  Que haya un terremoto si María ha llamado a la policía.
-  Que haya un terremoto y un robo simultáneamente.
-  Que haya un terremoto y un robo simultáneamente si Juan ha llamado a la policía. 

2. Crea la red bayesiana que represente el problema de la famila fuera de casa, que está en los apuntes.


In [1]:
%matplotlib inline
from pomegranate import *

robo = DiscreteDistribution({'Yes_robo': 0.001, 'No_robo': 0.999})
terremoto = DiscreteDistribution({'Yes_terremoto': 0.002, 'No_terremoto': 0.998})

alarma = ConditionalProbabilityTable(
        [['Yes_robo', 'Yes_terremoto', 'Salta_alarma', 0.95],
         ['Yes_robo', 'Yes_terremoto', 'No_salta_alarma', 0.05],
         ['Yes_robo', 'No_terremoto', 'Salta_alarma', 0.94],
         ['Yes_robo', 'No_terremoto', 'No_salta_alarma', 0.06],
         ['No_robo', 'Yes_terremoto', 'Salta_alarma', 0.29],
         ['No_robo', 'Yes_terremoto', 'No_salta_alarma', 0.71],
         ['No_robo', 'No_terremoto', 'Salta_alarma', 0.001],
         ['No_robo', 'No_terremoto', 'No_salta_alarma', 0.999]],
         [robo, terremoto])

juan = ConditionalProbabilityTable(
        [['Salta_alarma','Juan_llama', 0.90],
         ['Salta_alarma','Juan_no_llama', 0.10],
         ['No_salta_alarma','Juan_llama', 0.05],
         ['No_salta_alarma','Juan_no_llama', 0.95]],
         [alarma])

maria = ConditionalProbabilityTable(
        [['Salta_alarma','Maria_llama', 0.70],
         ['Salta_alarma','Maria_no_llama', 0.30],
         ['No_salta_alarma','Maria_llama', 0.01],
         ['No_salta_alarma','Maria_no_llama', 0.99]],
         [alarma])

s1 = Node(robo, name="Robo")
s2 = Node(terremoto, name="Terremoto")
s3 = Node(alarma, name="Alarma")
s4 = Node(juan, name="Juan")
s5 = Node(maria, name="Maria")


model = BayesianNetwork("Avisos")
model.add_states(s1, s2, s3, s4, s5)
model.add_edge(s1, s3)
model.add_edge(s2, s3)
model.add_edge(s3, s4)
model.add_edge(s3, s5)

model.bake()

In [4]:
# observations = {}
observations = {'Juan':'Juan_llama'}
# observations = {'Robo':'Yes_robo', 'Juan':'Juan_llama', 'Terremoto':'Yes_terremoto','Maria':'Maria_llama'}
# observations = {'Juan':'Juan_llama', 'Maria':'Maria_llama'}
# observations = {'Alarma' : 'Salta_alarma', 'Juan':'Juan_llama', 'Maria':'Maria_llama'}
# observations = {'Alarma' : 'Salta_alarma', 'Juan':'Juan_llama'}

beliefs = model.predict_proba(observations)

for state, belief in zip( model.states, beliefs ):
    if type(belief) is not str:
        print(state.name)
        print("Estado", belief.parameters)

Robo
Estado [{'Yes_robo': 0.016283729946776845, 'No_robo': 0.9837162700532232}]
Terremoto
Estado [{'Yes_terremoto': 0.011394968773813558, 'No_terremoto': 0.9886050312261864}]
Alarma
Estado [{'No_salta_alarma': 0.956562288200061, 'Salta_alarma': 0.0434377117999389}]
Maria
Estado [{'Maria_no_llama': 0.9600279788580421, 'Maria_llama': 0.03997202114195791}]
