# T6.4 Inferencia

# Índice

1. Inferencia con redes bayesianas
2. Tipos de redes bayesianas
3. Inferencia en una cadena
4. Inferencia en un árbol
5. Inferencia en otros tipos de grafos

## 1 Inferencia con redes bayesianas

**Problema:** $\;$ calcular la probabilidad a posteriori de alguna variable $x$ a partir de las distribuciones conjuntas asociadas a una red, dada alguna evidencia $e$ (como valores dados de otras variables) y sin importar los valores del resto de las variables $f$; esto es,
$$P(x \mid e) =\frac{P(x,e)}{P(e)}$$
donde $P(x,e)$ y $P(e)$ se calculan eficientemente a partir de la conjunta
$$P(x,e)= \sum_{f} P(x,e,f)\qquad\text{y}\qquad P(e)= \sum_{x,f} P(x,e,f)$$

**Ejemplo:** $\;$ calcular $P(x_3)$ a partir de una distribución conjunta dada por
$$P(x_1,x_2,x_3,x_4)=P(x_2)P(x_1 \mid x_2)P(x_3 \mid x_2)P(x_4 \mid x_3)$$
Supongamos que cada $x_i,~i=1,2,3,4\,$ puede tomar $n$ valores:
* $P(x_3)=\sum_{x_1,x_2,x_4} P(x_2)P(x_1 \mid x_2)P(x_3 \mid x_2)P(x_4 \mid x_3)\;\Rightarrow\;O(n^3)$ operaciones
* $P(x_3)=\sum_{x_2} P(x_2)P(x_3 \mid x_2) \sum_{x_1} P(x_1\mid x_2) \sum_{x_4} P(x_4 \mid x_3)=\sum_{x_2} P(x_2)P(x_3\mid x_2)\;\Rightarrow\;O(n)$ operaciones

**Usos del cálculo de probabilidades a posteriori:**
* **Predicción:** $\;$ ¿Cuál es la probabilidad de observar un síntoma sabiendo que se tiene una determinada enfermedad?
* **Diagnóstico:** $\;$ ¿Cuál es la probabilidad de que una determinada enfermedad sea un diagnóstico correcto dados algunos síntomas?

**Nota:** $\;$ la dirección de los enlaces entre variables no restringe el tipo de preguntas que se pueden hacer

## 2 Tipos de redes bayesianas

**Tipos usuales:** $\;$ los tipos **cadena** y **(poli-)árbol** admiten factorizaciones eficientes 
<div align=center><img src="BNtypes.png"></div>

## 3 Inferencia en una cadena

**Probabilidad a posteriori:** $\;$ de $\,x_n\,$ dados $\,x_i \in E_{x_n}^+\,$ y $\,x_f\in E_{x_n}^-$
<div align=center><img src="Chain.png" width=800></div>

$$\begin{align*}
P(x_n\mid x_i,x_f)&=\frac{P(x_n,x_i,x_f)}{P(x_i,x_f)}\\
&=\frac{P(x_n)~P(x_i\mid x_n)~P(x_f\mid x_n,\bcancel{x_i})}{P(x_i,x_f)}
&&(\text{Indep. cond.:}\;x_f\perp x_i\mid x_n)\\
&=\frac{\cancel{P(x_n)}~P(x_i)~P(x_n\mid x_i)~P(x_f\mid x_n)}{\cancel{P(x_n)}~P(x_i,x_f)}
&&(\text{Regla de Bayes})\\
&=\alpha~\underbrace{P(x_n\mid x_i)}_{\pi(x_n)}~\underbrace{P(x_f\mid x_n)}_{\lambda(x_n)}
&&(\alpha\,=\,P(x_i)/P(x_i,x_f))
\end{align*}$$

<div align=center><img src="Chain_3.png" width=800></div>

**Cálculo eficiente de $\pi(x_n)$:**
<div align=center><img src="Chain_1.png" width=800></div>

$$\pi(x_i)=1;\quad\pi(x_n)=P(x_n\mid x_i)=\sum_{x_{n-1}} P(x_n,x_{n-1}\mid x_i)=\sum_{x_{n-1}} P(x_{n-1}\mid x_i)~ P(x_n\mid \cancel{x_i},x_{n-1})=\sum_{x_{n-1}} \pi(x_{n-1})~ P(x_n\mid x_{n-1})$$

**Cálculo eficiente de $\lambda(x_n)$:**
<div align=center><img src="Chain_2.png" width=800></div>

$$\lambda(x_f)=1;\quad\lambda(x_n)=P(x_f\mid x_n)=\sum_{x_{n+1}} P(x_f,x_{n+1}\mid x_n)=\sum_{x_{n+1}}  P(x_{n+1}\mid x_n)~ P(x_f\mid \cancel{x_n},x_{n+1})=\sum_{x_{n+1}}P(x_{n+1}\mid x_n)~\lambda(x_{n+1})$$

## 4 Inferencia en un árbol

<div><table border-collapse: collapse align=left><tr>
<td style="border: none; text-align:left; vertical-align:top; padding:0; margin:0;" width=450>

**Probabilidad a posteriori:** $\;$ de $\,x_j\,$ dados $\,E_{x_j}^+\,$ y $\,E_{x_j}^-$

$$P(x_j\mid E_{x_j}^+,E_{x_j}^-)=\alpha\,\pi(x_j)\,\lambda(x_j)$$

**Cálculo de $\lambda(x_j)$:** $\displaystyle\quad\lambda(x_j)=\prod_{k=1}^m\lambda_{y_k}(x_j)$

$\quad\displaystyle\text{con}\quad\lambda_{y_k}(x_j)=\sum_{y_k} \lambda(y_k)~P(y_k \mid x_j)$

**Cálculo de $\pi(x_j)$:** $\displaystyle\quad\pi(x_j) = \sum_{u_i} P(x_j\mid u_i)~\pi_{x_j}(u_i)$

$\quad\displaystyle\text{con}\quad\pi_{x_j}(u_i)=\alpha~\prod_{j'\neq j} \lambda_{x_{j'}}(u_i)~\pi(u_i)$

</td><td style="border: none; text-align:left; vertical-align:top; padding:0; margin:0;" width=600>

<img src="Tree2.png" width=500>

</td></tr></table></div>

## 5 Inferencia en otros tipos de grafos

**Poli-arboles (Polytrees):** $\;$ los nodos pueden tener múltiples padres, pero solo puede existir un camino único entre cualquier par de nodos; se aplica una generalización del algoritmo sobre un árbol

**Grafos generales:** $\;$ se aplican técnicas de inferencia aproximada