# T6.5 Campos de Markov aleatorios

# Índice

1. Campos de Markov aleatorios
2. Potenciales exponenciales
3. Ejemplo
4. Inferencia

## 1 Campos de Markov aleatorios

**Clique de un grafo:** $\;$ subgrafo completamente conectado; máximo si no es subgrafo de otro clique

**Clique máximo de un grafo:** $\;$ clique no subgrafo de otro clique

**Campo de Markov aleatorio:** $\;$ grafo **no dirigido** de variables aleatorias cuya conjunta puede factorizarse a partir del conjunto $\mathcal{Q}$ de todos los **cliques (máximos)** del grafo como
$$P(x_1,\dots,x_D) ~=~ \frac{1}{Z}\prod_{C\in\mathcal{Q}} \psi_C(V_C)$$
donde $V_C$ es el conjunto de variables del clique $C$, $\,\psi_C\!:\!\mathcal{Q}\!\rightarrow\!\R^{>0}$ es una **función potencial** y $Z$ es un factor de normalización

In [1]:
import graphviz; graphviz.Source('graph {rankdir=LR; A -- B; {A, B} -- {C} -- D -- E }').render(filename='3cliques', format='svg');

<div><table border-collapse: collapse align=left><tr>
<td style="border: none; text-align:left; vertical-align:top; padding:0; margin:0;" width=500>

**Ejemplo:** $\;$ grafo con tres cliques máximos
$$\begin{align*}
V_1&=\{A,B,C\}\\
V_2&=\{C,D\}\\
V_3&=\{D,E\}\\
P(A,B,C,D,E)&=\frac{1}{Z}\,\psi_1(A,B,C)\,\psi_2(C,D)\,\psi_3(D,E)
\end{align*}$$

</td><td style="border: none; text-align:left; vertical-align:center; padding:0; margin:0;" width=500>

<img src="3cliques.svg" width=500>

</td></tr></table></div>

## 2 Potenciales exponenciales

**Potenciales exponenciales:** $\;$ funciones de la família exponencial usuales
$$P(x_1,\dots,x_D)=\frac{1}{Z}\prod_{C\in\mathcal{Q}} \psi_C(V_C)=\frac{1}{Z}\prod_{C\in\mathcal{Q}} \exp\left(-E_C(V_C)\right)=\frac{1}{Z}\,\exp\Big(-\sum_{C\in\mathcal{Q}} E_C(V_C)\Big)$$
donde $\,E_C:\mathcal{Q}\rightarrow\mathbb{R}\,$ es una **función de energía** como, por ejemplo, una función lineal (generalizada)

## 3 Ejemplo

<div><table border-collapse: collapse align=left><tr>
<td style="border: none; text-align:left; vertical-align:top; padding:0; margin:0;" width=500>

**Objetivo:** $\;$ recuperar una imagen original
$$\boldsymbol{x}=(x_1,\dotsc,x_D)^t\in\{-1,1\}^D$$
a partir de una versión observada ruidosa,
$$\boldsymbol{y}=(y_1,\dotsc,y_D)^t\in\{-1,1\}^D$$

</td><td style="border: none; text-align:left; vertical-align:center; padding:0; margin:0;" width=20></td>
<td style="border: none; text-align:left; vertical-align:center; padding:0; margin:0;" width=480>

<img src="Figure8.30a.png" width=200> &emsp; <img src="Figure8.30b.png" width=200>

</td></tr></table></div>

<div><table border-collapse: collapse align=left><tr>
<td style="border: none; text-align:left; vertical-align:top; padding:0; margin:0;" width=700>

**Correlaciones:** 
* Fuerte correlación entre $x_i$ y $y_i$
* Correlación entre $x_i$ y $x_j$ si son píxeles vecinos; es decir, si $i\in N(j), j\in N(i)$

**Cliques máximos:**
$$\begin{align*}
C_{i}&=(x_i,y_i) &&\text{para todo $i$}\\
C_{ij}&=(x_i,x_{j}) &&\text{para todo $i$ y todo $j\in N(i)$}
\end{align*}$$

</td><td style="border: none; text-align:left; vertical-align:center; padding:0; margin:0;" width=50></td>
<td style="border: none; text-align:left; vertical-align:center; padding:0; margin:0;" width=250>

&emsp; <img src="Figure8.31.png" width=200>

</td></tr></table></div>

**Función de energía:** $\displaystyle\quad\left.\begin{array}{c}
E_C(V_{C_{ij}}) = -\beta~x_i~x_j\\
E_C(V_{C_{i}}) = -\nu~x_i~y_i
\end{array}\right\}\quad\rightarrow\quad\sum_{C \in\mathcal{Q}} E_C(V_C)~=\, -\beta\,\sum_{i,j} x_i~x_j-\nu\sum_i x_i~y_i$

**Probabilidad conjunta:** $\displaystyle\quad P(\boldsymbol{x},\boldsymbol{y})=\frac{1}{Z}\,\exp \Big(\beta \sum_{i,j} x_ix_j + \nu \sum_i x_iy_i \Big)$

**Inferencia:** $\displaystyle\quad P(\boldsymbol{x}\mid\boldsymbol{y})=\dfrac{P(\boldsymbol{x},\boldsymbol{y})}{P(\boldsymbol{y})}=\dfrac{\exp \Big(\beta \sum_{i,j} x_ix_j + \nu \sum_i x_iy_i \Big)}{\sum_{\boldsymbol{x}'}\exp\Big(\beta \sum_{i,j} x'_ix'_j + \nu \sum_i x'_iy_i \Big)}$

<div><table border-collapse: collapse align=left><tr>
<td style="border: none; text-align:left; vertical-align:top; padding:0; margin:0;" width=500>

**Explicación más probable:**
$$\begin{align*}
\hat{\boldsymbol{x}}&=\operatorname*{argmax}_{\boldsymbol{x}}P(\boldsymbol{x}\mid\boldsymbol{y})\\
&=\operatorname*{argmax}_{\boldsymbol{x}}\,\Big(\beta\sum_{i,j}x_ix_j + \nu\sum_ix_iy_i\Big)
\end{align*}$$

</td><td style="border: none; text-align:left; vertical-align:center; padding:0; margin:0;" width=50></td>
<td style="border: none; text-align:left; vertical-align:center; padding:0; margin:0;" width=250>

&emsp; <img src="Figure8.30d.png" width=200>

</td></tr></table></div>

## 4 Inferencia

**Inferencia en cadenas:** $\;$ algoritmo adelante-atrás ("backward-Forward algorithm")

**Inferencia en árboles:** $\;$ algoritmo suma-producto

**Inferencia en grafos generales:** $\;$ algoritmo de árbol de unión ("Junction tree algorithm"), algoritmo suma-producto ("Loopy belief propagation")