# Cadenas de Markov

## Caracterización conjunta de procesos estocásticos y secuencias aleatorias

Ya hemos visto los conceptos de secuencias aleatorias y de procesos estocásticos, así como su caracterizaciones marginales. A modo de recordatorio, sean $X(t)$ y $X[n]$ un proceso estocástico y una secuencia aleatoria que, respectivamente, se modelan mediante sendas variables aleatorias para cada instante de tiempo u muestra. La **caracterización marginal** es:

$$F_X(x; t) = P\{X(t)\leq x\} \qquad F_X(x; n) = P\{X[n]\leq x\}$$

Para en que el proceso o secuencia tome valores continuos, las funciones de densidad marginales son:

$$f_X(x; t) \qquad f_X(x; n)$$

En el caso en que tomen valores discretos, asociamos cada valor posible a un **estado** y nos hallamos en presencia de **cadenas**. Por tanto, <u>una cadena evoluciona entre estados discretos a lo largo de un índice continuo</u>. En este caso recurrimos a las funciones de masa de probabilidad:

$$p_X(x_i; t) \qquad p_X(x_i; n)$$

La **caracterización conjunta** puede definirse conforme a lo visto para variables aleatorias multidimensionales, si bien alteramos levemente la notación para simplificarla. La caracterización conjunta requiere poder conocerla en instantes o muestras arbitrarias:

$$
F_X(x_M ,\ldots x_1 ; t_M , \ldots t_1) = P(X(t_M)\leq x_M , \ldots X(t_1)\leq x_1)
$$

Sin embargo, a diferencia de lo visto en el caso de variables aleatorios multidimensionales, ahora <u>la ordenación de las variables suele tener un sentido causal</u> (*flecha del tiempo*), cuestión particularmente relevante a la hora de obtener caracterizaciones condicionadas, donde, en términos prácticos, el futuro está condicionado por el presente y el pasado, pero no al revés. Por ejemplo:

$$
F_X(x_r | x_q , x_p; t_r | t_q , t_p) \qquad t_p \leq t_q \leq t_r
$$

La funciones de densidad y de masa de probabilidad conjuntas se expresan:

$$
f_X(x_M ,\ldots x_1 ; t_M , \ldots t_1)
$$

$$
p_X(x_{M_i} ,\ldots x_{1_i} ; t_M , \ldots t_1)
$$

### Propiedad de Markov

Sabemos que en un proceso o secuencia independiente se caracteriza porque las variables aleatorias correspondientes a dos instantes o muestras diferentes no tienen dependencia probbailística entre sí. Ya hemos visto que tales procesos o secuencias suelen denominarse **blancos**.

La generalización más sencilla que puede hacerse a partir de tales procesos o secuencias es que, en vez de ser independientes, cumplan la **propiedad de Markov**. La propiedad de Markov establece que la variable aleatoria correspondiente al instante o muestra actual depende probabilísticamente sólo de la inmediatamente anterior pero, dada ésta, no de las que sean más antiguas. De forma equivalente, si conocemos el presente el pasado no nos interesa para realizar predicciones sobre el futuro.

$$
F_X(x_r | x_q x_p; t_r | t_q , t_p) = F_X(x_r | x_q ; t_r | t_q) \qquad t_p \leq t_q \leq t_r
$$

La propiedad de Markov puede aplicarse a las funciones de densidad y, en su caso, a las funciones de masa de probabilidad, como haremos en lo sucesivo.

La propiedad de Markov puede también enunciarse diciendo que **dado el presente el pasado y el futuro son condicionalmente independientes**, si bien ello requiere una formulación que no es causal:

$$
f_X(x_r , x_p| x_q; t_r , t_p | t_q) = f_X(x_p | x_r , x_q ; t_p | t_r , t_q) f_X(x_r | x_q ; t_r | t_q) =\\
= f_X(x_p | x_q ; t_p | t_q) f_X(x_r | x_q ; t_r | t_q) \qquad t_p \leq t_q \leq t_r
$$

La propiedad de Markov nos permite **simplificar la regla** de la cadena para obtener la caracterización conjunta a partir de las condicionadas:

$$
f_X(x_m, \ldots x_1; t_m \ldots t_1) =\\ 
f_X(x_M | x_{M-1} ,\ldots x_1 ; t_M ,\ldots t_1) f_X(x_{M-1} | x_{M-2} ,\ldots x_1 ; t_{M-1} ,\ldots t_1) \ldots f_X(x_2 | x_1 ; t_2 , t_1) f_X(x_1 ; t_1) =\\
=f_X(x_M | x_{M-1} ; t_M , t_{M-1}) f_X(x_{M-1} | x_{M-2} ; t_{M-1},t_{M-2}) \ldots f_X(x_2 | x_1 ; t_2 , t_1) f_X(x_1 ; t_1) 
$$

Según se vio en la parte introductoria, el proceso o secuencia de Markov es **estacionario** si la caracterización conjunta es **invariable frente a desplazamientos temporales**:

$$
f_X(x_m, \ldots x_1; t_m \ldots t_1) = f_X(x_m, \ldots x_1; t_m -\tau ,\ldots t_1 - \tau)
$$

### Cadenas discretas de Markov

En lo que sigue nos restringiremos al estudio de cadenas discretas de Markov, que por tanto **toman valores en un conjunto discreto de estados, obtenidas muestreando la variable temporal** con un periodo $T_0$, de modo que $X[n] = X(nT_0)$. Para simplificar la nomenclatura, vamos a suponer que los valores o **estados** que puede alcanzar la cadena son $e_1, \ldots e_n \ldots$ Además:

* $p_i(n) \equiv p_X(e_i ; n) = P(X[n]=e_i)$
* Si el número de estados $E$ es finito pueden representarse las probabilidades de cada estado en cada instante $n$ mediante un vector fila: $\boldsymbol{\pi}(n) = [p_1(n) \ldots p_E(n)]$ 
* La probabilidad de pasar del estado $e_i$ en el instante $m$ al estado $e_j$ en el instante $n$ se representa mediante la probabilidad de transición $p_{ij}(m,n) \equiv p_X(e_j | e_i ; n | m) = P(X[n] = e_j | X[m] = e_i)$
* La tabla con todas las probablidades de transición entre el instante $m$ y el $n$ puede expresarse mediante una matriz estocástica (sus filas suman uno) $\Pi_{n | m} \equiv P(m,n)$ cuyos elementos en la fila $i$ y columna $j$ son $p_{ij}(m,n)$
* Conforme al Teorema de la Probabilidad Total: $\pi(n) = \pi(m) \Pi_{n | m} \equiv \pi(m)\mathbf{P}(m,n)$ (adviértase que se opera en esta fomulación con vectores fila de probabilidades)

$$
\boldsymbol{\Pi}_{n | m} \equiv \mathbf{P}(m,n) = 
\begin{bmatrix}
  P(X[n] = e_1 | X[m] = e_1) & \ldots & P(X[n] = e_E | X[m] = e_1)\\
  \vdots & \ddots & \vdots\\
  P(X[n] = e_M | X[m] = e_1) & \ldots & P(X[n] = e_M | X[m] = e_M) 
\end{bmatrix} =\\
\begin{bmatrix}
  p_{11}(m,n) & \ldots & p_{1E}(m,n)\\
  \vdots & \ddots & \vdots\\
  p_{E1}(m,n) & \ldots & p_{EE}(m,n)
 \end{bmatrix}
$$

Pueden combinarse dos o más transiciones, dando lugar a una versión matricial de las ecuaciones de Chapman-Kolmogorov. Considerando $p < q < r$:

$$
\left. \begin{array}{c}
\boldsymbol{\pi}(q) = \boldsymbol{\pi}(p)\mathbf{P}(p,q)\\
\boldsymbol{\pi}(r) = \boldsymbol{\pi}(q)\mathbf{P}(q,r)
\end{array} \right\} 
\boldsymbol{\pi}(r) =  \boldsymbol{\pi}(p)\left(\mathbf{P}(p,q)\mathbf{P}(q,r)\right) = 
\boldsymbol{\pi}(p)\mathbf{P}(p,r)
$$

Una cadena de Markov se denomina **homogénea** si la matriz de transición $\mathbf{P}(m,n)$ entre dos instantes arbitrarios $m$, $n$, depende sólo de su separación $k = n-m$ y no de los instantes concretos. Es un concepto que no debe confundirse con la estacionariedad, que se aplica a la caracterización conjunta en vez de a las transiciones. Por tanto, si la cadena es homogénea:

$$\mathbf{P}(m, n)\equiv \mathbf{P}(n-m) = \mathbf{P}(k)\\
\mathbf{P}(m, m+1)\equiv \mathbf{P}(1) \equiv \mathbf{P}$$

Por tanto,

$$
\mathbf{P}(k) = \mathbf{P}^k\\
\boldsymbol{\pi}(m+k) = \boldsymbol{\pi}(m) \mathbf{P}^k
$$

Adviértse que, en general, la distribución de probabilidades de los estados varía en cada instante de tiempo, $\boldsymbol{\pi}(m+1) = \boldsymbol{\pi}(m) \mathbf{P}$. Puede, no obstante, alcanzarse una distribución de estados $\boldsymbol{\pi_\infty}$, que se mantenga estacionaria en el tiempo, si se cumple:

$$
\boldsymbol{\pi_\infty} = \boldsymbol{\pi_\infty} \mathbf{P}
$$

Es habitual representar gráficamente las cadenas homogéneas de Markov mediante **grafos dirigidos**, donde los vértices representan los estados y las aristas las transiciones, estando etiquetadas por las respectivas probabilidades. 

#### Ejemplo

Supóngase un modelo meteorológico en el que los días pueden ser sólo soleados o lluviosos. El tiempo del día presente se modela como una cadena de Markov homogénea, considerando sólo el día anterior. Si este fue soleado, la probabilidad de que el día actual también lo sea es de 4/5. Sin embargo, si el día anterior fue lluvioso, la probabilidad de que el actual sea soleado es de ½.

1. Modele los estados, probabilidades y matriz de transición de la cadena de Markov
2. Si ayer fue soleado, ¿cuál es la probabilidad de que mañana también lo sea? ¿Y si fue lluvioso? Hoy todavía no he abierto la ventana y no sé qué día hace.
3. Suponga que un día tiene una probabilidad de ser soleado de 2/3. ¿Cuál será la probabilidad de que al día siguiente también haga sol? ¿Y de que llueva?
4. ¿Existe la distribución estacionaria para esta cadena de Markov? ¿Por qué?

![diagramaEstados.svg](attachment:diagramaEstados.svg)

Adviértase que:

* La cadena es homogénea. Por tanto, la matriz de transición (de un solo salto) se mantiene constante a lo largo del tiempo

$$
\mathbf{P} = 
\begin{bmatrix}
p(S\ |\ S) & p(Ll\ |\ S)\\
p(S\ |\ Ll) & p(Ll\ |\ Ll)
\end{bmatrix} = 
\begin{bmatrix}
\frac{4}{5} & \frac{1}{5}\\
\frac{1}{2} & \frac{1}{2}
\end{bmatrix}
$$

* La matriz para $k$ saltos sería, por tanto, $\mathbf{P}(k)=\mathbf{P}^k$
* Las probabilidades de los estados en cada instante $n$ se recogen en el vector $\boldsymbol{\pi}(n)=[P(S; n), P(Ll;n)]$
* La secuencia no tiene por qué ser estacionaria, esto es, las probabilidades de los estados van variando conforme sea la matriz de transición

$$
\boldsymbol{\pi}(n+1) = \boldsymbol{\pi}(n+1)\mathbf{P}
$$



La probabilidad de que un día $n$ sea soleado es $P(S; n) = \frac{2}{3}$. Por tanto, la probabilidad de que sea lluvioso es  $P(Ll; n) = 1-P(S; n) = \frac{1}{3}$, esto es:

$$
\boldsymbol{\pi}(n) = [\frac{2}{3}, \frac{1}{3}]
$$

Y, por tanto, las probabilidades de los estados al día siguiente es

$$
\boldsymbol{\pi}(n+1) = [\frac{2}{3}, \frac{1}{3}] \begin{bmatrix}
\frac{4}{5} & \frac{1}{5}\\
\frac{1}{2} & \frac{1}{2}
\end{bmatrix} = 
[\frac{21}{30}, \frac{9}{30}]
$$

Y a los dos días:

$$
\boldsymbol{\pi}(n+2) = [\frac{2}{3}, \frac{1}{3}] \begin{bmatrix}
\frac{4}{5} & \frac{1}{5}\\
\frac{1}{2} & \frac{1}{2}
\end{bmatrix}^2 = 
[\frac{2}{3}, \frac{1}{3}]
\begin{bmatrix}
\frac{37}{50} & \frac{13}{50}\\
\frac{13}{20} & \frac{7}{20}
\end{bmatrix} 
$$

En el apartado (2) del enunciado hay tres instantes de tiempo que considerar: Ayer, Hoy,  Mañana

* La matrices de transición de ayer a hoy y de hoy a mañana son la misma: $\mathbf{P}$
* La matriz de transción de ayer a mañana es $\mathbf{P}^2$

Por tanto

* La probabilidad de que mañana haga sol si ayer también hizo sol es $\frac{37}{50}$
* La probabilidad de que mañana haga sol si ayer llovió es $\frac{13}{20}$

En el apartado (3) simplemente nos preguntan las probabilidades totales de sol y de lluvia de un  día, dadas las probabilidades totales del día anterior:

* La probabilidad total de que haga sol es $\frac{21}{30}=\frac{7}{10}$ 
* La probabilidad total de que haga sol es $\frac{9}{30}=\frac{3}{10}$ 

La distribución estacionaria $\boldsymbol{\pi_\infty}=[P(S;\infty), P(Ll;\infty)]$ debe cumplir:

$$
\boldsymbol{\pi_\infty} = \boldsymbol{\pi_\infty}\mathbf{P}
$$

Sujeto a que $[P(S;\infty), P(Ll;\infty)] = 1$:

Resolviendo la ecuación resulta que

$$
P(S;\infty) = \frac{5}{7}\\
P(Ll;\infty) = \frac{2}{7}  
$$

Y, por tanto, existe la distribución estacionaria $\boldsymbol{\pi_\infty}=[\frac{5}{7}, \frac{2}{7}]$