# Forward Procedure

En este ejemplo, planteamos una forma eficiente de programar el procedimiento de avance a partir de operaciones con arreglos de numpy. En primer lugar, llamamos a la librería de numpy, la cual utilizaremos para crear y operar con los arreglos.

In [1]:
import numpy as np

Supóngamos que tenemos un Modelo Oculto de Markov $HMM = (S,O,A,B,\Pi)$, donde los alfabetos se definan por números (para simplificar el accesos a las matrices de probabilidades). Así:
$$S = \{0,1,2,3,4,5,6,7,8,9\}$$
y
$$O = \{0,1,2,3,4,5,6,7,8,9\}$$

Las probabilidades se pueden determinar de la siguiente forma (aquí lo hacemos aleatoriamente, sólo por simplificar el ejemplo, pero en la realidad estas probabilidades deben obtenerse a partir de los datos de entrenamiento).

In [2]:
Pi = np.random.dirichlet(np.ones(10),size=1)[0]
A = np.array([np.random.dirichlet(np.ones(10),size=1)[0] for i in range(10)])
B = np.array([np.random.dirichlet(np.ones(10),size=1)[0] for i in range(10)])

Estas probabilidades, junto con los alfabetos de observaciones y emisiones nos dan el Modelo Oculto de Markov $HMM$. Ahora supongamos que queremos determinar la probabilidad de una cadena de observaciones $o\in O^*$, definida como sigue:

In [3]:
o = '120453'

Utilizaremos el procedimiento de avance para determinar dicha probabilidad. Realizaremos los pasos de inicialización, inducción y terminación:

(1) Inicialización. La inicialización está dada por el almacenamiento de las probabilidades inciiales en la variable de avance:

$$\alpha_i(1) := \pi_i$$

In [4]:
a = Pi

(2) Inducción. Los siguientes pasos consistirán en ir actualizando la variable de avance a partir de los diferentes estados de la cadena:

$$\alpha_i(t+1) = \sum_{j=1}^N p(o_t|s_j)p(s_j|s_i)\alpha_j(t)$$

En este caso, utilizaremos operaciones entre matrices y vectores, pues es evidente que (tomando los elementos del modelo $A,B,\Pi$):

$$\alpha_i(t+1) = B_{t,\cdot} \cdot (A_{\cdot,i}\otimes \alpha_{\cdot}(t)) $$

donde $B_{t,\cdot}$ representa el vector renglón que corresponde a la observación en el estado $t$ y $A_{\cdot,i}$ el vector columna correspondiente a la condición $s_i$ y, finalmente, $\alpha_{\cdot}(t)$ es el vector que contiene todas las variables $\alpha_i(t)$. Aquí $\cdot$ representa el producto punto y $\otimes$ el producto de Hadamard.

In [6]:
for t in range(len(o)):
    a = np.dot(B[int(o[t])],A.T*a)
    print 'simbolo:', o[:i+1], '- probabilidad',a.sum(0)

simbolo: 120453 - probabilidad 0.103403542754
simbolo: 120453 - probabilidad 0.00850551921433
simbolo: 120453 - probabilidad 0.00108371668895
simbolo: 120453 - probabilidad 0.00010132304253
simbolo: 120453 - probabilidad 1.08954770155e-05
simbolo: 120453 - probabilidad 9.00336280168e-07


(3) Terminación. Para la terminación, tenemos que:

$$p(o) = \sum_{i=1}^N \alpha_i(T+1)$$

Pero ya que hemos guardado cada variable $\alpha_i$ como la entrada de un vector, basta sumar las entradas de este vector para obtener esta probabilidad:

In [9]:
print 'Probabilidad de la cadena',o, 'es:', a.sum(0)

Probabilidad de la cadena 120453 es: 9.00336280168e-07
