# Modelos Ocultos de Markov

Un HMM consiste de dos procesos estocásticos:

1. Cadena de Markov (con estados ocultos)
2. Emisión de símbolos observables

En su totalidad, un HMM se denota como una 5-tupla:

$\lambda = (A, B, \Pi, S, V)$

1. Matriz de probabilidades de transición
$$ A = \{a_{ij}\} = p(q_{t+1}=S_j|q_{t}=S_i)$$

2. Matriz de probabilidades de emisión 
$$ B = \{b_j(k)\} = p(V_k|S_j) $$

3. Vector de probabilidades de símbolo inicial
$$\Pi = \{\pi_i\} = p(q_1 = S_i)$$

4. Conjunto S de N estados finitos
$$S = \{S_1, \dots, S_N \}$$

5. Conjunto V de M símbolos observables
$$V = \{V_1, \dots, V_M\}$$

## Construcción de un HMM

Para construir un HMM que de solución a un problema determinado, es necesario resolver tres pasos:

1. Evaluación: Encontrar la probabilidad de la secuencia de observaciones dado un HMM.

$$p(O|\Lambda)$$

2. Decodificación: Encontrar la secuencia de estados que maximiza la probabilidad de generar la secuencia observada. 

$$argmax\{p(S|O)\}$$

3. Aprendizaje: Ajustar los parámetros del HMM para maximizar la probabilidad de las observaciones.

### 1) Evaluación 

Se requiere obtener la probabilidad de la secuencia de obsevaciones dado un HMM. Para ello se requiere obtener la probabilidad como una suma de todas las posibles combinaciones de los estados S del modelo, pero esto implica el cálculo  de $N^T$ operaciones lo cual es muy ineficiente.

Existen dos formas de resolver este problema de una forma más sencilla que involucra ecuaciones recursivas.

__1) Forward__

Se define la variable auxiliar $\alpha_{t}(j) = p(O_1, \dots, O_T|\Lambda)$

$\alpha_{t+1}(j) = b_{j}(O_{t+1})\sum_{i=1}^{N}\alpha_{t}(i)a_{ij}$

$\alpha_{1}(j) = \pi_{j}b_{j}(O_{1})$

Al final, la probabilidad deseada se obtiene como:

$p(O|\Lambda) = \sum_{i=1}^{N}\alpha_{T}(i)$

__2) Backward__

Se define la variable auxiliar $\beta_{t}(i) = p(O_1, \dots, O_T|\Lambda)$

$\beta_{t}(i) = \sum_{j=1}^{N}b_{i}(O_{t+1})\beta_{t+1}(j)a_{ij}$

$\beta_{T}(i) = 1$