# 隐马尔可夫模型

隐马尔可夫模型（hidden Markov model, HMM）

* 描述由隐藏的马尔可夫链随机生成观测序列的过程
* 属于生成模型

* 是关于时序的概率模型
* 描述由一个隐藏的马尔可夫链随机生成**不可观测的状态随机序列**，再由各个状态生成一个观测而产生**观测随机序列**的过程
* state sequence
* observation sequence

* 所有可能的状态的集合：$Q=\{q_1,q_2,\dotsc,q_N\}$
* 所有可能的观测的集合：$V=\{v_1,v_2,\dotsc,v_M\}$
* 状态序列：$I=(i_1,i_2,\dotsc,i_T)$；状态转移概率矩阵：

  \begin{align*}
  A &= [a_{ij}]_{N\times N} \\
  a_{ij} &= P(i_{t+1}=q_j| i_t=q_i)
  \end{align*}
* 观测概率矩阵：

  \begin{align*}
  B&=[b_j(k)]_{N\times M}\\
  b_j(k)&=P(o_t=v_k|i_t=q_j)
  \end{align*}

* 状态转移概率矩阵$A$与初始状态概率向量$\pi$确定了隐藏的马尔可夫链，生成不可观测的状态序列

  \begin{equation*}
  \pi_i=P(i_1=q_i)
  \end{equation*}
  
  （时刻$t=1$处于状态$q_i$的概率）
* 观测概率矩阵$B$确定了如何从状态生成观测

## 两个基本假设

* $P(i_t|i_{t-1},o_{t-1},\dotsc,i_1,o_1)=P(i_t|i_{t-1})$
* 观测独立性假设：任意时刻的观测只依赖于该时刻的马尔可夫链 的状态，与其他观测及状态无关

  $P(o_t|i_t)$

## 盒子和球模型

两个随机序列

* 状态序列：盒子的序列
* 观测序列：球的颜色的观测序列

讨论：状态转移概率分布

## 3个基本问题

模型$\lambda=(A,B,\pi)$；观测序列$O=(o_1,o_2,\dotsc,o_T)$

* $P(O|\lambda)$
* 用极大似然估计的方法估计参数
* 解码（decoding）问题

  给定观测序列，求最有可能的对应的状态序列


## Baum-Welch算法

EM算法在隐马尔可夫模型学习中的具体实现

* 给定训练数据只包含$S$个长度为$T$的观测序列$\{O_1,O_2,\dotsc,O_S\}$
* 状态序列数据看作不可观测的隐数据$I$
* $P(O|\lambda)=\sum_I P(O,I|\lambda)$

求Q函数$Q(\lambda,\bar{\lambda})$

\begin{align*}
Q(\lambda,\bar{\lambda})&=\sum_I P(I|Q,\bar{\lambda})\log P(Q,I|\lambda)\\
&=\sum_I \frac{P(Q,I|\bar{\lambda})}{P(Q|\bar{\lambda})}\log P(Q,I|\lambda)\\
&=\frac{1}{P(Q|\bar{\lambda})}\sum_I P(Q,I|\bar{\lambda})\log P(Q,I|\lambda)
\end{align*}



$P(O,I|\lambda)=\pi_{i_1}b_{i_1}(o_1)a_{i_1i_2}b_{i_2}(o_2)\dotsb a_{i_{T-1}i_T}b_{i_T}(o_T)$

\begin{equation*}
\sum_I P(O,I|\bar{\lambda})\log\pi_{i_1}
\end{equation*}

* $I=(i_1,i_2,\dotsc,i_T)$
* $\log\pi_{i_1}$只涉及$i_1$

\begin{align*}
&\sum_I P(O,I|\bar{\lambda})\log\pi_{i_1}\\
=&\sum_{i_1}\sum_{(i_2,\dotsc,i_T)} P(O,I|\bar{\lambda})\log\pi_{i_1}\\
=&\sum_{i_1}\log\pi_{i_1}\sum_{(i_2,\dotsc,i_T)} P(O,I|\bar{\lambda})\\
=&\sum_{i=1}^NP(O,i_1=i|\bar{\lambda})\log\pi_i
\end{align*}