# 隐马尔可夫模型（HMM）及Viterbi算法

- HMM可用于标注问题的统计学模型
- 描述由隐藏的马尔科夫链随机生成观测序列的过程，属于生成模型
- 在实际生产和生活中有广泛的应用，语音识别、自然语言处理、生物信息、模式识别等

## HMM遵循两个假设
- 齐次马尔科夫假设
    马尔科夫链在任意时刻的状态只依赖其前一时刻的状态，与其他时刻的状态及观测无关，也与时刻t无关
- 观察独立性假设
    任意时刻的观测只依赖于该时刻的马尔科夫链的状态，与其他观测及状态无关

HMM模型由初始状态概率向量、状态转移概率矩阵、观测概率矩阵三部分组成

## HMM的三个基本问题
- 概率计算问题
    已知模型参数和观测序列，计算该观测序列出现的概率
- 学习问题
    已知观测序列，估计模型参数
- 预测问题
    已知模型参数和观测序列，求对应的状态序列

## Viterbi算法
- 用于解决预测问题
- 用于寻找最有可能的状态序列
- 与前向算法类似，但是是一种贪心算法，每一步只考虑当前状态的最优解
- 用于解决概率计算问题，即给定模型参数和观测序列，计算该观测序列出现的概率


In [1]:
import numpy as np

def Viterbi(A, B, PI, V, Q, obs):

    N = len(Q)  # 状态类型数量
    T = len(obs)  # 观察状态的长度
    delta = np.array([[0] * N] * T, dtype=np.float64)
    phi = np.array([[0] * N] * T, dtype=np.int64)
    # 初始化
    for i in range(N):
        delta[0, i] = PI[i]*B[i][V.index(obs[0])]
        phi[0, i] = 0

    # 递归计算
    for i in range(1, T):
        for j in range(N):
            tmp = [delta[i-1, k]*A[k][j] for k in range(N)]
            delta[i,j] = max(tmp) * B[j][V.index(obs[i])]
            phi[i,j] = tmp.index(max(tmp))

    # 最终的概率及节点
    P = max(delta[T-1, :])
    I = int(np.argmax(delta[T-1, :]))

    # 最优路径path
    path = [I]
    for i in reversed(range(1, T)):
        end = path[-1]
        path.append(phi[i, end])

    hidden_states = [Q[i] for i in reversed(path)]

    return P, hidden_states


def main():

    # 状态集合
    Q = ('欢乐谷', '迪士尼', '外滩')
    # 观测集合
    V = ['购物', '不购物']
    # 转移概率: Q -> Q
    A = [[0.8, 0.05, 0.15],
         [0.2, 0.6, 0.2],
         [0.2, 0.3, 0.5]
        ]

    # 发射概率, Q -> V
    B = [[0.1, 0.9],
         [0.8, 0.2],
         [0.3, 0.7]
         ]

    # 初始概率
    PI = [1/3, 1/3, 1/3]

    # 观测序列
    obs = ['不购物', '购物', '购物']

    P, hidden_states = Viterbi(A,B,PI,V,Q,obs)
    print('最大的概率为: %.5f.'%P)
    print('隐藏序列为：%s.'%hidden_states)

In [3]:
main()

最大的概率为: 0.02688.
隐藏序列为：['外滩', '迪士尼', '迪士尼'].
