In [3]:
import numpy as np
import pandas as pd

参考的博客:

https://www.cnblogs.com/sjjsxl/p/6285629.html

https://zybuluo.com/frank-shaw/note/130678

### HMM的3个基本问题

当我们更加清楚了HMM的三要素之后，我们就有了HMM的3个基本问题。这三个问题的解答也是理解HMM的核心关键所在。

1.概率计算问题 

给定模型$\lambda = (A,B,\pi)$和观测序列$O={o_1,o_2,...,o_T}$，计算模型$\lambda$下观测序列$O$出现的概率。我们也可以将该问题看做是衡量一个给定模型对观测序列$O$的匹配好坏问题。

2.预测问题 

即解码问题：已知模型$\lambda = (A,B,\pi)$和观测序列$O={o_1,o_2,...,o_T}$，求对给定观测序列条件概率$P(I|O)$最大的状态序列。由已知的观测序列推测隐含的状态序列$I$，相当于揭开该问题的神秘面纱。

3.学习问题

已知观测序列$O={o_1,o_2,...,o_T}$，估计模型$\lambda = (A,B,\pi)$的参数，使得在该模型下观测序列出现的概率$P(O| λ)$最大。这个问题会由是否知道状态序列而分两种情况： 
1. 如果有一组已知的状态序列以及与之相对应的观测序列，我们称之为训练序列，那么此时这些序列就是用于训练HMM的模型，使得模型参数在训练集中表现最好。这就是监督学习中的训练阶段，可以很快地通过极大似然估计得到相应参数。 
2. 如果只有一组已知的观测序列，而不知道状态序列，那么这个时候就是非监督学习，只能通过EM算法来解决。

### 概率计算问题的解法

### 前向算法

该算法没有直接计算相关的概率，而是定义了一个新的概率：前向概率。具体定义：给定$\lambda$，定义到时刻t部分观测序列为$o_1,o_2…o_t$且状态为$q_i$的概率为前向概率，记做：

$\alpha_t(i) = P(o_1,o_2…o_t,i_t=q_i|\lambda)$

有了该定义，就可以通过递推的方法最终得到观测序列概率哦！让我们来看看具体流程： 
1. 初值：$\alpha_1(i) = \pi_i b_{io_1}$

2. 递推：对于$t = 1,2,...,T-1$,

&nbsp;&nbsp;&nbsp;$\alpha_{t+1}(j) = (\sum_{i=1}^N \alpha_t(i)a_{ij}) b_{jo_{t+1}}$

3. 最终得到： $P(O|\lambda) =\sum_{i=1}^N \alpha_T(i)$



### 后向算法 
实际上，使用前向算法已经能够很好解决概率计算问题了，但是为了更方便地解决接下来的问题，我们引入后向算法。和前向算法相似，该算法也定义了一个新的概率：

后向概率。具体定义：给定模型$\lambda$,定义在时刻$t$的状态为$q_i$的前提下，从$t+1$到$T$的部分观测序列为$o_{t+1},o_{t+2},...,o_{T}$的概率为后向概率，记做： 

$\beta_t(i) = P(o_{t+1},o_{t+2},...,o_{T}|i_t = q_i,~\lambda)$

和前向算法相似，经过递推，就可以得到观测序列$P(O|\lambda)$概率。具体流程如下： 
1. 初值： $\beta_T(i) = 1$

2. 递推：对于$t = T-1,T-2,...,1$,

&nbsp;&nbsp;$\beta_{t}(i) = \sum_{j=1}^N (a_{ij} b_{jo_{t+1}} \beta_{i+1}(j))$

3. 最终得到：$P(O|\lambda) =\sum_{i=1}^N \pi_i b_{io_1} \beta_1(i)$

In [108]:
class HiddenMarkov:
    def __init__(self,pi,A,B):
        self.pi = pi
        self.A = A
        self.B = B
        
    def forward(self,T,O):
        '''
        alpha_t_i 表示在时间t时刻，状态为i,且观测序列为o1,o2...ot的概率，则在t+1时刻有状态转移方程如上所示 
        '''
        # 计算初值
        alpha = self.pi * B[:,O[0]]
        print("当前时刻t = 1")
        print("此时alpha_1={}\n".format(alpha))
        # 往下递推
        for index,o_i in enumerate(O[1:]):
            print("当前时刻t = ",index+2)
            print("此时alpha_{} = {}".format(index+1,alpha))
            # 递推关系式，
            alpha = np.dot(alpha,A) * B[:,o_i]
            print("递推后alpha_{} = {}\n".format(index+2,alpha))
        res = np.sum(alpha)
        print("当t={},观测序列={}时,P(O|λ) = {}".format(T,O,res))
        
    def backward(self,T,O):
        m = len(self.pi) # 状态数
        beta = np.ones(m)
        for i in range(m-1,0,-1):
            print("当前时刻t = ",i+1)
            print("此时beta_{} = {}".format(i+1,beta))
            # 先计算beta_t+1 与 B(o[i]) 对应元素相乘的值
            tmp = beta * B[:,O[i]]
            beta = np.dot(A,tmp)
            print("递推后beta_{} = {}\n".format(i,beta))
        # 求最终的结果
        print("当前时刻t = 1")
        print("此时beta_1 = {}".format(beta))
        print("初值 pi = {}".format(self.pi))
        print("B(O[1]) = {}\n".format(B[:,O[0]]))
        res = np.sum(self.pi * B[:,O[0]] * beta)
        print("当t={},观测序列={}时,P(O|λ) = {}".format(T,O,res))


In [109]:
pi = np.array([0.2,0.4,0.4])
A = np.array([[0.5,0.2,0.3],[0.3,0.5,0.2],[0.2,0.3,0.5]])
B = np.array([[0.5,0.5],[0.4,0.6],[0.7,0.3]])
clf = HiddenMarkov(pi,A,B)
# 观测矩阵,红对应0，白对应1
O = [0,1,0]
T = 3
print("========前向算法============")
clf.forward(T,O)
print("\n")
print("========后向算法============")
clf.backward(T,O)

当前时刻t = 1
此时alpha_1=[0.1  0.16 0.28]

当前时刻t =  2
此时alpha_1 = [0.1  0.16 0.28]
递推后alpha_2 = [0.077  0.1104 0.0606]

当前时刻t =  3
此时alpha_2 = [0.077  0.1104 0.0606]
递推后alpha_3 = [0.04187  0.035512 0.052836]

当t=3,观测序列=[0, 1, 0]时,P(O|λ) = 0.130218


当前时刻t =  3
此时beta_3 = [1. 1. 1.]
递推后beta_2 = [0.54 0.49 0.57]

当前时刻t =  2
此时beta_2 = [0.54 0.49 0.57]
递推后beta_1 = [0.2451 0.2622 0.2277]

当前时刻t = 1
此时beta_1 = [0.2451 0.2622 0.2277]
初值 pi = [0.2 0.4 0.4]
B(O[1]) = [0.5 0.4 0.7]

当t=3,观测序列=[0, 1, 0]时,P(O|λ) = 0.130218
