In [1]:
import numpy as np

#A是状态转换概率矩阵,标识不同状态之间相互转换的概率
A = np.array([[0.5, 0.2, 0.3], [0.3, 0.5, 0.2], [0.2, 0.3, 0.5]])

#B是输出概率矩阵,标识在不同状态下各个输出的概率
B = np.array([[0.5, 0.5], [0.4, 0.6], [0.7, 0.3]])

#pi是第一次会进去某个状态的概率
pi = np.array([0.2, 0.4, 0.4])

#out是输出链,这里标识的是红球,白球,红球
out = [0, 1, 0]

#xi是(序列长度,状态数量)形状的矩阵,每一行是一个时刻,每一列是由该状态输出的概率
#以xi[0,0]为例,指的是时刻0,由状态0输出结果的概率
xi = np.zeros((3, 3))

#phi里记录的是最有可能的路径
#以phi[1,0]为例,指的是哪一个时刻0的状态最有可能转移到时刻1的状态0
phi = np.zeros((3, 3))

A, B, pi, out

(array([[0.5, 0.2, 0.3],
        [0.3, 0.5, 0.2],
        [0.2, 0.3, 0.5]]), array([[0.5, 0.5],
        [0.4, 0.6],
        [0.7, 0.3]]), array([0.2, 0.4, 0.4]), [0, 1, 0])

In [2]:
#这里处理t0的xi

#在时刻0,由状态0输出out[0]的概率,当然就是pi[0] * B[0]out[0]
xi[0, 0] = pi[0] * B[0, out[0]]

#在时刻0,由状态1输出out[0]的概率,当然就是pi[1] * B[1]out[0]
xi[0, 1] = pi[1] * B[1, out[0]]

#在时刻0,由状态2输出out[0]的概率,当然就是pi[2] * B[2]out[0]
xi[0, 2] = pi[2] * B[2, out[0]]

xi

array([[0.1 , 0.16, 0.28],
       [0.  , 0.  , 0.  ],
       [0.  , 0.  , 0.  ]])

In [3]:
#求下一个时刻转移到状态a,概率最高的是当前时刻t的哪一个状态
def max_next_time_to_a(t, a):
    prob = np.zeros(3)

    #当前时刻的状态是0的概率就是xi[t-1,0],再乘以转移到状态a的概率,就是A[0,a]
    prob[0] = xi[t, 0] * A[0, a]

    #当前时刻的状态是1的概率就是xi[t-1,1],再乘以转移到状态a的概率,就是A[1,a]
    prob[1] = xi[t, 1] * A[1, a]

    #当前时刻的状态是2的概率就是xi[t-1,2],再乘以转移到状态a的概率,就是A[2,a]
    prob[2] = xi[t, 2] * A[2, a]

    #只需要概率最高的
    return prob.argmax(), prob.max()


#在时刻0,转移到时刻1的状态0的概率
#最高的是从时刻0的状态2以0.0559的概率转移到时刻1的状态0
max_next_time_to_a(t=0, a=0)

(2, 0.055999999999999994)

In [4]:
#这里处理t1的xi和phi

#在时刻0,转移到时刻1的状态0的概率
a, prob = max_next_time_to_a(t=0, a=0)

#在时刻1,由状态0输出out[1]的概率,就是时刻0转移到状态0的概率 * B[0]out[1]
xi[1, 0] = B[0][out[1]] * prob

#哪一个时刻0的状态最有可能转移到时刻1的状态0
phi[1, 0] = a

a, prob = max_next_time_to_a(t=0, a=1)
xi[1, 1] = B[1][out[1]] * prob
phi[1, 1] = a

a, prob = max_next_time_to_a(t=0, a=2)
xi[1, 2] = B[2][out[1]] * prob
phi[1, 2] = a

xi, phi

(array([[0.1   , 0.16  , 0.28  ],
        [0.028 , 0.0504, 0.042 ],
        [0.    , 0.    , 0.    ]]), array([[0., 0., 0.],
        [2., 2., 2.],
        [0., 0., 0.]]))

In [5]:
#这里处理t2的xi和phi

a, prob = max_next_time_to_a(t=1, a=0)
xi[2, 0] = B[0][out[2]] * prob
phi[2, 0] = a

a, prob = max_next_time_to_a(t=1, a=1)
xi[2, 1] = B[1][out[2]] * prob
phi[2, 1] = a

a, prob = max_next_time_to_a(t=1, a=2)
xi[2, 2] = B[2][out[2]] * prob
phi[2, 2] = a

xi, phi

(array([[0.1    , 0.16   , 0.28   ],
        [0.028  , 0.0504 , 0.042  ],
        [0.00756, 0.01008, 0.0147 ]]), array([[0., 0., 0.],
        [2., 2., 2.],
        [1., 1., 2.]]))

In [6]:
#尝试回溯状态链
viterbi = np.empty(3, dtype=int)

#时刻2,输出结果概率最大的那个状态
viterbi[2] = xi[2].argmax()

#哪一个时刻1的状态最有可能转移到时刻2输出结果概率最大的那个状态
viterbi[1] = phi[2, viterbi[2]]

#哪一个时刻0的状态最有可能转移到时刻1输出结果概率最大的那个状态
viterbi[0] = phi[1, viterbi[1]]

#这个状态链的估计有多大信心
viterbi_score = xi[2].max()

viterbi, viterbi_score

(array([2, 2, 2]), 0.014699999999999998)