In [30]:
def viterbi(obs, states, start_p, trans_p, emit_p):
    V = [{}] # 列表idx代表时间t，字典的键代表状态值，值代表概率
    path = {} # 最佳路径
    for y in states:
        V[0][y] = start_p[y] * emit_p[y].get(obs[0], 1e-5)
        path[y] = [0] # 都初始化为0
    
    for t in range(1, len(obs)):
        V.append({})
        for y in states:
            em_p = emit_p[y].get(obs[t], 1e-5) # 取出观测值对应的概率
            (prob, state) = max([(V[t-1][y0]*trans_p[y0][y]*em_p, y0) for y0 in states])
            V[t][y] = prob
            path[y] = path[y] + [state] # 记录路径，state是当前时间t状态为y时t-1的最佳状态，也就是从state转移到y的概率最大。如果最后时刻的最佳状态是y，则回溯从y开始，最后的状态也是y。
    (prob, state) = max((V[len(obs)-1][y], y) for y in states) # 求最后时刻的最大概率和状态。

    return path[state][1:] + [state] # 初始状态是0，所以去掉第一个0，再加上最后时刻的最大概率的状态，结果就是最佳路径。这里键对值的过程相当于回溯了。

A = {
    0 : {0:0.5, 1:0.2, 2:0.3},
    1 : {0:0.3, 1:0.5, 2:0.2},
    2 : {0:0.2, 1:0.3, 2:0.5}
    
}
B = {
    0: {'红': 0.5, '白': 0.5},
    1: {'红': 0.4, '白': 0.6},
    2: {'红': 0.7, '白': 0.3}
}
π = {0:0.2, 1:0.4, 2:0.4}
viterbi(['红', '白', '红'], [0, 1, 2], π, A, B)

[2, 2, 2]