# **生物信息学课程报告二：隐马尔可夫链**

## 问题描述：现有三种骰子，分别为四面体、六面体和八面体。有一位同学分三次随机挑选其中一种骰子掷出，依次产生了1、6、3的结果。利用动态规划方法计算该同学依次掷出的何种骰子。


### **1. 介绍**

#### 隐马尔可夫链是一种著名的有向图模型，广泛运用于语音识别、自然语言处理、序列比对等领域。相比马尔可夫链，HMM在状态的基础上增加了符号的概念，每个状态以不同的概率产生一组可以观测的符号。该模型也自然具有马尔可夫链的性质，即**系统下一时刻的状态仅由当前状态决定，不依赖于以往的任何状态.**


<img src='./image/hidden markov chain.png' width=1000>
<p style="text-align:center;">Figure 1. HMM模型概述</p>

#### 为了确定一个隐马尔可夫链还需要以下三组参数：$\lambda = [A,B,\pi]$

#### **1.1 状态转移概率**
<img src='./image/1.png'>

#### **1.2 输出观测概率**
<img src='./image/2.png'>

#### **1.3 初始状态概率**
模型在初始时刻各状态出现的概率，记位$\pi=(\pi_1,\pi_2,\pi_3,...,\pi_N)$,其中
$$
\pi_i = P(y_1=s_i),\quad1≤i≤N
$$
表示模型的初状态为$s_i$的概率

## **2. Viterbi algorithm**
维特比算法是基于动态规划思想的解码算法，可以解决从观测序列获得最有可能的状态序列问题。

#### **2.1 模型初始化**
随机抽选，即为均匀分布

In [85]:
## 可能出现的状态
states = ('tetrahedron','Hexahedron', 'Octahedron') 
##初始时刻的概率
initial_pro = {'tetrahedron':1/3,'Hexahedron':1/3, 'Octahedron':1/3}
## 转移概率
transition_pro = {
    'tetrahedron':{'tetrahedron':1/3,'Hexahedron':1/3, 'Octahedron':1/3},
    'Hexahedron':{'tetrahedron':1/3,'Hexahedron':1/3, 'Octahedron':1/3}, 
    'Octahedron':{'tetrahedron':1/3,'Hexahedron':1/3, 'Octahedron':1/3}
   }
## 生成概率
emission_pro = {
    'tetrahedron':{'1':1/4,'2':1/4,'3':1/4,'4':1/4,'5':0,'6':0,'7':0,'8':0},
    'Hexahedron':{'1':1/6,'2':1/6,'3':1/6,'4':1/6,'5':1/6,'6':1/6,'7':0,'8':0}, 
    'Octahedron':{'1':1/8,'2':1/8,'3':1/8,'4':1/8,'5':1/8,'6':1/8,'7':1/8,'8':1/8}
}
##观测序列
observations = ['1','6','3']

#### **2.2 维特比算法**

In [165]:
def Viterbit_algorithm(observations, states, initial_pro, transition_pro,emission_pro):
    """
    input: 观测序列，HMM模型参数
    output: 生成该观测序列的概率最大状态链
    """
    ## path[s]：达到状态s前的最优路径
    path = {s:[] for s in states}
    curr_pro = {}
    ## 初始化：每一个状态下生成序列首元素的概率
    for s in states:
        curr_pro[s] = initial_pro[s]*emission_pro[s][observations[0]]
    for i in range(1,len(observations)):
        ## last_pro 保存上一个观测序列路径的状态概率
        last_pro = curr_pro
        curr_pro = {}
        for curr_state in states:
            max_pro, last_state = max(((last_pro[last_state]*transition_pro[last_state][curr_state]*emission_pro[curr_state][observations[i]], last_state)
                                      for last_state in states))
            curr_pro[curr_state] = max_pro
            path[curr_state].append(last_state)
            
    # find the final largest probability
    max_pro = -1
    max_path = None

    for s in states:
        path[s].append(s)
        if curr_pro[s] > max_pro:
            max_path = path[s]
            max_pro = curr_pro[s]
    return max_path        

#### **2.3 结果**

In [166]:
if __name__ == '__main__':
    final_result = Viterbit_algorithm(observations, states, initial_pro, transition_pro, emission_pro)
    print(f'with the observation, the final path is "{final_result[0]}——>{final_result[1]}——>{final_result[2]}""')

with the observation, the final path is "tetrahedron——>Hexahedron——>tetrahedron""


即四面体——>六面体——>四面体