# 使用hmmlearn包来学习HMM

hmmlearn实现了三种HMM模型类，按照观测状态是连续状态还是离散状态，可以分为两类。GaussianHMM和GMMHMM是连续观测状态的HMM模型，而MultinomialHMM是离散观测状态的模型。

对于MultinomialHMM的模型，“startprob_”参数对应隐藏状态初始分布Π，“transmat_”对应状态转移矩阵A，“emissionprob_”对应观测状态概率矩阵B。

对于连续观测状态的HMM模型，GaussianHMM类假设观测状态符合高斯分布，而GMMHMM类则假设观测状态符合混合高斯分布。一般情况下使用GaussianHMM即高斯分布的观测状态即可。以下对于连续观测状态的HMM模型，只讨论GaussianHMM类。

在GaussianHMM类中，“startprob_”参数对应隐藏状态初始分布Π，“transmat_”对应状态转移矩阵A，对于B，采用给出各个隐藏状态对应的观测状态高斯分布的概率密度函数的参数。如果观测序列是一维的，则观测状态的概率密度函数是一维的普通高斯分布。如果观测序列是N维的，则隐藏状态对应的观测状态的概率密度函数是N维高斯分布。高斯分布的概率密度函数参数可以用μ表示高斯分布的期望向量，Σ表示高斯分布的协方差矩阵。在GaussianHMM类中，“means”用来表示各个隐藏状态对应的高斯分布期望向量μ形成的矩阵，而“covars”用来表示各个隐藏状态对应的高斯分布协方差矩阵Σ形成的三维张量。

In [1]:
! pip install hmmlearn

Collecting hmmlearn
[?25l  Downloading https://files.pythonhosted.org/packages/ff/7b/33f629a443a0671161c019e55c3f1b511c7e9fdce5ab8c8c3c33470eb939/hmmlearn-0.2.3-cp36-cp36m-manylinux1_x86_64.whl (363kB)
[K     |█                               | 10kB 14.4MB/s eta 0:00:01[K     |█▉                              | 20kB 1.8MB/s eta 0:00:01[K     |██▊                             | 30kB 2.3MB/s eta 0:00:01[K     |███▋                            | 40kB 1.7MB/s eta 0:00:01[K     |████▌                           | 51kB 1.9MB/s eta 0:00:01[K     |█████▍                          | 61kB 2.3MB/s eta 0:00:01[K     |██████▎                         | 71kB 2.4MB/s eta 0:00:01[K     |███████▏                        | 81kB 2.6MB/s eta 0:00:01[K     |████████                        | 92kB 3.0MB/s eta 0:00:01[K     |█████████                       | 102kB 2.8MB/s eta 0:00:01[K     |██████████                      | 112kB 2.8MB/s eta 0:00:01[K     |██████████▉                     | 12

In [0]:
import numpy as np
from hmmlearn import hmm

In [0]:
states = ["box 1", "box 2", "box3"]
n_states = len(states)

observations = ["red", "white"]
n_observations = len(observations)

start_probability = np.array([0.2, 0.4, 0.4])

transition_probability = np.array([[0.5, 0.2, 0.3],
                   [0.3, 0.5, 0.2],
                   [0.2, 0.3, 0.5]])

emission_probability = np.array([[0.5, 0.5],
                  [0.4, 0.6],
                  [0.7, 0.3]])

In [0]:
model = hmm.MultinomialHMM(n_components=n_states)
model.startprob_ = start_probability
model.transmat_ = transition_probability
model.emissionprob_ = emission_probability

In [10]:
seen = np.array([[0,1,0]]).T
logprob, box = model.decode(seen, algorithm="viterbi")
print("The ball picked:", ", ".join(map(lambda x: observations[x[0]], seen)))
print("The hidden box", ", ".join(map(lambda x: np.array(states)[x], box)))

The ball picked: red, white, red
The hidden box box3, box3, box3


In [11]:
box2 = model.predict(seen)
print("The ball picked:", ", ".join(map(lambda x: observations[x[0]], seen)))
print("The hidden box", ", ".join(map(lambda x: states[x], box2)))

The ball picked: red, white, red
The hidden box box3, box3, box3


In [13]:
print(model.score(seen))

-2.038545309915233
