In [13]:
# -*- coding: utf-8 -*-
import math

# 生成一个硬币时的概率 P(x∣θ)​=∑zP(x,z∣θ)=∑zP(z∣π)P(x∣z,θ)=πpx(1−p)1−x+(1−π)qx(1−q)1−x​
# 注意： 0，1为二项分布，其概率计算为 p**x + (1-p) ** (1-x) 
# https://baike.baidu.com/item/%E4%BA%8C%E9%A1%B9%E5%88%86%E5%B8%83/1442377?fr=aladdin   二项分布
# 假设当前模型的参数为π,p,qπ,p,q时，隐含变量来自于硬币B的后验概率 , 那么隐含变量来自于硬币C的后验概率自然为1−μ1−μ
# cal_u 是根据当前参数π,p,q, 计算隐含变量来自于硬币B的后验概率。  u = (pi * pow(p,xi) * pow(1-p, 1-xi)) / (P(xi|pi,p) + P(xi|pi,q))
def cal_u(pi, p, q, xi):
    """
      u值计算
    :param pi: 下一次迭代开始的 pi
    :param p:  下一次迭代开始的 p
    :param q:  下一次迭代开始的 q
    :param xi: 观察数据第i个值，从0开始
    :return: 
    """
    
    value = pi * math.pow(p, xi) * math.pow(1 - p, 1 - xi) / \
           float(pi * math.pow(p, xi) * math.pow(1 - p, 1 - xi) +
                 (1 - pi) * math.pow(q, xi) * math.pow(1 - q, 1 - xi)) 
    print('cal u --> pi:{} , p: {}, q: {}, xi:{} prob value:{}'.format(pi, p, q, xi, value))
    return value

# 可以看到投掷硬币时到底选择了B或者C是未知的。我们设隐藏变量Z 来指示来自于哪个硬币，
# Z={z1,z2,…,zn}Z={z1​,z2​,…,zn​}，令θ={π,p,q}θ={π,p,q}，观察数据X=x1,x2,…,xnX=x1​,x2​,…,xn​。
def e_step(pi,p,q,x):
    """
        e步计算
    :param pi: 下一次迭代开始的 pi
    :param p:  下一次迭代开始的 p
    :param q:  下一次迭代开始的 q
    :param x: 观察数据
    :return:
    """
    return [cal_u(pi,p,q,xi) for xi in x]

def m_step(u,x):
    """
     m步计算
    :param u:  m步计算的u
    :param x:  观察数据
    :return:
    """
    pi1=sum(u)/len(u)
    p1=sum([u[i]*x[i] for i in range(len(u))]) / sum(u)
    q1=sum([(1-u[i])*x[i] for i in range(len(u))]) / sum([1-u[i] for i in range(len(u))])
    return [pi1,p1,q1]

def run(observed_x, start_pi, start_p, start_q, iter_num):
    """

    :param observed_x:  观察数据
    :param start_pi:  下一次迭代开始的pi $\pi$
    :param start_p:  下一次迭代开始的p
    :param start_q:  下一次迭代开始的q
    :param iter_num:  迭代次数
    :return:
    """
    for i in range(iter_num):
        u=e_step(start_pi, start_p, start_q, observed_x)
        print('e step {} -->  观察队列 x 值0，1是独立的 : {}'.format(i, u))
        print (i,[start_pi,start_p,start_q])
        if [start_pi,start_p,start_q]==m_step(u, observed_x):
            break
        else:
            [start_pi,start_p,start_q]=m_step(u, observed_x)
            
# 观察数据
x = [0, 1, 0, 1, 0, 0, 1, 0, 1, 1]
# 初始化 pi，p q
[pi, p, q] = [0.8, 0.4, 0.5]
# 迭代计算
run(x,pi,p,q,100)



cal u --> pi:0.8 , p: 0.4, q: 0.5, xi:0 prob value:0.8275862068965517
cal u --> pi:0.8 , p: 0.4, q: 0.5, xi:1 prob value:0.761904761904762
cal u --> pi:0.8 , p: 0.4, q: 0.5, xi:0 prob value:0.8275862068965517
cal u --> pi:0.8 , p: 0.4, q: 0.5, xi:1 prob value:0.761904761904762
cal u --> pi:0.8 , p: 0.4, q: 0.5, xi:0 prob value:0.8275862068965517
cal u --> pi:0.8 , p: 0.4, q: 0.5, xi:0 prob value:0.8275862068965517
cal u --> pi:0.8 , p: 0.4, q: 0.5, xi:1 prob value:0.761904761904762
cal u --> pi:0.8 , p: 0.4, q: 0.5, xi:0 prob value:0.8275862068965517
cal u --> pi:0.8 , p: 0.4, q: 0.5, xi:1 prob value:0.761904761904762
cal u --> pi:0.8 , p: 0.4, q: 0.5, xi:1 prob value:0.761904761904762
e step 0 -->  观察队列 x 值0，1是独立的 : [0.8275862068965517, 0.761904761904762, 0.8275862068965517, 0.761904761904762, 0.8275862068965517, 0.8275862068965517, 0.761904761904762, 0.8275862068965517, 0.761904761904762, 0.761904761904762]
0 [0.8, 0.4, 0.5]
cal u --> pi:0.7947454844006568 , p: 0.4793388429752066, q: