## 多行为变化推断

---

#### 介绍

上一个试验中，有一个从收发短信中推断用户行为是否发生变化的例子。在这个例子中，我们首先假设的是用户行为发生了一次变化。本次挑战，需要你对模型中的转折点进行扩充，将模型扩充为两个转折点。该挑战的答案 可以点击 [这里](https://www.shiyanlou.com/questions/176608/) 查看。答案网址：https://www.shiyanlou.com/questions/176608/

#### 知识点

- 贝叶斯推断的应用
- 用户行为变化实例的拓展
- 数据的可视化

---

在进行实验前，我们还是需要加载 PyMC 库，这里请直接运行下面几段代码（具体解释，已在第二个实验中给出）：

In [None]:
!pip install pymc3==3.8

In [None]:
#卸载当前环境的 numpy，防止与新版本冲突
!pip  uninstall -y numpy
#更新 numpy
!pip install -U numpy 

In [None]:
#重启内核
import os
os._exit(00)

In [None]:
# 测试是否安装成功
import pymc3 as pm
# 输出版本号
print(pm.__version__)

### 数据集的下载

同样，让我们先从实验楼的网站上下载这些数据集：

In [None]:
!wget -nc "https://labfile.oss.aliyuncs.com/courses/1520/lab2-1.csv"

接下来，从这个数据集合读入到模型中：

In [None]:
import scipy.stats as stats
from IPython.core.pylabtools import figsize
import numpy as np
from matplotlib import pyplot as plt
%matplotlib inline

count_data = np.loadtxt("lab2-1.csv")
n_count_data = len(count_data)
n_count_data, count_data

### 模型的建立

其实新模型和旧模型的主要差别就是转折点上。新模型的 $\lambda$ 取值为：

$$
\lambda = 
\begin{cases}
\lambda_1  & \text{if } t \lt \tau_1 \cr
\lambda_2 & \text{if } t \ge \tau_1 \text{and} \lt \tau_2 \cr
\lambda_3 & \text{if }  t \ge \tau_2
\end{cases}
$$

其中:

\begin{align}
&\lambda_1 \sim \text{Exp}( \alpha ) \\\
&\lambda_2 \sim \text{Exp}( \alpha )  \\\
&\lambda_3 \sim \text{Exp}( \alpha )
\end{align}

并且：

\begin{align}
& \tau_1 \sim \text{DiscreteUniform(1,69) }\\\\
& \tau_2 \sim \text{DiscreteUniform( $\tau_1$ ,70) }
\end{align}

<div class="alert alert-info">
    <p><i class="fa fa-check-square" aria-hidden="true"> 挑战</i>：将上面几个参数加入我们定义的模型中</p>
    <p><i class="fa fa-plus-square" aria-hidden="true"> 规定</i>：使用  $\alpha$ 的取值仍为平均值的逆</p>
</div>

<div class="alert alert-warning">
<h4>重要说明</h4>
<p>本课程中，Notebook 挑战系统无法自动评判，你需要自行补充上方单元格中缺失的代码并运行，如果输出结果和下方的期望输出结果一致，即代表此挑战顺利通过。完成全部内容后，点击「提交检测」即可通过，此说明后续不再出现。</p>
</div>

<i class="fa fa-sign-out" aria-hidden="true"> 期望输出</i>

<img width="600px" src="https://doc.shiyanlou.com/courses/uid1166617-20200203-1580710925315/wm">

上图可以看到，我们定义了模型中需要求的五个参数。

<div class="alert alert-info">
    <p><i class="fa fa-check-square" aria-hidden="true"> 挑战</i>：完成分段函数 lambda_  的赋值。</p>
    <p><i class="fa fa-plus-square" aria-hidden="true"> 提示</i>：可用   pm.math.where 进行多分段的赋值。</p>
</div>

<i class="fa fa-sign-out" aria-hidden="true"> 期望输出</i>

               theano.tensor.var.TensorVariable

接下来，就是将这我们定义的参数和实际数据相结合，代码和上一个试验相同：

In [None]:
with model:
    # 将统计数据 与 参数为 lambda_ 的 Poisson 分布相结合。
    observation = pm.Poisson("obs", lambda_, observed=count_data)
type(observation)

最后就是摁下“学习”的按钮，让模型进行训练与学习：

In [None]:
with model:
    step = pm.Metropolis()
    trace = pm.sample(1000, tune=500, step=step)

通过 `trace` 函数得到这些参数的后验分布函数下的几千个随机变量：

In [None]:
lambda_1_samples = trace['lambda_1']
lambda_2_samples = trace['lambda_2']
lambda_3_samples = trace['lambda_3']
tau1_samples = trace['tau_1']
tau2_samples = trace['tau_2']
print("lambda1:", lambda_1_samples)
print("lambda2:", lambda_2_samples)
print("lambda3:", lambda_3_samples)
print("tau_1:", tau1_samples)
print("tau_2:", tau2_samples)

### 数据可视化

<div class="alert alert-info">
    <p><i class="fa fa-check-square" aria-hidden="true"> 挑战</i>：分别画出以上 5 个参数的分布图像</p>
</div>

<i class="fa fa-sign-out" aria-hidden="true"> 期望输出</i>

<img width="600px" src="https://doc.shiyanlou.com/courses/uid1166617-20200203-1580711382755/wm">

### 实验总结

本挑战主要是对实验二的实例的扩展，让我们更好的理解贝叶斯推断中，模型建立、训练和分析的全过程。

<hr><div style="color: #999; font-size: 12px;"><i class="fa fa-copyright" aria-hidden="true"> 本课程内容版权归实验楼所有，禁止转载、下载及非法传播。</i></div>