# 政策评估方法

**内容**

- 理想实验与反事实框架

- 匹配估计量与倾向得分匹配

- 断点回归设计

## 理想实验与反事实框架

医院能够使人变得更健康么？

利用NHIS的数据，下面的表格给出了最近去过医院和没有去过医院的人的平均健康状况。

<div align=center>
<img src="https://p193.p3.n0.cdn.getcloudapp.com/items/z8u8XPyR/Snipaste_2020-06-14_17-13-24.jpg?v=1907a92979fa77cf2c38b62bf639a145" width = "40%" />
</div>

<br>

**鲁宾因果框架（Rubin Causal Model）**

个体健康状况的潜在结果

$$ Y_{i}=\left\{\begin{array}{ll}
Y_{1 i} & D_{i}=1 \\
Y_{0 i} & D_{i}=0 \\
\end{array}=Y_{0 i}+\left(Y_{1 i}-Y_{0 i}\right) D_{i}\right $$

对于个体来说，只能观测到$Y_{1 i}$或$Y_{0 i}$，所以可以理解为一个缺失数据问题。 平均处理效应(average treatment effect，ATE)为

$$\tau_{A T E}=E\left(Y_{1 i}-Y_{0 i}\right)$$

处理组的平均处理效应(average treatment effect on the treated,ATT)

$$\tau_{A T T}=E\left(Y_{1 i}-Y_{0 i} | D_{i}=1\right)$$

把是否去医院接受治疗带来的不同结果进行简单比较

$$\begin{aligned}
E\left[Y_{i} | D_{i}=1\right]-E\left[Y_{i} | D_{i}=0\right] &=E\left[Y_{1 i} | D_{i}=1\right]-E\left[Y_{0 i} | D_{i}=1\right] \\
&+E\left[Y_{0 i} | D_{i}=1\right]-E\left[Y_{0 i} | D_{i}=0\right]
\end{aligned}$$

前半部分是处理的平均因果效应，后半部分是选择性偏误。 给定随机分配下$D_{i}$的独立性，我们可以对因果效应继续简化

$$E\left[Y_{1 i} | D_{i}=1\right]-E\left[Y_{0 i} | D_{i}=1\right]=E\left[Y_{1 i}-Y_{0 i} | D_{i}=1\right]=E\left[Y_{1 i}-Y_{0 i}\right]$$

**田纳西的师生比例改进计划（STAR）**

这项实验将学生分配至三个处理组：小班、普通班及普通/助理班。对随机实验的第一个问题就是随机化是否成功地平滑了不同处理组间的各种特征。

<div align=center>
<img src="https://p193.p3.n0.cdn.getcloudapp.com/items/eDu1xjQL/Snipaste_2020-06-14_17-27-03.jpg?v=d876baccf71dc425431447332800e546" width = "50%" />
</div>

<div align=center>
<img src="https://p193.p3.n0.cdn.getcloudapp.com/items/WnubNY29/Snipaste_2020-06-14_17-29-44.jpg?v=f4b39b6079fe5f967cf000fe97e29078" width = "50%" />
</div>

**条件独立性假设（Conditional Independence assumption）**

它有时又被称为**选择偏误来自可观察变量**。假设教育水平是一个二值变量，即为虚拟变量$C_{i}$，例如可以表示是否上大学。则有

$$\begin{aligned}
E\left[Y_{i} | C_{i}=1\right]-E\left[Y_{i} | C_{i}=0\right] &=E\left[Y_{1 i} | C_{i}=1\right]-E\left[Y_{0 i} | C_{i}=1\right] \\
&+E\left[Y_{0 i} | C_{i}=1\right]-E\left[Y_{0 i} | C_{i}=0\right]
\end{aligned}$$

如果说上大学的的那些人本来就可以赚得更多，那么这里出现的选择性偏误就是正的。那么观察到的收入差距可能夸大了接受大学教育带来的收益。

条件独立假设（CIA）指的是给定观察到的特点$X_{i}$，选择性偏误消失，即

$$\left\{Y_{0 i}, Y_{1 i}\right\} \perp C_{i} | X_{i}$$

换而言之，即

$$E\left[Y_{i} | X_{i}, C_{i}=1\right]-E\left[Y_{i} | X_{i}, C_{i}=0\right]=E\left[Y_{1 i}-Y_{0 i} | X_{i}\right]$$

## 匹配估计量与倾向得分匹配

匹配法对由每个协变量的特定值所决定的个体计算处理组和控制组之间的平均差异，然后用加权平均的方法将这些平均因果效应汇总到一个总的因果效应中。

**回归与匹配**

回归和匹配都是用来控制协变量的研究策略。而回归可以看做是一种特殊的匹配估计量，特定类型的一种加权后的匹配估计量(Angrist,2008)。

<div align=center>
<img src="https://p193.p3.n0.cdn.getcloudapp.com/items/yAuYvrDk/Snipaste_2020-06-14_21-10-41.jpg?v=70b92beee425fb356cc399fb4c010897" width = "40%" />
</div>

**匹配策略可行**

如果解释变量(协变量)所决定的子集中的元素并非既有被处理的个体，也有作为控制的个体，匹配策略就未必可行。

**倾向评分定理**

若条件独立假设成立，也就是$\left\{Y_{0 i}, Y_{1 i}\right\} \perp D_{i} | X_{i}$，那么给定协变量向量的某个值函数$p\left(X_{i}\right)$(即倾向得分)，则潜在结果与处理状况仍然相互独立，即

$$\left\{Y_{0 i}, Y_{1 i}\right\} \perp D_{i} | p\left(X_{i}\right)$$

其中

$$p\left(X_{i}\right) \equiv E\left[D_{i} | X_{i}\right]=P\left[D_{i}=1 | X_{i}\right]$$

<br>

**PSM设计**

- 条件独立 —— 倾向评分定理

- 共同区间 —— $0 < p(X_{i}) < 1$

## 断点回归设计

- 最早来自于Donald L. Thistlethwaite和Donald T. Campbell(1960)的研究
  - 非实验环境下的处理效应
  - 处理由一个可观察的配置变量（assignment variable，或forcing variable，running variable）决定
  - 存在一个端点（cutoff point）

- 经典案例：班级规模、学区

- David S. Lee(2008)证明只需要证明个体无法完全控制在断点处的配置变量即可说明断点回归的有效性

- 关于断点回归
  - RD designs can be invalid if individuals can precisely manipulate the “assignment variable.”
  - If individuals—even while having some influence—are unable to precisely manipulate the assignment variable, a consequence of this is thatthe variation in treatment near thethreshold is randomized as thoughfrom a randomized experiment
  - RD designs can be analyzed—and tested—like randomized experiments.
  - Graphical presentation of an RDdesign is helpful and informative, butthe visual presentation should not be tilted toward either finding an effector finding no effect.
  - Nonparametric estimation does notrepresent a “solution” to functionalform issues raised by RD designs. It istherefore helpful to view it as a complement to—rather than a substitutefor—parametric estimation.

### 一个简单的断点回归的图形

<div align=center>
<img src="https://p193.p3.n0.cdn.getcloudapp.com/items/yAuYDx4k/simplelinearRD.jpg?v=9b37dc66799fd8bc2fd65caa7cd0c821" width = "50%" />
</div>

- 影响$Y$的其他因素必须相对于$X$连续平滑

- RD估计量依赖于选择的函数形式

### RD设计与潜在结果框架

<div align=center>
<img src="https://p193.p3.n0.cdn.getcloudapp.com/items/wbuWwN0L/nonlinearRD.jpg?v=d778e7bc8804e1052a6357ed1b7f3106" width = "50%" />
</div>

因此

$$\begin{aligned}
B-A &=\lim _{\varepsilon \downarrow 0} E\left[Y_{i} | X_{i}=c+\varepsilon\right] \\
&-\lim _{\varepsilon \uparrow 0} E\left[Y_{i} | X_{i}=c+\varepsilon\right]
\end{aligned}$$

这相当于

$$E\left[Y_{i}(1)-Y_{i}(0) | X=c\right]$$

这就是在断点$c$的平均处理效应。

### RD的识别与解释

对于研究者来说，感兴趣的问题可能如下：

- RD设计适用的情境是怎样的？即假设条件有哪些？

- 如何检验这些假设条件？

- RD设计的结果如何解释？

从表面上来看，回答如下

- 所有其他影响$Y$的变量相对于配置变量连续

- 不能检验

- 只能解释断点附近的处理效应

相对于工具变量来说，似乎没有什么优势。但如何进一步研究，可以发现

- 相对于配置变量，随机误差是连续分布的，即个体不能完全控制配置变量，那么RD设计就和断点邻域里的随机实验一样好

- 对于随机实验，可观察变量的分布在断点处仍然是连续的

- RD估计量可以解释为处理效应的加权平均