# 双重差分法及其拓展

双重差分法是政策分析中常用的方法之一。

## 一个阐述性的案例

### 简要说明

假设存在两个组，分别是控制组和处理组，在政策干预前后见下图。

<div align=center>
<img src="https://ds4ps.org/PROG-EVAL-III/DiffInDiff_files/figure-html/diffindiff-1.png" width = "60%" />
</div>

因此可见，所谓的双重差分法其实是两个组均值差异的差异。具体用公式表达为

$$(Treatment_post - Treatment_pre) - (Control_post - Control_pre) = DID estimate$$

那么上图中的DD估计值为

$$(85-50)-(55-35)=15$$

也可以用下表来表示

<div align=center>
<img src="https://ds4ps.org/PROG-EVAL-III/FIGURE/DiffInDiff/Picture1.1.png" width = "50%" />
</div>

### DID的计量模型

$$Y =\beta_{0}+\beta_{1} \times Treatment +\beta_{2} \times Post +\beta_{3} \times Treatment \times Post +\mu $$

#### 样本数据

In [2]:
DID_demo_data <- data.frame(Y=c(74,46,96,54,50,30,60,40),T=c(1,1,1,1,0,0,0,0),P=c(1,0,1,0,1,0,1,0))
DID_demo_data

Y,T,P
<dbl>,<dbl>,<dbl>
74,1,1
46,1,0
96,1,1
54,1,0
50,0,1
30,0,0
60,0,1
40,0,0


#### 回归结果

假设上述模型可以得到的回归结果如下

In [7]:
library(stargazer)

reg = lm(Y ~ T + P + T*P, data=DID_demo_data)

stargazer( reg, 
           type = "text", 
           dep.var.labels = ("Outcome"),
           column.labels = c(""),
           covariate.labels = c("Intercept (B0)", "Treatment (B1)", "Post-treatment (B2)", "DID (B3)"),
           omit.stat = "all", 
           digits = 2, intercept.bottom = FALSE )


                        Dependent variable:    
                    ---------------------------
                              Outcome          
                                               
-----------------------------------------------
Intercept (B0)               35.00***          
                              (6.84)           
                                               
Treatment (B1)                 15.00           
                              (9.67)           
                                               
Post-treatment (B2)            20.00           
                              (9.67)           
                                               
DID (B3)                       15.00           
                              (13.67)          
                                               
Note:               *p<0.1; **p<0.05; ***p<0.01


#### 系数解释

对于系数的基本含义，用下列图片解释

<div align=center>
<img src="https://ds4ps.org/PROG-EVAL-III/DiffInDiff_files/figure-html/beta0-1.png" width = "60%" />
</div>

<div align=center>
<img src="https://ds4ps.org/PROG-EVAL-III/DiffInDiff_files/figure-html/beta1-1.png" width = "60%" />
</div>

<div align=center>
<img src="https://ds4ps.org/PROG-EVAL-III/DiffInDiff_files/figure-html/beta2-1.png" width = "60%" />
</div>

<div align=center>
<img src="https://ds4ps.org/PROG-EVAL-III/DiffInDiff_files/figure-html/beta3-1.png" width = "60%" />
</div>

### 反事实（counterfactural）

为了更好地理解交互项前面的系数，就需要理解反事实。这里的反事实是指处理组，如果政策干预没有实施的潜在结果。如下图所示

<div align=center>
<img src="https://ds4ps.org/PROG-EVAL-III/DiffInDiff_files/figure-html/counterfactual-1.png" width = "60%" />
</div>

<div align=center>
<img src="https://ds4ps.org/PROG-EVAL-III/DiffInDiff_files/figure-html/CF-1.png" width = "60%" />
</div>

### 平行趋势假设

DID成立的一个关键假定在于，如果没有政策干预，那么处理组和控制组有相同的变化趋势，我们称之为平行趋势假设。见下图所示。

<div align=center>
<img src="https://ds4ps.org/PROG-EVAL-III/DiffInDiff_files/figure-html/pline-1.png" width = "60%" />
</div>

### 参考

点击[此处](https://ds4ps.org/PROG-EVAL-III/DiffInDiff.html)

## 双重差分法基础

政策评估方法

- 事前事后比较 —— 无法控制时间趋势

- 控制组和处理组比较 —— 自选择问题

### Card和Krueger的例子

**基本情况**

- 讨论最低工资对就业的影响

- 考虑两个州：New Jersey和Pennsylvania

- New Jersey的最低工资在1992年4月1日从4.25提高到5.05

- Pennsylvania的最低工资一直保持在4.25

<br>

**模型**

- $y_{1}$是最低工资在高点时快餐业的就业

- $y_{0}$是最低工资在低点时快餐业的就业

则条件期望为

$$E\left(y_{0} | X\right)=E\left(y_{0} | s, t\right)=\gamma_{s}+\lambda_{t}$$

其中$s$代表州（New Jersey或Pennsylvania），$t$代表时期（2月，即最低工资提高前；11月，即最低工资提高后）。这意味如果没有最低工资的变动，两个州就业的变动是相同的。现在，加上处理效应，则

$$E\left(y_{1} | s, t\right)=E\left(y_{0} | s, t\right)+\beta=\gamma_{s}+\lambda_{t}+\beta$$

所以第$i$个餐厅的就业为

$$y_{i}=\gamma_{s}+\lambda_{t}+\beta D_{s t}+\varepsilon_{i}$$

其中$D_{st}$是虚拟变量，其中在11月的New Jersey为1，否则为0。由此可见

$$E\left(y_{i} | s=P A, t=N o v\right)-E\left(y_{i} | s=P A, t=F e b\right)=\lambda_{N o v}-\lambda_{F e b}$$

和

$$E\left(y_{i} | s=N J, t=N o v\right)-E\left(y_{i} | s=N J, t=F e b\right)=\lambda_{N o v}-\lambda_{F e b}+\beta_{-}$$

因此

$$\begin{array}{c}
{\left[E\left(y_{i} | s=P A, t=N o v\right)-E\left(y_{i} | s=P A, t=F e b\right)\right]} \\
-\left[E\left(y_{i} | s=N J, t=N o v\right)-E\left(y_{i} | s=N J, t=F e b\right)\right]=\beta
\end{array}$$

那么其中的关键假设就是两个州在最低工资不提高时具有相同的就业趋势。

### DID的回归形式

如同上述例子，只有两个时期和两个组，那么其形式如下

$$\begin{aligned}
y_{i} &=\gamma_{s}+\lambda_{t}+\beta D_{s t}+\varepsilon_{i} \\
&=\alpha+\gamma 1(s=N J)+\lambda 1(t=N o v)+\beta 1(s=N J) \cdot 1(t=N o v)+\varepsilon_{i}
\end{aligned}$$

其中$1(\cdot)$是指示函数。

由此可得

$$\begin{aligned}
\alpha=& E\left(y_{i} | s=P A, t=F e b\right) \\
\gamma=& E\left(y_{i} | s=N J, t=F e b\right)-E\left(y_{i} | s=P A, t=F e b\right) \\
\lambda=& E\left(y_{i} | s=P A, t=N o v\right)-E\left(y_{i} | s=P A, t=F e b\right) \\
\beta=&\left[E\left(y_{i} | s=P A, t=N o v\right)-E\left(y_{i} | s=P A, t=F e b\right)\right] \\
&-\left[E\left(y_{i} | s=N J, t=N o v\right)-E\left(y_{i} | s=N J, t=F e b\right)\right]
\end{aligned}$$

若存在多个州和多个时期，那么模型可写为

$$y_{s t}=\gamma_{s}+\lambda_{t}+\beta D_{s t}+\epsilon_{s t}$$

若用个体层面，模型可写为

$$y_{i s t}=\gamma_{s}+\lambda_{t}+\beta D_{s t}+X_{i s t} \delta+\varepsilon_{i s t}$$

### 固定效应

我们对上述个体层面的模型进行简化，得到

$$y_{i t}=\alpha_{i}+\lambda_{t}+\beta D_{i t}+X_{i t} \delta+\varepsilon_{i t}$$

这个实际上就是双效应的固定效应模型

In [11]:
library(tidyverse)
library(haven)
library(texreg)
library(lfe)
library(stargazer)


dat <- read_dta("http://dss.princeton.edu/training/Panel101.dta")  %>% 
  mutate(time = (year>=1994) ,
         treated = (country>4),
         did = time*treated)

reg_ols <- lm(y_bin~ time+ treated+ did, data = dat)
reg_fe_a <- felm(y_bin~ did | time+ treated, data = dat)
reg_fe_b <- felm(y_bin~ did | time+ country, data = dat)

stargazer( reg_ols, reg_fe_a, reg_fe_b,
           type = "text", 
           dep.var.labels = ("y_bin"),
           column.labels = c(""),
           omit.stat = "all", 
           digits = 2, intercept.bottom = FALSE )


              Dependent variable:     
         -----------------------------
                       y              
            OLS           felm        
                                      
            (1)       (2)       (3)   
--------------------------------------
Constant  0.50***                     
          (0.09)                      
                                      
time      0.38***                     
          (0.12)                      
                                      
treated   0.42***                     
          (0.14)                      
                                      
did       -0.40**   -0.40**   -0.40** 
          (0.19)    (0.19)    (0.18)  
                                      
Note:      *p<0.1; **p<0.05; ***p<0.01


### 最低饮酒年龄法案的例子

在1975年，阿拉巴马州将最低法定饮酒年龄降低到19岁，而与之字母顺序和地理方位上接近的阿肯色州，其最低法定饮酒年龄是21岁。那么阿拉巴马州对年轻饮酒者的放纵，是否牺牲了更多人的生命呢？

利用1970-1983年间介于18-20岁的年轻人数据，构建下述双重差分回归模型

$$
\begin{aligned}
Y_{s t}=\alpha &+\beta T R E A T_{s}+\gamma P O S T_{t} \\
&+\delta_{r D D}\left(T R E A T_{s} \times P O S T_{t}\right)+e_{s t}
\end{aligned}
$$

<br>

若存在多个州，双重差分回归模型拓展为

$$
\begin{aligned}
Y_{s t}=\alpha &+\delta_{r D D} L E G A L_{s t} \\
&+\sum_{k=\text { Alaska }}^{\text {Wyoming }} \beta_{k} S T A T E_{k s}+\sum_{j=1971}^{1983} \gamma_{j} Y E A R_{j t}+e_{s t}
\end{aligned}
$$

<br>

<div align=center>
<img src="./pics/DID01.jpg" width = "45%" />
</div>

<div align=center>
<img src="./pics/DID02.jpg" width = "45%" />
</div>

<div align=center>
<img src="./pics/DID03.jpg" width = "45%" />
</div>

<br>

在包含许多州和许多年份的样本允许我们可以放松共同趋势假设，对州趋势进行控制的双重差分回归模型形如

$$
\begin{aligned}
Y_{s t}=\alpha+& \delta_{r D D} L E G A L_{s t} \\
&+\sum_{k=\text { Alaska }}^{\text {Wyoming }} \beta_{k} S T A T E_{k s}+\sum_{j=1971}^{1983} \gamma_{j} Y E A R_{j t} \\
&+\sum_{k=\text { Alaska }}^{\text {Wyoming }} \theta_{k}\left(S T A T E_{k s} \times t\right)+e_{s t}
\end{aligned}
$$

<br>

<div align=center>
<img src="./pics/DID04.jpg" width = "50%" />
</div>