# 时间序列回归中序列相关和异方差性

## 含序列相关误差时OLS的性质

### 无偏性和一致性

- 当解释变量是严格外生，无论误差项中的序列相关程度如何，都是无偏的

- 当放松严格外生时，若数据是弱相关时，OLS估计量仍然是一致的

### 有效性和推断

假设简单线性回归模型$y_{t}=\beta_{0}+\beta_{1} x_{t}+\mu_{t}$，OLS估计量$\hat{\beta}_{1}$可写成

$$\hat{\beta}_{1}=\beta_{1}+\operatorname{SST}_{x}^{-1} \sum_{t=1}^{n} x_{t} \mu_{t}$$

因此它的抽样方差为

$$\begin{aligned} \operatorname{Var}\left(\hat{\beta}_{1}\right) &=\operatorname{SST}_{x}^{-2} \operatorname{Var}\left(\sum_{t=1}^{n} x_{t} \mu_{t}\right) \\ &=\operatorname{SST}_{x}^{-2}\left(\sum_{t=1}^{n} x_{t}^{2} \operatorname{Var}\left(\mu_{t}\right)+2 \sum_{t=1}^{n-1} \sum_{j=1}^{n-t} x_{t} x_{t+j} \mathrm{E}\left(\mu_{t} \mu_{t+j}\right)\right) \\ &=\sigma^{2} / \mathrm{SST}_{x}+2\left(\sigma^{2} / \mathrm{SST}_{x}^{2}\right) \sum_{t=1}^{n-1} \sum_{j=1}^{n-t} \rho^{j} x_{t} x_{t+j} \end{aligned}$$

- 但通常的OLS标准误和检验统计量不再有效，而且连渐近有效都谈不上，OLS便不再是BLUE的。

### 拟合优度

若数据是平稳和弱相关的，那么时间序列回归模型中即使存在序列相关，通常的拟合优度和调整的拟合优度仍然是有效的。

### 出现滞后因变量时的序列相关

**讨论**

“在出现滞后因变量和序列相关的误差时，OLS是不一致的。”这句话正确么？

假设

$$\begin{aligned} y_{t}=& \beta_{0}+\beta_{1} y_{t-1}+\mu_{t} \\ & \mathrm{E}\left(\mu_{t} | y_{t-1}\right)=0 \end{aligned}$$

因为$u_{t-1}=y_{t-1}-\beta_{0}-\beta_{1} y_{t-2}$，所以$\mu_{t}$和$\mu_{t-1}$之间的协方差就是$-\beta_{1} \operatorname{Cov}\left(u_{t}, y_{t-2}\right)$，它并不一定为零。

<br>

## 序列相关的检验

### 回归元为严格外生时对$AR(1)$序列相关的$t$检验

检验步骤

(1) 做$y_{t}$对$x_{t 1}, \dots, x_{t k}$的OLS回归，得到OLS残差$\hat{\mu}_{t}$

(2) 做$\hat{\mu}_{t}$对$\hat{\mu}_{t-1}$的回归，得到$\hat{\mu}_{t-1}$的系数$\hat{\rho}$及其$t$统计量$t_{\hat{\rho}}$

(3) 按照通常的方法，用临界值或$p$值法拒绝（或不拒绝）原假设

### 经典假定条件下的德宾-沃森检验

德宾-沃森（DW）统计量也是以OLS残差为基础的

$$DW=\frac{\sum_{t=2}^{n}\left(\hat{u}_{t}-\hat{u}_{t-1}\right)^{2}}{\sum_{t=1}^{n} \hat{u}_{t}^{2}}\approx 2(1-\hat{\rho})$$

它需要所有的经典线性模型假定，包括误差项的正态性。由于求DW的原分布比较困难，因而必须将DW与两组临界值进行比较，这些临界值通常被标志为$d_{U}$（上界）和$d_{L}$（下界）。它相对于$t$检验的唯一优点是可以列出一个精确的DW抽样分布。

### 回归元不是严格外生时$AR(1)$序列相关的检验

一般回归元的序列相关检验

(1) 做$y_{t}$对$x_{t 1}, \dots, x_{t k}$的OLS回归，得到OLS残差$\hat{\mu}_{t}$

(2) 做$\hat{\mu}_{t}$对$x_{t 1}, \dots, x_{t k}, \hat{\mu}_{t-1}$的回归，得到$\hat{\mu}_{t-1}$的系数$\hat{\rho}$及其$t$统计量$t_{\hat{\rho}}$

(3) 按照通常的方法，用临界值或$p$值法拒绝（或不拒绝）原假设

### 更高阶序列相关的检验

$AR(q)$序列相关的检验

(1) 做$y_{t}$对$x_{t 1}, \dots, x_{t k}$的OLS回归，得到OLS残差$\hat{\mu}_{t}$

(2) 做$\hat{\mu}_{t}$对$x_{t 1}, \dots, x_{t k}, \hat{\mu}_{t-1}, \hat{\mu}_{t-2}, \dots, \hat{\mu}_{t-q}$的回归

(3) 计算上式中$\hat{\mu}_{t-1}, \hat{\mu}_{t-2}, \dots, \hat{\mu}_{t-q}$联合显著的$F$检验

## 回归元严格外生时序列相关的修正

### 有$\mathbf{A R}(\mathbf{1})$误差的可行GLS估计

考虑只有一个解释变量的情况

$$y_{t}=\beta_{0} + \beta_{1}x_{t} + \mu_{t}$$

假定误差服从AR(1)模型，即

$$\mu_{t} = \rho \mu_{t-1} + e_{t}$$

可以进行如下方程变换

$$y_{t}-\rho y_{t-1}=(1-\rho) \beta_{0}+\beta_{1}\left(x_{t}-\rho x_{t-1}\right)+e_{t}, t \geq 2$$

上式可以写为

$$\widetilde{y}_{t}=(1-\rho) \beta_{0}+\beta_{1} \widetilde{x}_{t}+e_{r}, t \geq 2$$

其中

$$\tilde{y}_{t}=y_{t}-\rho y_{t-1}, \widetilde{x}_{t}=x_{t}-\rho x_{t-1}$$

被称为**准差分数据**。由于它们没有利用第一时期的数据，因此OLS估计量还不完全是BLUE的。可以把$t=1$时的方程表示为

$$y_{1}=\beta_{0}+\beta_{1} x_{1}+u_{1}$$

把方程两边都乘以$\left(1-\rho^{2}\right)^{1 / 2}$，以使误差具有相同的方差

$$\left(1-\rho^{2}\right)^{1 / 2} y_{1}=\left(1-\rho^{2}\right)^{1 / 2} \beta_{0}+\beta_{1}\left(1-\rho^{2}\right)^{1 / 2} x_{1}+\left(1-\rho^{2}\right)^{1 / 2} u_{1}$$

然后把上述方程和之前的准除差分方程一起用于OLS回归，就可以得到BLUE估计量。这里的GLS估计量存在的问题是，实际中我们很少知道$\rho$。但我们已经可以得到它的一个一致估计量：只要将OLS残差对其滞后值回归即可。

**AR(1)模型的可行GLS估计**

(1) 做$y_{t}$对$x_{t 1}, \dots, x_{t k}$的OLS回归，得到OLS残差$\hat{\mu}_{t}$

(2) 做$\hat{\mu}_{t}$对$\hat{\mu}_{t-1}$的回归，得到$\hat{\mu}_{t-1}$的系数$\hat{\rho}$

(3) 用OLS估计方程

$$\widetilde{y}_{t}=\beta_{0} \widetilde{x}_{t 0}+\beta_{1} \widetilde{x}_{t 1}+\ldots+\beta_{k} \widetilde{x}_{t k}+\text {error }_{t}$$

其中，对$t \geq 2$，$\widetilde{x}_{t 0}=(1-\hat{\rho})$，而$\widetilde{x}_{10}=\left(1-\hat{\rho}^{2}\right)^{1 / 2}$。常见的标准误、$t$统计量和$F$统计量都是渐近有效的。

$AR(1)$模型的FGLS估计有很多名称，根据处理第一次观测的方法不同而不同。柯克伦-奥卡特（CO）估计省略了第一次观测，而普莱斯-温斯顿（PW）估计按照上述方法使用了第一次观测。

<br>

**讨论**

OLS和FGLS哪个更好？

In [1]:
use http://fmwww.bc.edu/ec-p/data/wooldridge/barium, clear

tsset t

eststo clear
eststo: quietly reg lchnimp lchempi lgas lrtwex befile6 affile6 afdec6
eststo: quietly prais lchnimp lchempi lgas lrtwex befile6 affile6 afdec6, corc
esttab, r2



        time variable:  t, 1 to 131
                delta:  1 unit


(est1 stored)

(est2 stored)


--------------------------------------------
                      (1)             (2)   
                  lchnimp         lchnimp   
--------------------------------------------
lchempi             3.117***        2.947***
                   (6.50)          (4.57)   

lgas                0.196           1.055   
                   (0.22)          (1.06)   

lrtwex              0.983*          1.137*  
                   (2.46)          (2.21)   

befile6            0.0596         -0.0164   
                   (0.23)         (-0.05)   

affile6           -0.0324         -0.0331   
                  (-0.12)         (-0.10)   

afdec6             -0.565          -0.577   
                  (-1.98)         (-1.68)   

_cons              -17.80          -37.32   
                  (-0.85)         (-1.61)   
--------------------------------------------
N                     131            

## 在OLS后的序列相关-稳健推断

## 时间序列回归中的异方差性