# 内生性

在微观经济分析中， 外生变量指的是那些不由被考虑的经济体系所决定的因素，
而内生变量则是在经济体系内被决定的因素。

如下是我们碰到过多次的一个微观经济习题。如果一个人的效用函数是
$u\left(q_{1},q_{2}\right)$，其中
$q_{1}$ 和 $q_{2}$ 是两件商品的数量。 他的预算是
$p_{1}q_{1}+p_{2}q_{2}\leq C$，其中 $p_{1}$ 和 $p_{2}$
分别是两件商品的价格。那么他会购买的最优数量
$q_{1}^{*}$ 和 $q_{2}^{*}$ 是多少呢？在这个问题中，效用函数
$u\left(\cdot,\cdot\right)$，物品价格 $p_{1}$ 和
$p_{2}$，和预算 $C$ 是外生变量。 而最优数量
$q_{1}^{*}$ 和 $q_{2}^{*}$ 是内生变量。



这两个微观经济学中的术语“内生性”和“外生性”将被结转到多方程计量经济模型中。
在一个单方程回归模型中，

$$
y_{i}=x_{i}'\beta+e_{i}
$$ 

只是方程系统中的一部分。
为了简单起见， 如果在单方程模型中，$\mathrm{cov}\left(x_{ik},e_{i}\right)\neq0$，
那么我们就认为 $x_{ik}$ 是*内生的*，或者说是一个 *内生性变量*；
反之 $x_{ik}$ 就是一个*外生性变量*。

使用线性回归方法的实证工作常常受到有关内生性问题的挑战。这些问题困扰着经济研讨会和审稿人报告。
为了捍卫定量经济研究中的实证分析策略，了解潜在内生性的来源和全面地讨论如何解决内生性是非常重要的。



识别
--------------

内生性通常意味着难以仅用 $\left(y_{i},x_{i}\right)$ 识别我们感兴趣的参数。内生性的鉴别
对于理解实证经济研究是至关重要的. 如果模型中的参数与被观测变量的分布之间的映射是一一对应的，
那我们就认为这个参数是被*识别*的。反之我们就称这个参数为*识别不足*。 这是一个抽象的定义，
让我们接下来在线性回归的背景下来讨论它。

线性投影模型隐含了矩方程：
$$\mathbb{E}\left[x_{i}x_{i}'\right]\beta=\mathbb{E}\left[x_{i}y_{i}\right]. (引用)$$
如果 $E\left[x_{i}x_{i}'\right]$ 是满秩的，那么
$\beta=\left(\mathbb{E}\left[x_{i}x_{i}'\right]\right)^{-1}\mathbb{E}\left[x_{i}y_{i}\right]$
是总体矩量的一个函数，并且它被识别。与之形成对比的是，如果一些 $x_{k}$ 是完美共线的，
意味着 $\mathbb{E}\left[x_{i}x_{i}'\right]$ 是秩不足的，亦即有多个
$\beta$ 可以满足 $k$ 方程系统。
([\[eq:k-equation-FOC\]](#eq:k-equation-FOC){reference-type="ref"
reference="eq:k-equation-FOC"}). 识别失败。




假设 $x_{i}$ 是一个随机的标量， 

$$
\begin{pmatrix}x_{i}\\
e_{i}
\end{pmatrix}\sim N\left(\begin{pmatrix}0\\
0
\end{pmatrix},\begin{pmatrix}1 & \sigma_{xe}\\
\sigma_{xe} & 1
\end{pmatrix}\right)
$$ 

服从联合正态分布，并且因变量 $y_{i}$ 来源于
([\[eq:generative\]](#eq:generative){reference-type="ref"
reference="eq:generative"})。 对联合正态分布的假设意味着条件均值
$$\mathbb{E}\left[y_{i}|x_{i}\right]=\beta x_{i}+\mathbb{E}\left[e_{i}|x_{i}\right]=\left(\beta+\sigma_{xe}\right)x_{i}$$
与线性投影模型一致，并且 $\beta+\sigma_{xe}$ 是联合投影模型中的系数。
从可观察的随机变量 $\left(y_{i},x_{i}\right)$ 中，我们只能得到 $\beta+\sigma_{xe}$。
由于无法观测到的 $e_{i}$，我们从数据中不能得出 $\sigma_{xe}$，因此无法重新获得
$\beta$。 这正是我们在本课程前面提到过的 *遗漏变量偏差*。差距在于可用数据
$\left(y_{i},x_{i}\right)$ 和模型识别之间。在特殊情况下，我们假设
$\sigma_{xe}=0$，此时内生性消失，$\beta$ 可以被识别。



到目前为止，线性投影模型是本课程中证明OLS合理性的最通用模型。
OLS对于线性投影系数来说是一致的。根据线性投影模型的定义，
$\mathbb{E}\left[x_{i}e_{i}\right]=0$，因此在线性投影模型中，没有内生性的空间，
内生性没有存在的可能。 换句话说，如果我们在谈论内生性，我们一定不是在使用线性投影模型，
并且我们想求的系数是结构参数的系数，而不是线性投影系数。

在计量经济学中，我们经常对具有经济解释的模型感兴趣。实证研究中的普遍做法是假设
观察到的数据是从一个简约模型中生成的，然后下一步是去估计模型中的未知参数。 由于
我们通常可以发现一些未包含在回归变量中的参数，但他们又与包含的回归变量相关，同时
又影响 $y_{i}$，因此内生性成为一个重要问题。



为了解决内生性，我们寻求可以保证模型能识别的额外变量或数据结构。最常用的方法是：
(i) 固定效益模型 (ii) 工具变量：

-   固定效应模型需要为每个个体 $i$ 收集多个观察值，通常是跨时间的。此外，
    内生性的来源是不变于时间的，并以如下形式另外进入模型： 

    $$
    y_{it}=x_{it}'\beta+u_{it},
    $$ 
    
    其中
    $u_{it}=\alpha_{i}+\epsilon_{it}$ 是复合误差。如果数据沿时间维度可用，
    那么面板数据方法将会把 $\left(y_{i},x_{i}\right)$ 扩展到
    $\left(y_{it},x_{it}\right)_{i=1}^{T}$。

-   工具变量方法将 $\left(y_{i},x_{i}\right)$ 扩展到 $\left(y_{i},x_{i},z_{i}\right)$，
    其中额外的随机变量 $z_{i}$ 被称为 *工具变量*。我们假设 $z_{i}$ 与误差 $e_{i}$
    正交。因此，它与模型一起添加了一个额外的变量 $z_{i}$。

面板数据法或工具变量法都需要除 $\left(y_{i},x_{i}\right)$ 以外的额外信息。
没有这些额外的数据，就没有办法解决识别失败。正如线性投影模型可以用于存在合适矩的
$\left(y_{i},x_{i}\right)$ 的任何联合分布一样，从纯统计学角度来看一个线性IV
（工具变量）模型是一种伪影(ZT doesn't know what it means)，仅取决于 $\left(y_{i},x_{i},z_{i}\right)$ 的选择，
而无需参考任何经济学知识。本质上，线性IV模型求的是与 $z_{i}$ 跨越的线性空间正交
的线性组合 $y_{i}-\beta x_{i}$。



工具变量
-----------

有效的 IV 有两个要求：正交性和相关性。正交性需要正确指定模型。如果
违反了相关性，即 IV 与内生变量不相关，则多个参数可以生成可观察数据。
识别，按照计量经济学中的标准定义，在这种情况下被打破了。

结构方程是一种我们关心的经济模型。让我们来看看以下这个线性结构模型：

$$
y_{i}=x_{1i}'\beta_{1}+z_{1i}'\beta_{2}+\epsilon_{i},
$$


其中 $x_{1i}$ 是一个 $k_{1}$维的内生解释变量，$z_{1i}$ 是一个 $k_{2}$维
包含了截距的外生解释变量。另外，还有 $z_{2i}$，一个 $k_{3}$维不被包含的外生变量。
令 $K=k_{1}+k_{2}$，$L=k_{2}+k_{3}$。将 $x_{i}=\left(x_{1i}',z_{1i}'\right)'$ 
表示为一个 $K$维的解释变量，$z_{i}=\left(z_{1i}',z_{2i}'\right)$ 为一个 $L$维的
外生向量。

我们称这个外生变量为*工具变量*(instrumental variable, or IV for short)。令 $\beta=\left(\beta_{1}',\beta_{2}'\right)'$ 
为一个我们感兴趣的 $K$维的参数。从现在开始，我们将
([\[eq:basic\_1\]](#eq:basic_1){reference-type="ref"
reference="eq:basic_1"}) 重写为

$$
y_{i}=x_{i}'\beta+\epsilon_{i}
$$

我们就有了一个工具向量 $z_{i}$。

在估计任何结构计量经济模型之前，我们必须检查是否能识别。在
([\[eq:basic\_2\]](#eq:basic_2){reference-type="ref"
reference="eq:basic_2"})的背景下， 识别需要真值 $\beta_{0}$ 是参数空间上满足矩条件

$$
\mathbb{E}\left[z_{i}\left(y_{i}-x_{i}'\beta\right)\right]=0_{L}.
$$

的唯一值。秩条件是识别的充分必要条件。

$\mathrm{rank}\left(\mathbb{E}\left[z_{i}x_{i}'\right]\right)=K$.

注意 $\mathbb{E}\left[x_{i}'z_{i}\right]$ 是一个 $K\times L$ 的矩阵。
秩条件意味着 *顺序条件* $L\geq K$， 即不被包含的工具的数量必须不少于内生变量的数量。

([\[eq:moment\]](#eq:moment){reference-type="ref"
reference="eq:moment"})中的参数当且仅当秩条件成立时才被识别。

（“正”方向的证明。） 对于任何使得 $\tilde{\beta}\neq\beta_{0}$ 的 $\tilde{\beta}$，
$$\begin{aligned}
\mathbb{E}\left[z_{i}\left(y_{i}-x_{i}'\tilde{\beta}\right)\right] & =\mathbb{E}\left[z_{i}\left(y_{i}-x_{i}'\beta_{0}\right)\right]+\mathbb{E}\left[z_{i}x_{i}'\right]\left(\beta_{0}-\tilde{\beta}\right)\\
 & =0_{L}+\mathbb{E}\left[z_{i}x_{i}'\right]\left(\beta_{0}-\tilde{\beta}\right).\end{aligned}$$
由于
$\mathrm{rank}\left(\mathbb{E}\left[z_{i}x_{i}'\right]\right)=K$，我们会得到
$\mathbb{E}\left[z_{i}x_{i}'\right]\left(\beta_{0}-\tilde{\beta}\right)=0_{L}$
当且仅当 $\beta_{0}-\tilde{\beta}=0_{K}$，而这违反了
$\tilde{\beta}\neq\beta_{0}$。因此 $\beta_{0}$ 是唯一满足
([\[eq:moment\]](#eq:moment){reference-type="ref"
reference="eq:moment"})的值。

（“反”方向的证明留作练习。 提示：通过对立性，如果秩条件不成立，则模型无法被识别。
我们可以通过举例子轻松地证明这个定理。）



内生性的来源
----------------------

由于计量经济学家主要使用非实验数据，我们内生性问题非常重要性。下面我们来看几个例子。

我们知道一阶差分 (FD) 估计值对于（静态）面板数据模型来说是一致的。但FD估计值
在动态面板模型中将会遇到困难：
$$y_{it}=\beta_{1}+\beta_{2}y_{i,t-1}+\beta_{3}x_{it}+\alpha_{i}+\epsilon_{it},\label{eq:dymPanel}$$
即使我们假设
$$\mathbb{E}\left[\epsilon_{is}|\alpha_{i},x_{i1},\ldots,x_{iT},y_{i,t-1},y_{i,t-2},\ldots,y_{i0}\right]=0,\ \ \forall s\geq t\label{eq:dyn_mean_0}$$
当对周期 $t$ 和 $t-1$ 取上述方程 ([\[eq:dymPanel\]](#eq:dymPanel){reference-type="ref"
reference="eq:dymPanel"}) 的差时，我们得到
$$\left(y_{it}-y_{i,t-1}\right)=\beta_{2}\left(y_{it-1}-y_{i,t-2}\right)+\beta_{3}\left(x_{it}-x_{i,t-1}\right)+\left(\epsilon_{it}-\epsilon_{i,t-1}\right).\label{eq:dyn_mean_1}$$
根据 ([\[eq:dyn\_mean\_0\]](#eq:dyn_mean_0){reference-type="ref"
reference="eq:dyn_mean_0"})，
$\mathbb{E}\left[\left(x_{it}-x_{i,t-1}\right)\left(\epsilon_{it}-\epsilon_{i,t-1}\right)\right]=0$，
但是
$$\mathbb{E}\left[\left(y_{i,t-1}-y_{i,t-2}\right)\left(\epsilon_{it}-\epsilon_{i,t-1}\right)\right]=-\mathbb{E}\left[y_{i,t-1}\epsilon_{i,t-1}\right]=-\mathbb{E}\left[\epsilon_{i,t-1}^{2}\right]\neq0.$$
因此系数 $\beta_{2}$ 和 $\beta_{3}$ 不能从线性回归模型
([\[eq:dyn\_mean\_1\]](#eq:dyn_mean_1){reference-type="ref"
reference="eq:dyn_mean_1"}) 中被识别。

在上述例子中工具变量很容易找到。请注意里面的线性关系
([\[eq:dymPanel\]](#eq:dymPanel){reference-type="ref"
reference="eq:dymPanel"}) 意味着 $$\begin{aligned}
 &  & \mathbb{E}\left[\epsilon_{i,t}-\epsilon_{i,t-1}|\alpha_{i},x_{i1},\ldots,x_{iT},\epsilon_{i,t-2},\epsilon_{i,t-3},\ldots,\epsilon_{i1},y_{i0}\right]\\
 & = & \mathbb{E}\left[\epsilon_{i,t}-\epsilon_{i,t-1}|\alpha_{i},x_{i1},\ldots,x_{iT},y_{i,t-2},y_{i,t-3},\ldots,y_{i0}\right]=0\end{aligned}$$
根据假设
([\[eq:dyn\_mean\_0\]](#eq:dyn_mean_0){reference-type="ref"
reference="eq:dyn_mean_0"}). 上述关系以
$$\mathbb{E}\left[\left(\epsilon_{i,t}-\epsilon_{i,t-1}\right)f\left(\epsilon_{i,t-2},\epsilon_{i,t-3},\ldots,\epsilon_{i1}\right)\right]=0.$$ 的形式给出正交条件。
换句话说，任何关于 $y_{i,t-2},y_{i,t-3},\ldots,y_{i1}$ 的函数都垂直于误差项
$\left(\epsilon{}_{i,t-1}-\epsilon_{i,t-2}\right)$. 
这里被排除在外的IV（工具变量）是由模型本身自然生成的。



另一个经典的内生性来源是测量误差。

当解释变量不是直接可观察的，而是被有误差的测量代替时，内生性的问题也会出现。假设真正的线性模型是
$$y_{i}=\beta_{1}+\beta_{2}x_{i}^{*}+u_{i},\label{eq:measurement_error}$$
其中 $\mathbb{E}\left[u_{i}|x_{i}^{*}\right]=0$。 我们观察不到
$x_{i}^{*}$，但我们能观察到 $x_{i}$，它是 $x_{i}^{*}$ 的测量值，
并且它们的关系是 $$x_{i}=x_{i}^{*}+v_{i}$$，其中
$\mathbb{E}\left[v_{i}|x_{i}^{*},u_{i}\right]=0$。这种测量误差的公式被称为*经典测量误差*。
替换([\[eq:measurement\_error\]](#eq:measurement_error){reference-type="ref"
reference="eq:measurement_error"}),
$$y_{i}=\beta_{1}+\beta_{2}\left(x_{i}-v_{i}\right)+u_{i}=\beta_{1}+\beta_{2}x_{i}+e_{i}\label{eq:measurement_error2}$$
中的不可观察的 $x_{i}^{*}$，
其中 $e_{i}=u_{i}-\beta_{2}v_{i}$。相关性
$$\mathbb{E}\left[x_{i}e_{i}\right]=\mathbb{E}\left[\left(x_{i}^{*}+v_{i}\right)\left(u_{i}-\beta_{2}v_{i}\right)\right]=-\beta_{2}\mathbb{E}\left[v_{i}^{2}\right]\neq0.$$
OLS
([\[eq:measurement\_error2\]](#eq:measurement_error2){reference-type="ref"
reference="eq:measurement_error2"}) 不能提供一个一致的估计量。

或者，我们可以从线性投影系数的表达式来看上述经典测量误差问题。我们知道在
([\[eq:measurement\_error\]](#eq:measurement_error){reference-type="ref"
reference="eq:measurement_error"})
$\beta_{2}^{\mathrm{infeasible}}=\mathrm{cov}\left[x_{i}^{*},y_{i}\right]/\mathrm{var}\left[x_{i}^{*}\right].$
相反，当我们对可观察的 $x_{i}$ 回归 $y_{i}$ 时，对应的线性投影系数为
$$\beta_{2}^{\mathrm{feasible}}=\frac{\mathrm{cov}\left[x_{i},y_{i}\right]}{\mathrm{var}\left[x_{i}\right]}=\frac{\mathrm{cov}\left[x_{i}^{*}+v_{i},y_{i}\right]}{\mathrm{var}\left[x_{i}^{*}+v_{i}\right]}=\frac{\mathrm{cov}\left[x_{i}^{*},y_{i}\right]}{\mathrm{var}\left[x_{i}^{*}\right]+\mathrm{var}\left[v_{i}\right]}.$$
很明显，
$|\beta_{2}^{\mathrm{feasible}}|\leq|\beta_{2}^{\mathrm{infeasible}}|$
对应的线性投影系数为 $\mathrm{var}\left[v_{i}\right]=0$ （无测量误差）
时成立。这称为由于测量误差引起的*衰减偏差*。



接下来，我们给出两个方程组的例子，一个来自微观经济学，另一个来自宏观经济学。

设 $p_{i}$ 和 $q_{i}$ 为第 $i$ 个市场上一个商品的对数价格和对数数量，并且它们在市场上是独立同分布的。
我们对下面的这个需求曲线感兴趣
$$p_{i}=\alpha_{d}-\beta_{d}q_{i}+e_{di}\label{eq:demand}$$
其中 $\beta_{d}\geq0$； 以及以下这个供给曲线
$$p_{i}=\alpha_{s}+\beta_{s}q_{i}+e_{si}\label{eq:supply}$$，其中
$\beta_{s}\geq0$。 我们使用一个简单的线性规范，以便系数 $\beta_{d}$
可以被解释为需求弹性，而 $\beta_{s}$ 可以被解释为供给弹性。 
本科微观经济学课程教授确定性形式，但我们添加了一个误差项来处理数据。
我们可以通过对 $q_{i}$ 回归 $p_{i}$ 来得到弹性吗？

这两个方程可以被写成矩阵形式：
$$\begin{pmatrix}1 & \beta_{d}\\
1 & -\beta_{s}
\end{pmatrix}\begin{pmatrix}p_{i}\\
q_{i}
\end{pmatrix}=\begin{pmatrix}\alpha_{d}\\
\alpha_{s}
\end{pmatrix}+\begin{pmatrix}e_{di}\\
e_{si}
\end{pmatrix}.\label{eq:structural}$$ 微观经济学术语称
$\left(p_{i},q_{i}\right)$ 为内生变量，称
$\left(e_{di},e_{si}\right)$ 为外生变量。
([\[eq:structural\]](#eq:structural){reference-type="ref"
reference="eq:structural"}) 是一个*结构方程*，因为它是由经济理论驱动的，
因此系数具有经济意义。如果我们排除明显的情况 $\beta_{d}=\beta_{s}=0$，
我们可以解出 $$\begin{aligned}
\begin{pmatrix}p_{i}\\
q_{i}
\end{pmatrix} & =\begin{pmatrix}1 & \beta_{d}\\
1 & -\beta_{s}
\end{pmatrix}^{-1}\left[\begin{pmatrix}\alpha_{d}\\
\alpha_{s}
\end{pmatrix}+\begin{pmatrix}e_{di}\\
e_{si}
\end{pmatrix}\right]\nonumber \\
 & =\frac{1}{\beta_{s}+\beta_{d}}\begin{pmatrix}\beta_{s} & \beta_{d}\\
1 & -1
\end{pmatrix}\left[\begin{pmatrix}\alpha_{d}\\
\alpha_{s}
\end{pmatrix}+\begin{pmatrix}e_{di}\\
e_{si}
\end{pmatrix}\right].\label{eq:reduced}\end{aligned}$$ 这个方程
([\[eq:reduced\]](#eq:reduced){reference-type="ref"
reference="eq:reduced"}) 被称为 *简化形式*——内生变量被表示为关于参数和外生变量的显式函数。
特别地，
$$q_{i}=\left(\alpha_{d}+e_{di}-\alpha_{s}-e_{si}\right)/\left(\beta_{s}+\beta_{d}\right)$$
因此对数价格与 $e_{si}$ 和 $e_{di}$ 都相关。由于 $q_{i}$ 在
([\[eq:demand\]](#eq:demand){reference-type="ref"
reference="eq:demand"}) 或 ([\[eq:supply\]](#eq:supply){reference-type="ref"
reference="eq:supply"}) 中是内生的（在计量经济学意义上），因此需求弹性和供给弹性都不能与
$\left(p_{i},q_{i}\right)$ 相同。确实，由于在([\[eq:reduced\]](#eq:reduced){reference-type="ref"
reference="eq:reduced"})中，
$$p_{i}=\left(\beta_{s}\alpha_{d}+\beta_{d}\alpha_{s}+\beta_{s}e_{di}+\beta_{d}e_{si}\right)/\left(\beta_{s}+\beta_{d}\right)$$
$p_{i}$ 在 $q_{i}$ 上的线性投影系数为
$$\frac{\mathrm{cov}\left[p_{i},q_{i}\right]}{\mathrm{var}\left[q_{i}\right]}=\frac{\beta_{s}\sigma_{d}^{2}-\beta_{d}\sigma_{s}^{2}+\left(\beta_{d}-\beta_{s}\right)\sigma_{sd}}{\beta_{d}^{2}\sigma_{d}^{2}+\beta_{d}\sigma_{s}^{2}+2\beta_{d}\beta_{s}\sigma_{sd}},$$
其中 $\sigma_{d}^{2}=\mathrm{var}\left[e_{di}\right]$,
$\sigma_{s}^{2}=\mathrm{var}\left[e_{si}\right]$ and
$\sigma_{sd}=\mathrm{cov}\left[e_{di},e_{si}\right]$。

这是供需系统的经典例子。结构参数无法被直接识别，因为观察到的
$\left(p_{i},q_{i}\right)$ 是均衡的结果——需求曲线和供给曲线的交叉点。
为了识别需求曲线，我们需要一个仅移动供给曲线的工具；反之亦然。




这是借用 Hayashi (2000, p.193) 的模型，但其源自 @haavelmo1943statistical。
一位计量经济学家想求出 $\beta_{2}$， 也就是凯恩斯型方程
$$C_{i}=\beta_{1}+\beta_{2}Y_{i}+u_{i}\label{eq:keynes}$$ 中的 *边际消费倾向*；
其中 $C_{i}$ 是家庭消费，$Y_{i}$ 是 GNP，而 $u_{i}$ 是不可观察误差。
但是，$Y_{i}$ 和 $C_{i}$ 通过一个会计等式连接（没有误差）
$$Y_{i}=C_{i}+I_{i},$$ 其中 $I_{i}$ 是投资。
我们假设 $\mathbb{E}\left[u_{i}|I_{i}\right]=0$，因为投资是预先确定的。
在这个例子中，$\left(Y_{i}C_{i}\right)$ 是内生的，而$\left(I_{i},u_{i}\right)$
是外生的。将两个方程以结构形式放在一起，
$$\begin{pmatrix}1 & -\beta_{2}\\
-1 & 1
\end{pmatrix}\begin{pmatrix}C_{i}\\
Y_{i}
\end{pmatrix}=\begin{pmatrix}\beta_{1}\\
0
\end{pmatrix}+\begin{pmatrix}u_{i}\\
I_{i}
\end{pmatrix}.$$ 相对应的简化形式是 $$\begin{aligned}
\begin{pmatrix}C_{i}\\
Y_{i}
\end{pmatrix} & =\begin{pmatrix}1 & -\beta_{2}\\
-1 & 1
\end{pmatrix}^{-1}\left[\begin{pmatrix}\beta_{1}\\
0
\end{pmatrix}+\begin{pmatrix}u_{i}\\
I_{i}
\end{pmatrix}\right]\\
 & =\frac{1}{1-\beta_{2}}\begin{pmatrix}1 & \beta_{2}\\
1 & 1
\end{pmatrix}\left[\begin{pmatrix}\beta_{1}\\
0
\end{pmatrix}+\begin{pmatrix}u_{i}\\
I_{i}
\end{pmatrix}\right]\\
 & =\frac{1}{1-\beta_{2}}\begin{pmatrix}\beta_{1}+u_{i}+\beta_{2}I_{i}\\
\beta_{1}+u_{i}+I_{i}
\end{pmatrix}.\end{aligned}$$ OLS
([\[eq:keynes\]](#eq:keynes){reference-type="ref"
reference="eq:keynes"}) 将不一致，因为在简化形式中，
$Y_{i}=\frac{1}{1-\beta_{2}}\left(\beta_{1}+u_{i}+I_{i}\right)$ 意味着
$\mathbb{E}\left[Y_{i}u_{i}\right]=\mathbb{E}\left[u_{i}^{2}\right]/\left(1-\beta_{2}\right)\neq0$.

总结
-------

尽管我们经常处理具有潜在内生变量的单方程模型，但基础的结构系统可能涉及多个方程。
联立方程模型是一种经典的计量经济学建模方法，它在结构经济研究中仍然得到积极应用。
当我们的经济模型是“结构性”时，我们需要牢记一个因果机制。在这里我们不会像在第2章中
那样通过对照组和治疗组来确定因果关系，而将会从经济结构的角度来看待因果关系。

**历史注释**: 工具最初出现在 Philip @wright1928tariff 中，
用于识别内生变量的系数。这被认为是与Philip的儿子Sewall Wright合作产生的想法。
供需分析归因于 @working1927statistical，而测量误差研究来源于 @fricsh1934statistical。

**进一步阅读**: 因果关系是计量经济学的圣杯。@pearl2018book 是一本颇具哲理的畅销书。
阅读它是一种享受。 [@chen2011nonlinear] 是对现代非线性测量误差模型的一个文献综述。
