
<a id='lqc'></a>
<div id="qe-notebook-header" align="right" style="text-align:right;">
        <a href="https://quantecon.org/" title="quantecon.org">
                <img style="width:250px;display:inline;" width="250px" src="https://assets.quantecon.org/img/qe-menubar-logo.svg" alt="QuantEcon">
        </a>
</div>

# LQ控制：基础


<a id='index-0'></a>

## 目录

- [LQ控制：基础](#LQ控制：基础)  
  - [概述](#概述)  
  - [引言](#引言)  
  - [最优性 – 有限时域](#最优性-–-有限时域)  
  - [实现](#实现)  
  - [扩展和评论](#扩展和评论)  
  - [进一步应用](#进一步应用)  
  - [练习](#练习)  

除了Anaconda中已有的库外，本讲座还需要以下库：

In [None]:
!pip install quantecon

## 概述

线性二次（LQ）控制指的是一类在几乎所有科学领域都有应用的动态优化问题。

本讲座介绍LQ控制及其经济应用。

我们将会看到，LQ系统具有简单的结构，使其成为处理各种经济问题的优秀工具。

此外，虽然线性二次结构具有局限性，但实际上它比最初看起来要灵活得多。

这些主题在下文中会反复出现。

从数学角度来看，LQ控制问题与[卡尔曼滤波](https://python.quantecon.org/kalman.html)密切相关

- 线性二次控制问题和卡尔曼滤波问题的递归表述都涉及矩阵**黎卡提方程**。  
- 线性控制和线性滤波问题的经典表述使用类似的矩阵分解（参见[这节课](https://python-advanced.quantecon.org/lu_tricks.html)和[这节课](https://python-advanced.quantecon.org/classical_filtering.html)）。  


在阅读以下内容时，了解这些内容会很有帮助：

- 矩阵运算  
- 随机变量向量  
- 动态规划和贝尔曼方程（参见[这节课](https://quantecon.github.io/lecture-intro.zh-cn/short_path.html)和[这节课](https://python.quantecon.org/optgrowth.html)）  


关于LQ控制的更多阅读材料，请参见：

- [[Ljungqvist and Sargent, 2018](https://python.quantecon.org/zreferences.html#id186)]，第5章  
- [[Hansen and Sargent, 2008](https://python.quantecon.org/zreferences.html#id170)]，第4章  
- [[Hernandez-Lerma and Lasserre, 1996](https://python.quantecon.org/zreferences.html#id172)]，3.5节  


为了专注于计算，我们将较长的证明留给这些参考资料（同时尽可能提供直观解释）。

让我们从一些导入开始：

In [None]:
import matplotlib.pyplot as plt
import matplotlib as mpl
FONTPATH = "fonts/SourceHanSerifSC-SemiBold.otf"
mpl.font_manager.fontManager.addfont(FONTPATH)
plt.rcParams['font.family'] = ['Source Han Serif SC']

plt.rcParams["figure.figsize"] = (11, 5)  #设置默认图形大小
import numpy as np
from quantecon import LQ

## 引言

LQ中的”线性”部分指的是状态的线性运动规律，而”二次”部分则指的是偏好。

让我们先从前者开始，然后讨论后者，最后将它们组合成一个优化问题。

### 运动规律

设$ x_t $是描述某个经济系统状态的向量。

假设$ x_t $遵循以下线性运动规律


<a id='equation-lq-lom'></a>
$$
x_{t+1} = A x_t + B u_t + C w_{t+1},
\qquad t = 0, 1, 2, \ldots \tag{57.1}
$$

这里

- $ u_t $是一个”控制”向量，包含了决策者面对当前状态$ x_t $时可用的选择  
- $ \{w_t\} $是一个不相关的零均值冲击过程，满足$ \mathbb E w_t w_t' = I $，其中右边是单位矩阵  


关于维度

- $ x_t $是$ n \times 1 $维，$ A $是$ n \times n $维  
- $ u_t $是$ k \times 1 $维，$ B $是$ n \times k $维  
- $ w_t $是$ j \times 1 $维，$ C $是$ n \times j $维  

#### 示例1

考虑一个家庭预算约束，表示为

$$
a_{t+1} + c_t = (1 + r) a_t + y_t
$$

这里$ a_t $是资产，$ r $是固定利率，$ c_t $是当前消费，$ y_t $是当前非金融收入。

如果我们假设$ \{ y_t \} $是序列不相关的且服从$ N(0, \sigma^2) $分布，那么，令$ \{ w_t \} $为标准正态分布，我们可以将系统写作

$$
a_{t+1} = (1 + r) a_t - c_t + \sigma w_{t+1}
$$

这显然是[(57.1)](#equation-lq-lom)的一个特例，其中资产是状态变量，消费是控制变量。


<a id='lq-hhp'></a>

#### 示例2

前一个模型的一个不现实的特征是非金融收入的均值为零且经常为负。

这个问题可以通过添加一个足够大的均值来轻松解决。

因此在这个例子中，我们令$ y_t = \sigma w_{t+1} + \mu $，其中$ \mu $是某个正实数。

另一个值得引入的改变（我们很快就会明白原因）是将控制变量从消费改为消费与某个”理想”数量$ \bar c $的偏差。

(大多数参数化情况下，$ \bar c $ 相对于每个时期可获得的消费量来说都很大，因此家庭希望增加消费。)

因此，我们现在将控制变量设为 $ u_t := c_t - \bar c $。

用这些变量表示，预算约束 $ a_{t+1} = (1 + r) a_t - c_t + y_t $ 变为


<a id='equation-lq-lomwc'></a>
$$
a_{t+1} = (1 + r) a_t - u_t - \bar c + \sigma w_{t+1} + \mu \tag{57.2}
$$

我们如何将这个新系统写成方程 [(57.1)](#equation-lq-lom) 的形式？

如果像前面的例子一样，我们把 $ a_t $ 作为状态变量，那么我们会遇到一个问题：
运动方程右侧包含一些常数项。

这意味着我们处理的是一个*仿射*函数，而不是线性函数
(回顾 [这个讨论](https://python.quantecon.org/linear_algebra.html#la-linear-map))。

幸运的是，我们可以通过添加一个额外的状态变量来轻松解决这个问题。

具体来说，如果我们写成


<a id='equation-lq-lowmc'></a>
$$
\left(
\begin{array}{c}
a_{t+1} \\
1
\end{array}

\right) =
\left(
\begin{array}{cc}
1 + r & -\bar c + \mu \\
0     & 1
\end{array}
\right)
\left(
\begin{array}{c}
a_t \\
1
\end{array}
\right) +
\left(
\begin{array}{c}
-1 \\
0
\end{array}
\right)
u_t +
\left(
\begin{array}{c}
\sigma \\
0
\end{array}
\right)
w_{t+1} \tag{57.3}
$$

第一行等价于[(57.2)](#equation-lq-lomwc)。

此外，该模型现在是线性的，可以通过设定以下参数写成[(57.1)](#equation-lq-lom)的形式


<a id='equation-lq-lowmc2'></a>
$$
x_t :=
\left(
\begin{array}{c}
a_t \\
1
\end{array}
\right),
\quad
A :=
\left(
\begin{array}{cc}
1 + r & -\bar c + \mu \\
0     & 1
\end{array}
\right),
\quad
B :=
\left(
\begin{array}{c}
-1 \\
0
\end{array}
\right),
\quad
C :=
\left(
\begin{array}{c}
\sigma \\
0
\end{array}
\right) \tag{57.4}
$$

实际上，我们通过增加另一个状态变量获得了线性特性。

### 偏好

在LQ模型中，目标是最小化损失流，其中时间t的损失由以下二次表达式给出


<a id='equation-lq-pref-flow'></a>
$$
x_t' R x_t + u_t' Q u_t \tag{57.5}
$$

- 假设 $ R $ 是 $ n \times n $ 的对称非负定矩阵。  
- 假设 $ Q $ 是 $ k \times k $ 的对称正定矩阵。  


>**Note**
>
>实际上，对于许多经济问题，可以放宽对 $ R $ 和 $ Q $ 的正定性条件。只需要 $ R $ 和 $ Q $ 的某些子矩阵是非负定的即可。详见 [[Hansen and Sargent, 2008](https://python.quantecon.org/zreferences.html#id170)]。

#### 示例1

一个满足这些假设的非常简单的例子是将 $ R $ 和 $ Q $ 取为单位矩阵，这样当前损失为

$$
x_t' I x_t + u_t' I u_t = \| x_t \|^2 + \| u_t \|^2
$$

因此，对于状态和控制而言，损失都被度量为与原点的平方距离。

（实际上，一般情况 [(57.5)](#equation-lq-pref-flow) 也可以用这种方式理解，但 $ R $ 和 $ Q $ 定义了其他 - 非欧几里得 - 与零向量的”距离”概念。）

直观上，我们通常可以将状态 $ x_t $ 理解为偏离目标的程度，例如

- 通货膨胀偏离某个目标水平的程度  
- 企业资本存量偏离某个理想数量的程度  


目标是使状态接近目标值，同时节约地使用控制变量。

#### 示例2

在[之前研究的家庭问题](#lq-hhp)中，设定$ R=0 $和$ Q=1 $得到的偏好为

$$
x_t' R x_t + u_t' Q u_t = u_t^2 = (c_t - \bar c)^2
$$

在这种设定下，家庭当前的损失是消费与理想水平$ \bar c $的平方差。

## 最优性 – 有限时域


<a id='index-1'></a>
让我们现在明确我们要考虑的优化问题，并看看如何解决它。

### 目标函数

我们将从有限时域情况开始，终止时间为$ T \in \mathbb N $。

在这种情况下，目标是选择一系列控制变量$ \{u_0, \ldots, u_{T-1}\} $来最小化目标函数


<a id='equation-lq-object'></a>
$$
\mathbb E \,
\left\{

\sum_{t=0}^{T-1} \beta^t (x_t' R x_t + u_t' Q u_t) + \beta^T x_T' R_f x_T
\right\} \tag{57.6}
$$

受制于运动方程[(57.1)](#equation-lq-lom)和初始状态$ x_0 $。

这里引入的新对象是$ \beta $和矩阵$ R_f $。

标量$ \beta $是折现因子，而$ x' R_f x $给出与状态$ x $相关的终端损失。

注释：

- 我们假设$ R_f $是$ n \times n $的、对称且非负定的矩阵。  
- 我们允许$ \beta = 1 $，因此包含了未折现的情况。  
- $ x_0 $本身可能是随机的，在这种情况下，我们要求它与冲击序列$ w_1, \ldots, w_T $相互独立。  



<a id='lq-cp'></a>

### 信息

到目前为止，我们还忽略了一个约束，即解决这个LQ问题的决策者只知道现在和过去，而不知道未来。

为了说明这一点，考虑控制序列$ \{u_0, \ldots, u_{T-1}\} $。

在选择这些控制时，决策者可以考虑冲击的影响

系统中的 $ \{w_1, \ldots, w_T\} $。

然而，通常假设（在此也将假设）时刻 $ t $ 的控制 $ u_t $ 只能基于过去和当前的冲击来做出。

用高深的[测度论](https://en.wikipedia.org/wiki/Measure_%28mathematics%29)术语来说，就是 $ u_t $ 必须对由 $ x_0, w_1, w_2, \ldots, w_t $ 生成的 $ \sigma $-代数可测。

这实际上等价于说 $ u_t $ 可以写成形式 $ u_t = g_t(x_0, w_1, w_2, \ldots, w_t) $，其中 $ g_t $ 是某个 Borel 可测函数。

（几乎所有在应用中有用的函数都是 Borel 可测的，所以从直观上理解，你可以把最后那句话理解为”对某个函数 $ g_t $”）

现在注意到 $ x_t $ 最终将取决于 $ x_0, w_1, w_2, \ldots, w_t $ 的实现值。

事实上，$ x_t $ 总结了决策者为了最优设置控制所需的所有历史冲击信息。

更准确地说，可以证明任何最优控制 $ u_t $ 都可以表示为仅与当前状态相关的函数。

因此，在接下来的内容中，我们将注意力限制在形如 $ u_t = g_t(x_t) $ 的控制策略（即函数）上。

实际上，前面的讨论适用于所有标准动态规划问题。

LQ情况的特殊之处在于——正如我们即将看到的——最优的 $ u_t $ 原来是 $ x_t $ 的线性函数。

### 解决方案

为了解决有限时域LQ问题，我们可以使用基于向后归纳的动态规划策略，这在概念上类似于[本讲座](https://quantecon.github.io/lecture-intro.zh-cn/short_path.html)中采用的方法。

由于很快就会明白的原因，我们首先引入符号 $ J_T(x) = x' R_f x $。

现在考虑决策者在倒数第二个时期的问题。

具体来说，假设时间为$ T-1 $，且状态为$ x_{T-1} $。

决策者必须权衡当前损失和（折现的）最终损失，因此需要求解

$$
\min_u \{
x_{T-1}' R x_{T-1} + u' Q u + \beta \,
\mathbb E J_T(A x_{T-1} + B u + C w_T)
\}
$$

在这个阶段，定义以下函数会比较方便


<a id='equation-lq-lsm'></a>
$$
J_{T-1} (x) =
\min_u \{
x' R x + u' Q u + \beta \,
\mathbb E J_T(A x + B u + C w_T)
\} \tag{57.7}
$$

函数$ J_{T-1} $被称为$ T-1 $时期的价值函数，而$ J_{T-1}(x) $可以被理解为从$ T-1 $时期状态$ x $开始，当决策者采取最优行为时的总”未来损失”。

现在让我们回到$ T-2 $时期。

对于$ T-2 $时期的决策者来说，$ J_{T-1}(x) $的作用类似于终端损失$ J_T(x) = x' R_f x $对$ T-1 $时期决策者的作用。

也就是说，$ J_{T-1}(x) $ 概括了转移到状态 $ x $ 所关联的未来损失。

决策者选择她的控制 $ u $ 来权衡当前损失和未来损失，其中

- 下一期的状态是 $ x_{T-1} = Ax_{T-2} + B u + C w_{T-1} $，因此取决于当前控制的选择。  
- 进入状态 $ x_{T-1} $ 的”成本”是 $ J_{T-1}(x_{T-1}) $。  


因此她的问题是

$$
\min_u
\{
x_{T-2}' R x_{T-2} + u' Q u + \beta \,
\mathbb E J_{T-1}(Ax_{T-2} + B u + C w_{T-1})
\}
$$

令

$$
J_{T-2} (x)
= \min_u
\{
x' R x + u' Q u + \beta \,
\mathbb E J_{T-1}(Ax + B u + C w_{T-1})
\}
$$

现在向后归纳的模式已经很清楚了。

具体来说，我们通过以下方式定义一系列价值函数 $ \{J_0, \ldots, J_T\} $

$$
J_{t-1} (x)
= \min_u
\{
x' R x + u' Q u + \beta \,
\mathbb E J_{t}(Ax + B u + C w_t)
\}
\quad \text{和} \quad
J_T(x) = x' R_f x
$$

第一个等式是动态规划理论中的贝尔曼方程，专门用于有限时域LQ问题。

现在我们有了$ \{J_0, \ldots, J_T\} $，我们可以获得最优控制。

作为第一步，让我们看看价值函数是什么样的。

事实证明，每个$ J_t $都具有形式$ J_t(x) = x' P_t x + d_t $，其中$ P_t $是一个$ n \times n $矩阵，而$ d_t $是一个常数。

我们可以通过归纳法证明这一点，从$ P_T := R_f $和$ d_T = 0 $开始。

使用这个符号，[(57.7)](#equation-lq-lsm)变为


<a id='equation-lq-fswb'></a>
$$
J_{T-1} (x) =
\min_u \{
x' R x + u' Q u + \beta \,
\mathbb E (A x + B u + C w_T)' P_T (A x + B u + C w_T)
\} \tag{57.8}
$$

为了得到最小值，我们可以对右边项关于$ u $求导，并令其等于零。

应用[矩阵微积分](https://python.quantecon.org/linear_algebra.html#la-mcalc)的相关规则，得到


<a id='equation-lq-oc0'></a>
$$
u  = - (Q + \beta B' P_T B)^{-1} \beta B' P_T A x \tag{57.9}
$$

将此代回[(57.8)](#equation-lq-fswb)并重新整理得到

$$
J_{T-1} (x) = x' P_{T-1} x + d_{T-1}
$$

其中


<a id='equation-lq-finr'></a>
$$
P_{T-1} = R - \beta^2 A' P_T B (Q + \beta B' P_T B)^{-1} B' P_T A +
\beta A' P_T A \tag{57.10}
$$

且


<a id='equation-lq-finrd'></a>
$$
d_{T-1} := \beta \mathop{\mathrm{trace}}(C' P_T C) \tag{57.11}
$$

(这个代数运算是一个很好的练习 — 我们把它留给你。)

如果我们继续按这种方式向后推导，很快就会清楚 $ J_t (x) = x' P_t x + d_t $ 如我们所说，其中 $ \{P_t\} $ 和 $ \{d_t\} $ 满足递归式


<a id='equation-lq-pr'></a>
$$
P_{t-1} = R - \beta^2 A' P_t B (Q + \beta B' P_t B)^{-1} B' P_t A +
\beta A' P_t A
\quad \text{其中} \quad
P_T = R_f \tag{57.12}
$$

和


<a id='equation-lq-dd'></a>
$$
d_{t-1} = \beta (d_t + \mathop{\mathrm{trace}}(C' P_t C))
\quad \text{其中} \quad
d_T = 0 \tag{57.13}
$$

回顾 [(57.9)](#equation-lq-oc0)，这些向后推导步骤的最小化结果为


<a id='equation-lq-oc'></a>
$$
u_t  = - F_t x_t
\quad \text{其中} \quad
F_t := (Q + \beta B' P_{t+1} B)^{-1} \beta B' P_{t+1} A \tag{57.14}
$$

这些是我们[上面讨论过的](#lq-cp)线性最优控制策略。

特别是，由[(57.14)](#equation-lq-oc)和[(57.1)](#equation-lq-lom)给出的控制序列解决了我们的有限时域LQ问题。

更准确地说，序列$ u_0, \ldots, u_{T-1} $由以下式子给出


<a id='equation-lq-xud'></a>
$$
u_t = - F_t x_t
\quad \text{with} \quad
x_{t+1} = (A - BF_t) x_t + C w_{t+1} \tag{57.15}
$$

对于$ t = 0, \ldots, T-1 $，在我们的约束条件下实现了[(57.6)](#equation-lq-object)的最小值。

## 实现

我们将使用[QuantEcon.py](http://quantecon.org/quantecon-py)中的[lqcontrol.py](https://github.com/QuantEcon/QuantEcon.py/blob/master/quantecon/lqcontrol.py)代码来求解有限和无限时域线性二次控制问题。

在该模块中，各种更新、模拟和不动点方法被封装在一个名为`LQ`的类中，包括

- 实例数据：  
  - 所需参数$ Q, R, A, B $和可选参数$ C, \beta, T, R_f, N $用于指定给定的LQ模型  
- 在无限视界情况下，将 $ T $ 和 $ R_f $ 设为 `None`  
- 在确定性情况下，将 `C = None`（或零）  
- 值函数和策略数据  
  - 有限视界情况下的 $ d_t, P_t, F_t $  
  - 无限视界情况下的 $ d, P, F $  
- 方法：  
  - `update_values` — 通过 [(57.12)](#equation-lq-pr)、[(57.13)](#equation-lq-dd) 和 [(57.14)](#equation-lq-oc) 将 $ d_t, P_t, F_t $ 更新为它们在 $ t-1 $ 时的值  
  - `stationary_values` — 计算无限视界情况下的 $ P, d, F $  
  - `compute_sequence` —- 给定 $ x_0 $ 并假设标准正态冲击，模拟 $ x_t, u_t, w_t $ 的动态  



<a id='lq-mfpa'></a>

### 一个应用

早期凯恩斯模型假设家庭从当前收入中的边际消费倾向是恒定的。

数据与边际消费倾向的恒定性相矛盾。

作为回应，米尔顿·弗里德曼、弗兰科·莫迪利亚尼等人基于消费者对跨期平滑消费流的偏好构建了模型。

(参见[[Friedman, 1956](https://python.quantecon.org/zreferences.html#id164)]或[[Modigliani and Brumberg, 1954](https://python.quantecon.org/zreferences.html#id199)]。)

这些模型的一个特点是家庭通过购买和出售金融资产使消费流比收入流更加平滑。

[上述](#lq-hhp)家庭储蓄问题体现了这些观点。

家庭的优化问题是选择一个消费序列以最小化


<a id='equation-lq-pio'></a>
$$
\mathbb E \,
\left\{
    \sum_{t=0}^{T-1} \beta^t (c_t - \bar c)^2 + \beta^T q a_T^2
\right\} \tag{57.16}
$$

受预算约束序列$ a_{t+1} = (1 + r) a_t - c_t + y_t, \ t \geq 0 $的限制。

这里$ q $是一个较大的正常数，其作用是促使消费者在生命末期将债务目标控制为零。

(没有这样的约束，最优选择就是在每个时期选择$ c_t = \bar c $，相应地让资产进行调整。)

和之前一样，我们设定 $ y_t = \sigma w_{t+1} + \mu $ 和 $ u_t := c_t - \bar c $，之后约束条件可以写成 [(57.2)](#equation-lq-lomwc) 的形式。

我们看到这个约束条件可以通过设定 $ x_t = (a_t \; 1)' $ 并使用 [(57.4)](#equation-lq-lowmc2) 中的定义，转化为 LQ 形式 $ x_{t+1} = Ax_t + Bu_t + Cw_{t+1} $。

为了与这个状态和控制相匹配，目标函数 [(57.16)](#equation-lq-pio) 可以通过选择以下参数写成 [(57.6)](#equation-lq-object) 的形式：

$$
Q := 1,
\quad
R :=
\left(
\begin{array}{cc}
0 & 0 \\
0 & 0
\end{array}
\right),
\quad \text{和} \quad
R_f :=
\left(
\begin{array}{cc}
q & 0 \\
0 & 0
\end{array}
\right)
$$

现在问题已经表达为 LQ 形式，我们可以通过应用 [(57.12)](#equation-lq-pr) 和 [(57.14)](#equation-lq-oc) 来求解。

在生成冲击序列 $ w_1, \ldots, w_T $ 之后，资产和消费的动态可以通过 [(57.15)](#equation-lq-xud) 来模拟。

下图是使用参数 $ r = 0.05, \beta = 1 / (1+ r) $ 计算得出的，

\bar c = 2，\mu = 1，\sigma = 0.25，T = 45$ 和 $q = 10^6\$。

冲击 $ \{w_t\} $ 被设定为独立同分布的标准正态分布。

In [None]:
# 模型参数
r = 0.05
β = 1/(1 + r)
T = 45
c_bar = 2
σ = 0.25
μ = 1
q = 1e6

# 构建为LQ问题
Q = 1
R = np.zeros((2, 2))
Rf = np.zeros((2, 2))
Rf[0, 0] = q
A = [[1 + r, -c_bar + μ],
    [0,              1]]
B = [[-1],
    [ 0]]
C = [[σ],
    [0]]

# 计算解并模拟
lq = LQ(Q, R, A, B, C, beta=β, T=T, Rf=Rf)
x0 = (0, 1)
xp, up, wp = lq.compute_sequence(x0)

# 转换回资产、消费和收入
assets = xp[0, :]           # a_t
c = up.flatten() + c_bar    # c_t
income = σ * wp[0, 1:] + μ  # y_t

# 绘制结果
n_rows = 2
fig, axes = plt.subplots(n_rows, 1, figsize=(12, 10))

plt.subplots_adjust(hspace=0.5)

bbox = (0., 1.02, 1., .102)
legend_args = {'bbox_to_anchor': bbox, 'loc': 3, 'mode': 'expand'}
p_args = {'lw': 2, 'alpha': 0.7}

axes[0].plot(list(range(1, T+1)), income, 'g-', label="非金融收入",
            **p_args)
axes[0].plot(list(range(T)), c, 'k-', label="消费", **p_args)

axes[1].plot(list(range(1, T+1)), np.cumsum(income - μ), 'r-',
            label="累计未预期收入", **p_args)
axes[1].plot(list(range(T+1)), assets, 'b-', label="资产", **p_args)
axes[1].plot(list(range(T)), np.zeros(T), 'k-')

for ax in axes:
    ax.grid()
    ax.set_xlabel('时间')
    ax.legend(ncol=2, **legend_args)

plt.show()

顶部面板显示了模拟中消费 $ c_t $ 和收入 $ y_t $ 的时间路径。

正如消费平滑讨论中所预期的那样，消费的时间路径比收入的时间路径要平滑得多。

（但请注意，在生命周期末期，消费变得更加不规则，这是因为零期末资产要求对消费选择的影响更大。）

图中的第二个面板显示，资产 $ a_t $ 的时间路径与累积未预期收入密切相关，后者定义为

$$
z_t := \sum_{j=0}^t \sigma w_t
$$

一个关键信息是，未预期的意外收益会被储蓄而不是消费，而未预期的负面冲击则通过减少资产来应对。

（同样，由于零期末资产要求，这种关系在生命周期末期也会被打破。）

这些结果对参数变化相对稳健。

例如，让我们把 $ \beta $ 从 $ 1 / (1 + r) \approx 0.952 $ 增加到 $ 0.96 $，同时保持其他参数不变。

这个消费者比之前的更有耐心，因此对后期消费值赋予相对更大的权重。

In [None]:
# 计算解并模拟
lq = LQ(Q, R, A, B, C, beta=0.96, T=T, Rf=Rf)
x0 = (0, 1)
xp, up, wp = lq.compute_sequence(x0)

# 转换回资产、消费和收入
assets = xp[0, :]           # a_t
c = up.flatten() + c_bar    # c_t
income = σ * wp[0, 1:] + μ  # y_t

# 绘制结果
n_rows = 2
fig, axes = plt.subplots(n_rows, 1, figsize=(12, 10))

plt.subplots_adjust(hspace=0.5)

bbox = (0., 1.02, 1., .102)
legend_args = {'bbox_to_anchor': bbox, 'loc': 3, 'mode': 'expand'}
p_args = {'lw': 2, 'alpha': 0.7}

axes[0].plot(list(range(1, T+1)), income, 'g-', label="非金融收入",
             **p_args)
axes[0].plot(list(range(T)), c, 'k-', label="消费", **p_args)

axes[1].plot(list(range(1, T+1)), np.cumsum(income - μ), 'r-',
             label="累计未预期收入", **p_args)
axes[1].plot(list(range(T+1)), assets, 'b-', label="资产", **p_args)
axes[1].plot(list(range(T)), np.zeros(T), 'k-')

for ax in axes:
    ax.grid()
    ax.set_xlabel('时间')
    ax.legend(ncol=2, **legend_args)

plt.show()

现在我们有一个缓慢上升的消费流，以及在中期出现驼峰形状的资产积累来为不断增长的消费提供资金。

然而，基本特征保持不变：相对于收入而言，消费是平滑的，且资产与累积的未预期收入呈强烈的正相关。

## 扩展和评论

让我们现在考虑上述LQ问题的一些标准扩展。

### 时变参数

在某些情况下，允许$ A, B, C, R $和$ Q $依赖于$ t $可能是可取的。

为了简单起见，我们在下面的实现中选择不处理这个扩展。

然而，这种一般性的损失并不像你最初想象的那么大。

事实上，我们可以通过适当选择状态变量来处理许多具有时变参数的模型。

一个说明在[下面](#lq-nsi)给出。

要了解更多示例和更系统的处理方法，请参见[[Hansen and Sargent, 2013](https://python.quantecon.org/zreferences.html#id169)]第2.4节。


<a id='lq-cpt'></a>

### 添加交叉乘积项

在某些LQ问题中，偏好包含一个交叉乘积项$ u_t' N x_t $，使得目标函数变为


<a id='equation-lq-object-cp'></a>
$$
\mathbb E \,
\left\{
    \sum_{t=0}^{T-1} \beta^t (x_t' R x_t + u_t' Q u_t + 2 u_t' N x_t) + \beta^T x_T' R_f x_T
\right\} \tag{57.17}
$$

我们的结果可以直接扩展到这种情况。

[(57.12)](#equation-lq-pr)中的序列$ \{P_t\} $变为


<a id='equation-lq-pr-cp'></a>
$$
P_{t-1} = R - (\beta B' P_t A + N)'
(Q + \beta B' P_t B)^{-1} (\beta B' P_t A + N) +
\beta A' P_t A
\quad \text{with } \quad
P_T = R_f \tag{57.18}
$$

[(57.14)](#equation-lq-oc)中的策略修改为


<a id='equation-lq-oc-cp'></a>
$$
u_t  = - F_t x_t
\quad \text{where} \quad
F_t := (Q + \beta B' P_{t+1} B)^{-1} (\beta B' P_{t+1} A + N) \tag{57.19}
$$

序列$ \{d_t\} $与[(57.13)](#equation-lq-dd)中保持不变。

我们让感兴趣的读者自行验证这些结果（计算过程虽然冗长但并不特别困难）。


<a id='lq-ih'></a>

### 无限期限


<a id='index-2'></a>
最后，我们考虑无限视界情况，带有[交叉项](#lq-cpt)，动态方程不变，目标函数为


<a id='equation-lq-object-ih'></a>
$$
\mathbb E \,
\left\{
    \sum_{t=0}^{\infty} \beta^t (x_t' R x_t + u_t' Q u_t + 2 u_t' N x_t)
\right\} \tag{57.20}
$$

在无限视界情况下，最优策略只有在时间本身是状态向量$ x_t $的一个分量时才会依赖于时间。

换句话说，存在一个固定矩阵$ F $，使得对所有$ t $都有$ u_t = -F x_t $。

决策规则随时间保持不变是直观的——毕竟，决策者在每个阶段都面临相同的无限视界，只是当前状态在变化。

不出所料，$ P $和$ d $也是常数。

稳态矩阵$ P $是[离散时间代数黎卡提方程](https://en.wikipedia.org/wiki/Algebraic_Riccati_equation)的解。


<a id='riccati-equation'></a>

<a id='equation-lq-pr-ih'></a>
$$
P = R - (\beta B' P A + N)'
(Q + \beta B' P B)^{-1} (\beta B' P A + N) +
\beta A' P A \tag{57.21}
$$

方程 [(57.21)](#equation-lq-pr-ih) 也被称为 *LQ 贝尔曼方程*，将给定的 $ P $ 映射到 [(57.21)](#equation-lq-pr-ih) 右侧的映射被称为 *LQ 贝尔曼算子*。

这个模型的平稳最优策略是


<a id='equation-lq-oc-ih'></a>
$$
u  = - F x
\quad \text{其中} \quad
F = (Q + \beta B' P B)^{-1} (\beta B' P A + N) \tag{57.22}
$$

[(57.13)](#equation-lq-dd) 中的序列 $ \{d_t\} $ 被常数值替代


<a id='equation-lq-dd-ih'></a>
$$
d
:= \mathop{\mathrm{trace}}(C' P C) \frac{\beta}{1 - \beta} \tag{57.23}
$$

状态按照时间齐次过程 $ x_{t+1} = (A - BF) x_t + C w_{t+1} $ 演化。

一个无限期问题的例子将在[下文](#lqc-mwac) 中讨论。


<a id='lq-cert-eq'></a>

### 确定性等价

上述类别的线性二次控制问题具有*确定性等价*的性质。

我们的意思是，最优策略 $ F $ 不受指定冲击过程的参数 $ C $ 的影响。

这一点可以通过检查 [(57.22)](#equation-lq-oc-ih) 或 [(57.19)](#equation-lq-oc-cp) 来确认。

因此，在求解最优行为时我们可以忽略不确定性，而在研究最优状态动态时再将其纳入考虑。

## 进一步应用


<a id='lq-nsi'></a>

### 应用1：与年龄相关的收入过程

[此前](#lq-mfpa) 我们研究了一个产生消费平滑的永久收入模型。

该模型一个不切实际的特点是假设随机收入过程的均值不依赖于消费者的年龄。

一个更现实的收入曲线是在职业生涯早期上升，在中期达到顶峰，可能在后期下降，并在退休期间下降更多。

在本节中，我们将使用年龄的多项式函数，将这种上升和下降模拟为一个对称的倒”U”形。

和之前一样，消费者试图最小化


<a id='equation-lq-pip'></a>
$$
\mathbb E \,
\left\{
    \sum_{t=0}^{T-1} \beta^t (c_t - \bar c)^2 + \beta^T q a_T^2
\right\} \tag{57.24}
$$

满足约束条件 $ a_{t+1} = (1 + r) a_t - c_t + y_t, \ t \geq 0 $。

对于收入，我们现在取 $ y_t = p(t) + \sigma w_{t+1} $，其中 $ p(t) := m_0 + m_1 t + m_2 t^2 $。

(在[下一节](#lq-nsi2)中，我们将使用一些技巧来实现一个更复杂的模型。)

系数 $ m_0, m_1, m_2 $ 的选择使得 $ p(0)=0, p(T/2) = \mu, $ 且 $ p(T)=0 $。

你可以确认规格 $ m_0 = 0, m_1 = T \mu / (T/2)^2, m_2 = - \mu / (T/2)^2 $ 满足这些约束。

要将其转化为LQ设定，考虑预算约束，它变为


<a id='equation-lq-hib'></a>
$$
a_{t+1} = (1 + r) a_t - u_t - \bar c + m_1 t + m_2 t^2 + \sigma w_{t+1} \tag{57.25}
$$

由于 $ a_{t+1} $ 是 $ (a_t, 1, t, t^2) $ 的线性函数，这提示我们将这四个变量作为状态向量 $ x_t $。

一旦选定了合适的状态和控制（回想 $ u_t = c_t - \bar c $）

完成这些设置后，其余规格就相对容易确定了。

因此，对于动态系统，我们设定


<a id='equation-lq-lowmc3'></a>
$$
x_t :=
\left(
\begin{array}{c}
a_t \\
1 \\
t \\
t^2
\end{array}
\right),
\quad
A :=
\left(
\begin{array}{cccc}
1 + r & -\bar c & m_1 & m_2 \\
0     & 1       & 0   & 0   \\
0     & 1       & 1   & 0   \\
0     & 1       & 2   & 1
\end{array}
\right),
\quad
B :=
\left(
\begin{array}{c}
-1 \\
0 \\
0 \\
0
\end{array}
\right),
\quad
C :=
\left(
\begin{array}{c}
\sigma \\
0 \\
0 \\
0
\end{array}
\right) \tag{57.26}
$$

如果你使用这个规格展开表达式 $ x_{t+1} = A x_t + B u_t + C w_{t+1} $，你会发现资产按照期望的方式遵循[(57.25)](#equation-lq-hib)，且其他状态变量也会适当更新。

为了实现偏好规格[(57.24)](#equation-lq-pip)，我们取


<a id='equation-lq-4sp'></a>
$$
Q := 1,
\quad
R :=
\left(
\begin{array}{cccc}
0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0
\end{array}
\right)

\quad \text{和} \quad
R_f :=
\left(
\begin{array}{cccc}
q & 0 & 0 & 0 \\
0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0
\end{array}
\right) \tag{57.27}
$$

下图显示了使用`lqcontrol.py`中的`compute_sequence`方法计算的消费和资产的模拟结果，初始资产设为零。


<a id='solution-lqc-ex1-fig'></a>
![https://python.quantecon.org/_static/lecture_specific/lqcontrol/solution_lqc_ex1.png](https://python.quantecon.org/_static/lecture_specific/lqcontrol/solution_lqc_ex1.png)

  
再次可以看到，平滑消费是样本路径的一个主要特征。

资产路径展现出与标准生命周期理论相一致的动态特征。

Exercise 57.1给出了此处使用的完整参数集，并要求你复现该图。


<a id='lq-nsi2'></a>

### 应用2：包含退休的永久收入模型

在[前一个应用](#lq-nsi)中，我们使用多项式生成了一个倒U形的收入动态，并将其置于LQ框架中。

可以说，这个收入过程仍然包含一些不切实际的特征。

更常见的收入模式是

1. 收入在工作生涯中增长，围绕着上升趋势波动，在晚年增长趋势趋于平缓  
1. 退休后，收入较低但相对稳定（非金融收入）  


令$ K $为退休日期，我们可以用以下方式表达这些收入动态


<a id='equation-lq-cases'></a>
$$
y_t =
\begin{cases}
p(t) + \sigma w_{t+1} & \quad \text{if } t \leq K  \\
s                     & \quad \text{otherwise }
\end{cases} \tag{57.28}
$$

这里

- $ p(t) := m_1 t + m_2 t^2 $，其中系数$ m_1, m_2 $的选择使得$ p(K) = \mu $且$ p(0) = p(2K)=0 $  
- $ s $是退休收入  


我们假设偏好保持不变，由[(57.16)](#equation-lq-pio)给出。

预算约束也保持不变，由$ a_{t+1} = (1 + r) a_t - c_t + y_t $给出。

我们的目标是解决这个问题，并使用本讲中描述的LQ技术模拟路径。

事实上，这是一个不简单的问题，因为在 $ K $ 处动态方程[(57.28)](#equation-lq-cases)的拐点使得很难将运动规律表示为固定系数的线性系统。

然而，我们仍然可以通过适当地连接两个组成部分的LQ问题来使用我们的LQ方法。

这两个LQ问题分别描述了消费者在工作期间(`lq_working`)和退休期间(`lq_retired`)的行为。

(这是可行的，因为在生命的这两个不同阶段，各自的收入过程[多项式趋势和常数]都符合LQ框架。)

基本思路是，尽管整个问题不是单一的时不变LQ问题，但它仍然是一个动态规划问题，因此我们可以在每个阶段使用适当的贝尔曼方程。

基于这个逻辑，我们可以：

1. 通过常规的向后归纳程序求解`lq_retired`，从退休结束时向退休开始时迭代。  
1. 将通过此过程生成的退休初始值函数作为终端条件 $ R_f $，输入到 `lq_working` 规范中。  
1. 从这个选定的 $ R_f $ 开始，通过向后归纳法求解 `lq_working`，一直迭代回工作生涯开始时。  


这个过程给出了整个生命周期的值函数序列和最优策略。

下图显示了基于这个程序的一个模拟结果。


<a id='solution-lqc-ex2-fig'></a>
![https://python.quantecon.org/_static/lecture_specific/lqcontrol/solution_lqc_ex2.png](https://python.quantecon.org/_static/lecture_specific/lqcontrol/solution_lqc_ex2.png)

  
模拟中使用的完整参数集在Exercise 57.2中讨论，那里要求你重现这个图形。

再次强调，在模拟中可以观察到的主要特征是消费平滑。

资产路径与标准生命周期理论相符，表现为生命早期的负储蓄，随后转为储蓄。

资产在退休时达到峰值，之后逐渐下降。


<a id='lqc-mwac'></a>

### 应用3：具有调整成本的垄断

考虑一个面临随机逆需求函数的垄断者

$$
p_t = a_0 - a_1 q_t + d_t
$$

这里$ q_t $是产量，需求冲击$ d_t $遵循

$$
d_{t+1} = \rho d_t + \sigma w_{t+1}
$$

其中$ \{w_t\} $是独立同分布的标准正态分布。

垄断者最大化当前和未来利润的期望贴现和


<a id='equation-lq-object-mp'></a>
$$
\mathbb E \,
\left\{
    \sum_{t=0}^{\infty} \beta^t
    \pi_t
\right\}
\quad \text{where} \quad
\pi_t := p_t q_t - c q_t - \gamma (q_{t+1} - q_t)^2 \tag{57.29}
$$

这里

- $ \gamma (q_{t+1} - q_t)^2 $表示调整成本  
- $ c $是平均生产成本  


这可以被表述为一个LQ问题，然后求解和模拟，
但首先让我们研究这个问题并试图获得一些直观认识。

思考这个问题的一种方式是考虑如果$ \gamma = 0 $会发生什么。

没有调整成本就没有跨期权衡，所以
垄断者将在每个时期选择产量以最大化当期利润。

不难证明利润最大化的产出为

$$
\bar q_t := \frac{a_0 - c + d_t}{2 a_1}
$$

根据这个讨论，对于一般的$ \gamma $值，我们可以预期：

- 如果$ \gamma $接近零，那么$ q_t $会相对紧密地跟踪$ \bar q_t $的时间路径。  
- 如果$ \gamma $较大，那么$ q_t $会比$ \bar q_t $更平滑，因为垄断者试图避免调整成本。  


这种直觉是正确的。

以下图表显示了通过求解相应的LQ问题所产生的模拟结果。

这些图表之间的参数唯一区别是$ \gamma $的大小

![https://python.quantecon.org/_static/lecture_specific/lqcontrol/solution_lqc_ex3_g1.png](https://python.quantecon.org/_static/lecture_specific/lqcontrol/solution_lqc_ex3_g1.png)

  
![https://python.quantecon.org/_static/lecture_specific/lqcontrol/solution_lqc_ex3_g10.png](https://python.quantecon.org/_static/lecture_specific/lqcontrol/solution_lqc_ex3_g10.png)

  
![https://python.quantecon.org/_static/lecture_specific/lqcontrol/solution_lqc_ex3_g50.png](https://python.quantecon.org/_static/lecture_specific/lqcontrol/solution_lqc_ex3_g50.png)

  
为了生成这些图表，我们将垄断者问题转换为LQ问题。

这种转换的关键在于选择正确的状态 — 这有点像一门艺术。

这里我们取$ x_t = (\bar q_t \;\, q_t \;\, 1)' $，而控制变量选择为$ u_t = q_{t+1} - q_t $。

我们还对利润函数做了轻微调整。

在[(57.29)](#equation-lq-object-mp)中，当期利润为$ \pi_t := p_t q_t - c q_t - \gamma (q_{t+1} - q_t)^2 $。

现在让我们在[(57.29)](#equation-lq-object-mp)中用$ \hat \pi_t := \pi_t - a_1 \bar q_t^2 $替换$ \pi_t $。

这对解决方案没有影响，因为$ a_1 \bar q_t^2 $不依赖于控制变量。

（实际上，我们只是在[(57.29)](#equation-lq-object-mp)中添加了一个常数项，而优化器不受常数项影响。）

进行这种替换的原因是，正如你将能够验证的那样，$ \hat \pi_t $可以简化为简单的二次形式

$$
\hat \pi_t = -a_1 (q_t - \bar q_t)^2 - \gamma u_t^2
$$

在转换为最小化问题后（通过取负），目标函数变为


<a id='equation-lq-object-mp2'></a>
$$
\min
\mathbb E \,

\sum_{t=0}^{\infty} \beta^t
\left\{
    a_1 ( q_t - \bar q_t)^2 + \gamma u_t^2
\right\} \tag{57.30}
$$

现在找到 $ R $ 和 $ Q $ 使得[(57.30)](#equation-lq-object-mp2)可以写成[(57.20)](#equation-lq-object-ih)的形式相对简单。

此外，通过写出状态每个元素的动态方程，可以找到[(57.1)](#equation-lq-lom)中的矩阵 $ A, B $ 和 $ C $。

Exercise 57.3要求你完成这个过程，并重现前面的图表。

## 练习

## Exercise 57.1

复现上面[所示](#solution-lqc-ex1-fig)的多项式收入图。

参数为 $ r = 0.05, \beta = 1 / (1 + r), \bar c = 1.5,  \mu = 2, \sigma = 0.15, T = 50 $ 和 $ q = 10^4 $。

## Solution to[ Exercise 57.1](https://python.quantecon.org/#lqc_ex1)

这是一个解决方案。

我们使用一些高级绘图命令来获得特定的样式 — 你可以使用更简单的命令。

这个模型是一个具有驼峰形收入的LQ永久收入/生命周期模型

$$
y_t = m_1 t + m_2 t^2 + \sigma w_{t+1}
$$

其中 $ \{w_t\} $ 是独立同分布的 $ N(0, 1) $ 随机变量，系数 $ m_1 $ 和 $ m_2 $ 的选择使得 $ p(t) = m_1 t + m_2 t^2 $ 呈现倒 U 形，且满足：

- $ p(0) = 0, p(T/2) = \mu $，以及  
- $ p(T) = 0 $  

In [None]:
# 模型参数
r = 0.05
β = 1/(1 + r)
T = 50
c_bar = 1.5
σ = 0.15
μ = 2
q = 1e4
m1 = T * (μ/(T/2)**2)
m2 = -(μ/(T/2)**2)

# 构建为 LQ 问题
Q = 1
R = np.zeros((4, 4))
Rf = np.zeros((4, 4))
Rf[0, 0] = q
A = [[1 + r, -c_bar, m1, m2],
     [0,          1,  0,  0],
     [0,          1,  1,  0],
     [0,          1,  2,  1]]
B = [[-1],
     [ 0],
     [ 0],
     [ 0]]
C = [[σ],
     [0],
     [0],
     [0]]

# 计算解并模拟
lq = LQ(Q, R, A, B, C, beta=β, T=T, Rf=Rf)
x0 = (0, 1, 0, 0)
xp, up, wp = lq.compute_sequence(x0)

# 将结果转换回资产、消费和收入
ap = xp[0, :]               # 资产
c = up.flatten() + c_bar    # 消费
time = np.arange(1, T+1)
income = σ * wp[0, 1:] + m1 * time + m2 * time**2  # 收入


# 绘制结果
n_rows = 2
fig, axes = plt.subplots(n_rows, 1, figsize=(12, 10))

plt.subplots_adjust(hspace=0.5)

bbox = (0., 1.02, 1., .102)
legend_args = {'bbox_to_anchor': bbox, 'loc': 3, 'mode': 'expand'}
p_args = {'lw': 2, 'alpha': 0.7}

axes[0].plot(range(1, T+1), income, 'g-', label="非金融收入",
            **p_args)
axes[0].plot(range(T), c, 'k-', label="消费", **p_args)

axes[1].plot(range(T+1), ap.flatten(), 'b-', label="资产", **p_args)
axes[1].plot(range(T+1), np.zeros(T+1), 'k-')

for ax in axes:
    ax.grid()
    ax.set_xlabel('时间')
    ax.legend(ncol=2, **legend_args)

plt.show()

## Exercise 57.2

复现上面[所示的工作和退休图表](#solution-lqc-ex2-fig)。

参数为 $ r = 0.05, \beta = 1 / (1 + r), \bar c = 4,  \mu = 4, \sigma = 0.35, K = 40, T = 60, s = 1 $ 和 $ q = 10^4 $。

要理解整体过程,请仔细阅读包含该图表的章节。

首先,为了使我们的方法有效,我们必须确保两个LQ问题具有相同的状态变量和控制变量。

与之前的应用一样,控制变量可以设置为 $ u_t = c_t - \bar c $。

对于`lq_working`, $ x_t, A, B, C $ 可以按照[(57.26)](#equation-lq-lowmc3)中的方式选择。

- 请记住,选择 $ m_1, m_2 $ 使得 $ p(K) = \mu $ 且 $ p(2K)=0 $。  


对于`lq_retired`,使用相同的 $ x_t $ 和 $ u_t $ 定义,但修改 $ A, B, C $ 以对应固定收入 $ y_t = s $。

对于`lq_retired`,按照[(57.27)](#equation-lq-4sp)设置偏好。

对于`lq_working`,偏好相同,除了 $ R_f $ 应该

被退休时期通过迭代`lq_retired`得到的最终值函数所替代。

通过仔细处理,可以将这两个独立模型的模拟结果拼接在一起生成完整的模拟。

## Solution to[ Exercise 57.2](https://python.quantecon.org/#lqc_ex2)

这是一个永久收入/生命周期模型,工作期间收入呈多项式增长,退休后收入固定。

该模型通过组合两个LQ规划问题来求解,正如讲座中所述。

In [None]:
# 模型参数
r = 0.05
β = 1/(1 + r)
T = 60
K = 40
c_bar = 4
σ = 0.35
μ = 4
q = 1e4
s = 1
m1 = 2 * μ/K
m2 = -μ/K**2

# 构建LQ问题1(退休期)
Q = 1
R = np.zeros((4, 4))
Rf = np.zeros((4, 4))
Rf[0, 0] = q
A = [[1 + r, s - c_bar, 0, 0],
     [0,             1, 0, 0],
     [0,             1, 1, 0],
     [0,             1, 2, 1]]
B = [[-1],
     [ 0],
     [ 0],
     [ 0]]
C = [[0],
     [0],
     [0],
     [0]]

# 为退休人员初始化LQ实例
lq_retired = LQ(Q, R, A, B, C, beta=β, T=T-K, Rf=Rf)
# 迭代回退休开始时,记录最终值函数
for i in range(T-K):
    lq_retired.update_values()
Rf2 = lq_retired.P

# 构建LQ问题2(工作期)
R = np.zeros((4, 4))
A = [[1 + r, -c_bar, m1, m2],
     [0,          1,  0,  0],
     [0,          1,  1,  0],
     [0,          1,  2,  1]]
B = [[-1],
     [ 0],
     [ 0],
     [ 0]]
C = [[σ],
     [0],
     [0],
     [0]]

# 使用lq_retired的终值Rf设置工作期LQ实例
lq_working = LQ(Q, R, A, B, C, beta=β, T=K, Rf=Rf2)

# 模拟工作期状态/控制路径
x0 = (0, 1, 0, 0)
xp_w, up_w, wp_w = lq_working.compute_sequence(x0)
# 模拟退休期路径(注意初始条件)
xp_r, up_r, wp_r = lq_retired.compute_sequence(xp_w[:, K])

# 将结果转换回资产、消费和收入
xp = np.column_stack((xp_w, xp_r[:, 1:]))
assets = xp[0, :]                  # 资产

up = np.column_stack((up_w, up_r))
c = up.flatten() + c_bar           # 消费

time = np.arange(1, K+1)
income_w = σ * wp_w[0, 1:K+1] + m1 * time + m2 * time**2  # 收入
income_r = np.full(T-K, s)
income = np.concatenate((income_w, income_r))

# 绘制结果
n_rows = 2
fig, axes = plt.subplots(n_rows, 1, figsize=(12, 10))

plt.subplots_adjust(hspace=0.5)

bbox = (0., 1.02, 1., .102)
legend_args = {'bbox_to_anchor': bbox, 'loc': 3, 'mode': 'expand'}
p_args = {'lw': 2, 'alpha': 0.7}

axes[0].plot(range(1, T+1), income, 'g-', label="非金融收入",
            **p_args)
axes[0].plot(range(T), c, 'k-', label="消费", **p_args)

axes[1].plot(range(T+1), assets, 'b-', label="资产", **p_args)
axes[1].plot(range(T+1), np.zeros(T+1), 'k-')

for ax in axes:
    ax.grid()
    ax.set_xlabel('时间')
    ax.legend(ncol=2, **legend_args)

plt.show()

## Exercise 57.3

复现上述垄断者应用中的图形 [given above](#lqc-mwac)。

参数设置为 $ a_0 = 5, a_1 = 0.5, \sigma = 0.15, \rho = 0.9,
\beta = 0.95 $ 和 $ c = 2 $，而 $ \gamma $ 在1到50之间变化
(参见图形)。

## Solution to[ Exercise 57.3](https://python.quantecon.org/#lqc_ex3)

第一个任务是找到定义LQ问题的矩阵 $ A, B, C, Q, R $。

回顾一下 $ x_t = (\bar q_t \;\, q_t \;\, 1)' $，而
$ u_t = q_{t+1} - q_t $。

令 $ m_0 := (a_0 - c) / 2a_1 $ 且 $ m_1 := 1 / 2 a_1 $，我们
可以写成 $ \bar q_t = m_0 + m_1 d_t $，然后经过一些
推导

$$
\bar q_{t+1} = m_0 (1 - \rho) + \rho \bar q_t + m_1 \sigma w_{t+1}
$$

根据我们对 $ u_t $ 的定义，$ q_t $ 的动态方程为
$ q_{t+1} = q_t + u_t $。

使用这些事实，你应该能够构建正确的
$ A, B, C $ 矩阵（然后与下面解决方案代码中的矩阵进行对照）。

通过检查目标函数可以找到合适的 $ R, Q $ 矩阵，为方便起见，我们在此重复该目标函数：

$$
\min
\mathbb E \,
\left\{
    \sum_{t=0}^{\infty} \beta^t
    a_1 ( q_t - \bar q_t)^2 + \gamma u_t^2
\right\}
$$

我们的解决方案代码如下：

In [None]:
# 模型参数
a0 = 5
a1 = 0.5
σ = 0.15
ρ = 0.9
γ = 1
β = 0.95
c = 2
T = 120

# 有用的常数
m0 = (a0-c)/(2 * a1)
m1 = 1/(2 * a1)

# 构建LQ问题
Q = γ
R = [[ a1, -a1,  0],
     [-a1,  a1,  0],
     [  0,   0,  0]]
A = [[ρ, 0, m0 * (1 - ρ)],
     [0, 1,            0],
     [0, 0,            1]]

B = [[0],
     [1],
     [0]]
C = [[m1 * σ],
     [     0],
     [     0]]

lq = LQ(Q, R, A, B, C=C, beta=β)

# 模拟状态/控制路径
x0 = (m0, 2, 1)
xp, up, wp = lq.compute_sequence(x0, ts_length=150)
q_bar = xp[0, :]
q = xp[1, :]

# 绘制模拟结果
fig, ax = plt.subplots(figsize=(10, 6.5))

# 一些复杂的绘图设置 -- 如果你愿意可以简化
bbox = (0., 1.01, 1., .101)
legend_args = {'bbox_to_anchor': bbox, 'loc': 3, 'mode': 'expand'}
p_args = {'lw': 2, 'alpha': 0.6}

time = range(len(q))
ax.set(xlabel='时间', xlim=(0, max(time)))
ax.plot(time, q_bar, 'k-', lw=2, alpha=0.6, label=r'$\bar q_t$')
ax.plot(time, q, 'b-', lw=2, alpha=0.6, label='$q_t$')
ax.legend(ncol=2, **legend_args)
s = f'动态过程，其中 $\gamma = {γ}$'
ax.text(max(time) * 0.6, 1 * q_bar.max(), s, fontsize=14)
plt.show()