# 预测基本公式

定义随机向量 $\mathbf{g}$ 的标准差对角阵为：
$$
\operatorname{Std}(\mathbf{g}) = \begin{pmatrix} \sigma_{g_1} & & \\ & \ddots & \\ & & \sigma_{g_K} \end{pmatrix}
$$
则对于 $\mathbf{g}$ 的协方差矩阵有分解：
$$
\operatorname{Var}(\mathbf{g}) = \operatorname{Std}(\mathbf{g})\cdot\operatorname{Corr}(\mathbf{g})\cdot\operatorname{Std}(\mathbf{g})
$$
其中，$\operatorname{Corr}(\mathbf{g})$ 为 $\mathbf{g}$ 的相关系数矩阵：
$$
\operatorname{Corr}(\mathbf{g}) = \operatorname{Std}^{-1}(\mathbf{g})\cdot\operatorname{Var}(\mathbf{g})\cdot\operatorname{Std}^{-1}(\mathbf{g})
$$

## 信息系数（Information Coefficient，IC）

**原始预测（Raw Forecast）**：对收益率有预测作用的信号。通常用 $K\times 1$ 向量表示，记为 $\mathbf{g}$。

预测信号的 **信息系数（Information Coefficient，IC）** 定义为信号和收益率的相关系数：
$$
\mathbf{IC} = \operatorname{Corr}(\mathbf{g},\mathbf{r})
$$

## 标准 z 分值

预测信号 **标准 z 分值（z-score）** 定义为：
$$
\mathbf{z}_g = \operatorname{Std}^{-1}(\mathbf{g})\cdot\left(\mathbf{g}-\mathbb{E}(\mathbf{g})\right)
$$
则 z 分值的期望为 $\mathbf{0}$，标准差对角阵为 $\mathbf{I}$，其协方差矩阵和相关系数矩阵均为原始变量的相关系数矩阵：
$$
\operatorname{Var}(\mathbf{z}_g) = \operatorname{Corr}(\mathbf{z}_g) = \operatorname{Corr}(\mathbf{g})
$$
信号 z 分值对收益率的信息系数等于原始信号的信息系数，即 $\mathbf{IC}_z = \mathbf{IC}_g$。

如果信号是线性无关的，即 $\operatorname{Var}(\mathbf{g})$ 是正定阵，则对信号的相关系数矩阵进行特征分解：
$$
\operatorname{Corr}(\mathbf{g}) = \mathbf{Q}\cdot\boldsymbol{\Lambda}\cdot\mathbf{Q}'
$$
其中，$\mathbf{Q}$ 是正交阵。对原始信号的 z 分值可以进行正交化，得到一组正交信号：
$$
\mathbf{z}^*_g = \boldsymbol{\Lambda}^{-\frac{1}{2}}\mathbf{Q}'\mathbf{z}_g
$$
正交信号 $\mathbf{z}^*_g$ 的期望为 $\mathbf{0}$，协方差矩阵、相关系数矩阵以及标准差对角阵均为单位阵 $\mathbf{I}$，这组正交信号对收益率的信息系数 IC 为：
$$
\mathbf{IC}_{\mathbf{z}^*_g} = \boldsymbol{\Lambda}^{-\frac{1}{2}}\mathbf{Q}'\mathbf{IC}
$$

## 精炼预测

**预测基本公式**：给定预测信号或原始预测 $\mathbf{g}$，对于收益率 $\mathbf{r}$ 调整后的预测量为：
$$
\begin{aligned}
\hat{\mathbf{r}} &= \mathbb{E}(\mathbf{r}) + \operatorname{Cov}(\mathbf{r},\mathbf{g})\cdot\operatorname{Var}^{-1}(\mathbf{g})\cdot\left(\mathbf{g}-\mathbb{E}(\mathbf{g})\right)\\
&= \mathbb{E}(\mathbf{r}) + \operatorname{Std}(\mathbf{r})\cdot\operatorname{Corr}(\mathbf{r},\mathbf{g})\cdot\operatorname{Corr}^{-1}(\mathbf{g})\cdot\mathbf{z}_g
\end{aligned}
$$
其中，$\mathbb{E}(\mathbf{r})$ 称为 **朴素预测（Naive Forecast）**，通常对于给定的基准组合 B，朴素预测为：$\mathbb{E}(\mathbf{r}) = \boldsymbol{\beta}\cdot\mu_B$。

对于收益率协方差矩阵 $\operatorname{Var}(\mathbf{r})$ 调整后的预测量为：
$$
\begin{aligned}
\widehat{\operatorname{Var}}(\mathbf{r}) &= \operatorname{Var}(\mathbf{r}) - \operatorname{Cov}(\mathbf{r},\mathbf{g})\cdot\operatorname{Var}^{-1}(\mathbf{g})\cdot\operatorname{Cov}(\mathbf{g},\mathbf{r})\\
&= \operatorname{Var}(\mathbf{r}) - \operatorname{Std}(\mathbf{r})\cdot\operatorname{Corr}(\mathbf{r},\mathbf{g})\cdot\operatorname{Corr}^{-1}(\mathbf{g})\cdot\operatorname{Corr}(\mathbf{g},\mathbf{r})\cdot\operatorname{Std}(\mathbf{r})
\end{aligned}
$$

定义 **精炼预测（Refined Forecast）** 为预测修正量：
$$
\Phi = \hat{\mathbf{r}} - \mathbb{E}(\mathbf{r}) = \operatorname{Std}(\mathbf{r})\cdot\operatorname{Corr}(\mathbf{r},\mathbf{g})\cdot\operatorname{Corr}^{-1}(\mathbf{g})\cdot\mathbf{z}_g
$$

如果记调整 IC 为 $\mathbf{IC}^* = \operatorname{Corr}^{-1}(\mathbf{g})\cdot\mathbf{IC}$，则上述的精炼预测可表示为：
$$
\Phi = \operatorname{Std}(\mathbf{r})\cdot\mathbf{IC}'\cdot\operatorname{Corr}^{-1}(\mathbf{g})\cdot\mathbf{z}_g = \operatorname{Std}(\mathbf{r})\cdot(\mathbf{IC}^*)'\cdot\mathbf{z}_g
$$

也可以将精练预测表达为正交化信号的形式：
$$
\Phi = \operatorname{Std}(\mathbf{r})\cdot\mathbf{IC}'_{\mathbf{z}^*_g}\cdot\mathbf{z}^*_g
$$

预测基本公式将精练预测表示为：波动率 * IC * 标准分值。

预测基本公式有如下性质：
* $\hat{\mathbf{r}}$ 是 $\mathbf{r}$ 的最优线性无偏估计（BLUE）。
* 如果 $\mathbf{r},\mathbf{g}$ 服从联合正态分布，则 $\hat{\mathbf{r}}$ 是已知 $\mathbf{g}$ 下的 $\mathbf{r}$ 的最大似然估计，并且为最小方差无偏估计（MVUE），更进一步有 $\hat{\mathbf{r}} = \mathbb{E}(\mathbf{r}|\mathbf{g})$，即 $\hat{\mathbf{r}}$ 是已知 $\mathbf{g}$ 下的 $\mathbf{r}$ 的条件期望。
* 如果 $\mathbf{r},\mathbf{g}$ 服从联合正态分布，则 $\widehat{\operatorname{Var}}(\mathbf{r}) = \operatorname{Var}(\mathbf{r}|\mathbf{g})$，即 $\widehat{\operatorname{Var}}(\mathbf{r})$ 是已知 $\mathbf{g}$ 下的 $\mathbf{r}$ 的条件方差。
* 精炼预测的协方差矩阵为：
$$
\operatorname{Var}(\Phi) = \operatorname{Std}(\mathbf{r})\cdot\operatorname{Corr}(\mathbf{r},\mathbf{g})\cdot\operatorname{Corr}^{-1}(\mathbf{g})\cdot\operatorname{Corr}(\mathbf{g},\mathbf{r})\cdot\operatorname{Std}(\mathbf{r})
$$
从而有：
$$
\widehat{\operatorname{Var}}(\mathbf{r}) = \operatorname{Var}(\mathbf{r}) - \operatorname{Var}(\Phi)
$$

## 单资产情形

记资产的波动率为 $\sigma$，此时预测基本公式为：
$$
\Phi = \sigma\cdot\mathbf{IC}'\cdot\operatorname{Corr}^{-1}(\mathbf{g})\cdot\mathbf{z}_g
$$
其中，$\mathbf{IC}$ 是 $K\times 1$ 的相关系数向量，$\mathbf{z}_g$ 也是 $K\times 1$ 为标准分值向量。

如果记修正 IC 为 $\mathbf{IC}^* = \operatorname{Corr}^{-1}(\mathbf{g})\cdot\mathbf{IC}$，则精练预测为：
$$
\Phi = \sigma\cdot(\mathbf{IC}^*)'\cdot\mathbf{z}_g = \sigma\cdot\sum\limits_{k=1}^{K}IC^*_k\cdot z_k
$$
即精炼预测等于以调整 IC 加权的原始预测标准分值的线性组合。

精练预测的标准差为：
$$
\sigma_\Phi = \sigma\cdot\sqrt{\mathbf{IC}'\cdot\operatorname{Corr}^{-1}(\mathbf{g})\cdot\mathbf{IC}}
$$

精练预测作为多个信号的组合信号对于收益率的信息系数 IC 为：
$$
IC_\Phi = \operatorname{Corr}(\Phi, r)= \sqrt{\mathbf{IC}'\cdot\operatorname{Corr}^{-1}(\mathbf{g})\cdot\mathbf{IC}}
$$

### 单信号

最简单的情形是考察一只资产并且只有一个预测信号的情形，此时预测基本公式为：
$$
\Phi = \sigma\cdot IC\cdot z_g
$$

### 双信号

对于一只资产两个预测信号 $g_1,g_2$ 的情形，记两个信号的相关系数为 $\rho = \operatorname{Corr}(g_1,g_2)$，预测基本公式为：
$$
\Phi = \sigma\cdot\begin{pmatrix} IC_{g_1} & IC_{g_2} \end{pmatrix} \cdot \begin{pmatrix} 1 & \rho \\ \rho & 1 \end{pmatrix}^{-1} \cdot \begin{pmatrix} z_{g_1} \\ z_{g_2} \end{pmatrix}
$$

一种方法是直接计算信号相关系数矩阵的逆为：
$$
\begin{pmatrix} 1 & \rho \\ \rho & 1 \end{pmatrix}^{-1} = \frac{1}{1-\rho^2}\cdot \begin{pmatrix} 1 & -\rho \\ -\rho & 1 \end{pmatrix}
$$
调整 IC 为：
$$
\begin{aligned}
\begin{pmatrix} IC^{*}_{g_1} \\ IC^{*}_{g_2} \end{pmatrix} &= \frac{1}{1-\rho^2}\cdot \begin{pmatrix} 1 & -\rho \\ -\rho & 1 \end{pmatrix}\cdot\begin{pmatrix} IC_{g_1} \\ IC_{g_2} \end{pmatrix}\\
&= \begin{pmatrix} \frac{IC_{g_1} - \rho\cdot IC_{g_2}}{1-\rho^2} \\ \frac{IC_{g_2} - \rho\cdot IC_{g_1}}{1-\rho^2} \end{pmatrix}
\end{aligned}
$$
从而预测基本公式为：
$$
\Phi = \sigma\cdot\begin{pmatrix} IC^{*}_{g_1} & IC^{*}_{g_2} \end{pmatrix}\cdot\begin{pmatrix} z_{g_1} \\ z_{g_2} \end{pmatrix} = \sigma\cdot IC^*_{g_1}\cdot z_{g_1} + \sigma\cdot IC^*_{g_2}\cdot z_{g_2}
$$
如果两个信号不相关，则调整 IC 等于原始 IC，精练预测等于两个信号各自的精练预测的和：
$$
\Phi = \sigma\cdot IC_{g_1}\cdot z_{g_1} + \sigma\cdot IC_{g_2}\cdot z_{g_2}
$$

另外一种方法是将原始信号正交化，得到新的不相关信号来构建精练预测，即对信号相关系数矩阵进行特征分解：
$$
\begin{pmatrix} 1 & \rho \\ \rho & 1 \end{pmatrix} = \begin{pmatrix} \frac{\sqrt{2}}{2} & \frac{\sqrt{2}}{2} \\ \frac{\sqrt{2}}{2} & -\frac{\sqrt{2}}{2} \end{pmatrix} \cdot \begin{pmatrix} 1+\rho & 0 \\ 0 & 1-\rho \end{pmatrix} \cdot \begin{pmatrix} \frac{\sqrt{2}}{2} & \frac{\sqrt{2}}{2} \\ \frac{\sqrt{2}}{2} & -\frac{\sqrt{2}}{2} \end{pmatrix}
$$
信号的标准分值变换为正交信号：
$$
\begin{aligned}
\begin{pmatrix} z^*_{g_1} \\ z^*_{g_2} \end{pmatrix} &= \begin{pmatrix} \frac{1}{\sqrt{1+\rho}} & 0 \\ 0 & \frac{1}{\sqrt{1-\rho}} \end{pmatrix} \cdot \begin{pmatrix} \frac{\sqrt{2}}{2} & \frac{\sqrt{2}}{2} \\ \frac{\sqrt{2}}{2} & -\frac{\sqrt{2}}{2} \end{pmatrix} \cdot \begin{pmatrix} z_{g_1} \\ z_{g_2} \end{pmatrix}\\
&= \begin{pmatrix} \frac{z_{g_1}+z_{g_2}}{\sqrt{2(1+\rho)}} \\ \frac{z_{g_1}-z_{g_2}}{\sqrt{2(1-\rho)}} \end{pmatrix}
\end{aligned}
$$
正交信号的 IC 为：
$$
\begin{aligned}
\begin{pmatrix} IC^{**}_{g_1} \\ IC^{**}_{g_2} \end{pmatrix} &= \begin{pmatrix} \frac{1}{\sqrt{1+\rho}} & 0 \\ 0 & \frac{1}{\sqrt{1-\rho}} \end{pmatrix} \cdot \begin{pmatrix} \frac{\sqrt{2}}{2} & \frac{\sqrt{2}}{2} \\ \frac{\sqrt{2}}{2} & -\frac{\sqrt{2}}{2} \end{pmatrix} \cdot \begin{pmatrix} IC_{g_1} \\ IC_{g_2} \end{pmatrix}\\
&= \begin{pmatrix} \frac{IC_{g_1}+IC_{g_2}}{\sqrt{2(1+\rho)}} \\ \frac{IC_{g_1}-IC_{g_2}}{\sqrt{2(1-\rho)}} \end{pmatrix}
\end{aligned}
$$
信号是正交的，从而精练预测等于两个信号各自的精练预测的和：
$$
\Phi = \sigma\cdot IC^{**}_{g_1}\cdot z^*_{g_1} + \sigma\cdot IC^{**}_{g_2}\cdot z^*_{g_2}
$$

精练预测作为两个信号的组合信号对于收益率的信息系数 IC 为：
$$
IC_\Phi = \sqrt{\frac{IC^2_{g_1} + IC^2_{g_2} - 2\rho\cdot IC_{g_1}\cdot IC_{g_2}}{1-\rho^2}}
$$
如果两个信号不相关，则组合信号和单个信号满足平方可加性：
$$
IC^2_\Phi = IC^2_{g_1} + IC^2_{g_2}
$$

## 多资产情形

一般的多资产多信号预测公式过于复杂，需要估计的参数非常多，在实践中难以直接使用，需要引入额外的假设或者结构来简化模型。

通常将信号划分为不同的信号源，记信号源的数量为 J，信号源 j 将产生信号 $\mathbf{g}_j=\left(g_{j,1},\ldots,g_{j,N}\right)'$，$g_{j,n}$ 表示信号源 j 对资产 n 产生的一个信号，所有信号源产生的信号为
$$
\mathbf{g} = \begin{pmatrix} \mathbf{g}_1 \\ \vdots \\ \mathbf{g}_J \end{pmatrix}
$$
信号总数为 $K = J \cdot N$。

### 单信号源

假设只有一个信号源，信号总数 $K=N$，设信号源对所有资产产生的信号的相关系数矩阵为 $\operatorname{Corr}(\mathbf{g})=\boldsymbol{\rho}$。

简化假设为：
1. 信号源对资产 n 产生的信号 $g_n$ 对资产 n 的信息系数关于所有资产都相等，记为 $IC$，即：
$$
\operatorname{Corr}(g_n, r_n) = IC
$$
2. 信号源对资产 m 产生的信号 $g_m$ 对资产 n 的预测能力仅与信号 $g_m$ 和 $g_n$ 的相关性有关，即：
$$
\operatorname{Corr}(g_m, r_n) = IC\cdot \rho_{m,n}
$$

上面两条假设赋予信号对资产的信息系数矩阵的结构为：
$$
\mathbf{IC}_g = \operatorname{Corr}(\mathbf{g},\mathbf{r}) = IC\cdot\boldsymbol{\rho}
$$

从而，预测基本公式变为：
$$
\Phi = \operatorname{Std}(\mathbf{r})\cdot IC \cdot \mathbf{z}_g
$$


### 双信号源

假设有两个信号源 1、2，$\mathbf{g}=\begin{pmatrix} \mathbf{g}'_1 & \mathbf{g}'_2 \end{pmatrix}'$，信号总数 $K=2N$。

简化假设为：
1. 信号源 1(2) 对资产 n 产生的信号 $g_{1,n}$（$g_{2,n}$）对资产 n 的信息系数关于所有资产都相等，记为 $IC_1$（$IC_2$），即：
$$
\operatorname{Corr}(g_{1,n}, r_n) = IC_1,\ \operatorname{Corr}(g_{2,n}, r_n) = IC_2
$$
2. 信号源 1 产生的信号的相关系数矩阵和信号源 2 的相等，即：
$$
\operatorname{Corr}(\mathbf{g}_1)=\operatorname{Corr}(\mathbf{g}_2)=\boldsymbol{\rho}
$$
3. 信号源 1(2) 对资产 m 产生的信号 $g_{1,m}$（$g_{2,m}$）对资产 n 的预测能力仅与信号 $g_{1,m}$（$g_{2,m}$ ）和 $g_{1,n}$（$g_{2,n}$）的相关性有关，即：
$$
\operatorname{Corr}(g_{1,m}, r_n) = IC_1\cdot \rho_{m,n},\ \operatorname{Corr}(g_{2,m}, r_n) = IC_2\cdot \rho_{m,n}
$$
4. 两个信号源的相关性用 $\rho_{1,2}$ 表示，其产生的信号之间的相关系数为：
$$
\operatorname{Corr}(\mathbf{g}_1,\mathbf{g}_2) = \rho_{1,2}\cdot\boldsymbol{\rho}
$$

上面的假设赋予信号相关系数矩阵的结构为：
$$
\operatorname{Corr}(\mathbf{g}) = \begin{pmatrix} \boldsymbol{\rho} & \rho_{1,2}\cdot\boldsymbol{\rho} \\ \rho_{1,2}\cdot\boldsymbol{\rho} & \boldsymbol{\rho} \end{pmatrix}
$$

赋予信号对资产的信息系数矩阵的结构为：
$$
\mathbf{IC}_g = \operatorname{Corr}(\mathbf{g},\mathbf{r}) = \begin{pmatrix} IC_1\cdot\boldsymbol{\rho} \\ IC_2\cdot\boldsymbol{\rho} \end{pmatrix}
$$

从而，预测基本公式变为：
$$
\Phi = \operatorname{Std}(\mathbf{r})\cdot IC \cdot \mathbf{z}_g
$$

### 横截面情形



# 多因子模型

考虑多个特征或者因子：$\mathbf{X} = (\mathbf{x}_1, \ldots, \mathbf{x}_K)$，其中，$\mathbf{x}_k$ 是一个特征向量，$\mathbf{X}$ 是 K 个特征组成的特征矩阵或因子暴露矩阵。

对于资产收益率建立多因子模型：
\begin{equation}\label{MultiFactorModel}
\mathbf{r} = \mathbf{X}\mathbf{b} + \mathbf{u}
\end{equation}
其中，$\mathbf{X}$ 是资产对于因子的暴露矩阵（$N\times K$ 维），$X_{n,k}$ 是资产 n 对因子 k 的暴露（Exposure）或者因子载荷（Factor Loading）；$\mathbf{b}$ 是因子收益率向量（$K\times 1$ 维），$b_k$ 是因子 k 的收益率，$\mathbf{u}$ 是资产的特异收益率（Specific Return）向量（$N\times 1$ 维），$u_n$ 资产 n 的特异收益率。

记资产的预期超额收益率为 $\mathbf{f}=\mathbb{E}\mathbf{r}$，则预期收益率模型主要是要对 $\mathbf{f}$ 建模。

**基本假设**
1. 假设特异收益率 $\mathbf{u}$ 与因子收益率 $\mathbf{b}$ 互不相关：$\operatorname{Cov}(u_n, b_k)=0$ 对任意 n 和 k 成立，即：
$$
\operatorname{Cov}(\mathbf{u}, \mathbf{b})=\mathbb{E}\left[(\mathbf{u}-\mathbb{E}\mathbf{u})(\mathbf{b}-\mathbb{E}\mathbf{b})'\right]=\mathbf{0}
$$
2. 因子暴露 $\mathbf{X}$ 于期初已知。
3. 最小方差组合的预期超额收益率大于 0，即 $f_C = \mathbf{f}'\mathbf{h}_C >0$，从而组合 Q 存在且 $f_Q>0$。

在上述假设 1 下，资产收益率的协方差矩阵 $\mathbf{V}$ 表示为：
$$
\mathbf{V} = \mathbf{X}\mathbf{F}\mathbf{X}'+\boldsymbol{\Delta}
$$
其中，$\mathbf{F}=\operatorname{Var}(\mathbf{b})$ 为因子收益的协方差矩阵，$\boldsymbol{\Delta}=\operatorname{Var}(\mathbf{u})$ 是资产特异收益率的协方差矩阵。

# 套利定价（APT）模型

APT 认为每个资产的预期超额收益率由资产的因子暴露决定。

因子模型解释了预期超额收益率 $\mathbf{f}$，如果预期超额收益率 $\mathbf{f}$ 可以表示为因子暴露 $\mathbf{X}$ 的线性组合，即存在 **因子预测** $\mathbf{m}$，使得：
$$
\mathbf{f} = \mathbf{X}\cdot\mathbf{m}
$$
APT 只给出了因子预测的存在性，但没有给出构造因子预测的方法。

记多因子模型为 $(\mathbf{X},\mathbf{F},\boldsymbol{\Delta})$，称组合 p 相对于因子模型 **充分分散**，如果组合 p 在所有与其具有相同因子暴露的组合中风险最低，即:
$$
\sigma_p\leq\sigma_r,\forall \mathbf{X}'\mathbf{h}_r=\mathbf{x}_q
$$

**套利定价理论**：因子模型 $(\mathbf{X},\mathbf{F},\boldsymbol{\Delta})$ 能够解释预期超额收益率 $\mathbf{f}$ 当且仅当组合 Q 相对于该模型充分分散。

**证明**：

(1) 首先假设组合 Q 相对于 $(\mathbf{X},\mathbf{F},\boldsymbol{\Delta})$ 充分分散，即 $\mathbf{h}_Q$ 是如下优化问题的一个解：
$$
\begin{aligned}
& \mathop{\min}_{\mathbf{h}}\mathbf{h}'\mathbf{V}\mathbf{h}\\
& \rm{s.t.}\ \mathbf{X}'\mathbf{h} = \mathbf{x}_Q
\end{aligned}
$$
Lagrange 函数：
$$
L(\mathbf{h},\boldsymbol{\lambda}) = \mathbf{h}\mathbf{V}\mathbf{h} + \boldsymbol{\lambda}'\left(\mathbf{X}'\mathbf{h}-\mathbf{x}_Q\right)
$$
则 $\mathbf{h}_Q$ 满足一阶条件
$$
\left\{\begin{aligned}
& \frac{\partial L}{\partial\mathbf{h}} = 2\mathbf{V}\mathbf{h}_Q + \mathbf{X}\boldsymbol{\lambda} = \mathbf{0}\\
& \frac{\partial L}{\partial\boldsymbol{\lambda}} = \mathbf{X}'\mathbf{h}_Q - \mathbf{x}_Q = \mathbf{0}
\end{aligned}\right.
$$
则：
$$
\mathbf{f} = f_Q\boldsymbol{\beta}^Q = f_Q\frac{\mathbf{V}\mathbf{h}_Q}{\sigma_Q^2} = \frac{f_Q}{\sigma_Q^2}\mathbf{X}\boldsymbol{\lambda}
$$
令 $\mathbf{m}=\frac{f_Q}{\sigma_Q^2}\boldsymbol{\lambda}$ 即得。

(2) 假设因子模型 $(\mathbf{X},\mathbf{F},\boldsymbol{\Delta})$ 能够解释预期超额收益率 $\mathbf{f}$，即 $\exists\mathbf{m},s.t.\ \mathbf{f}=\mathbf{X}\cdot\mathbf{m}$，对于任意组合 p，如果 $\mathbf{x}_p=\mathbf{x}_Q$，则：
$$
f_p = \mathbf{m}'\mathbf{X}'\mathbf{h}_p = \mathbf{m}'\mathbf{x}_p = \mathbf{m}'\mathbf{x}_Q = f_Q
$$
因为组合 Q 是最大夏普率组合，则：
$$
\frac{f_p}{\sigma_p}\leq\frac{f_Q}{\sigma_Q}
$$
由假设 3，$f_C>0$ 可得 $f_Q>0$，
从而 $\sigma_Q\leq\sigma_p$。

# 因子组合

定义 k 因子的 **因子组合（Factor Portfolio）** 或者 **因子模拟组合（Factor Mimicking Portfolio）** 为对 k 因子具有单位暴露，而对其他因子零暴露的最小风险投资组合：
$$
\begin{aligned}
\mathbf{h}_k = \ & \mathop{\arg\min}_{\mathbf{h}}\mathbf{h}'\mathbf{V}\mathbf{h}\\
& \rm{s.t.}\ \mathbf{X}'\mathbf{h}=\boldsymbol{\iota}_k
\end{aligned}
$$
由[等式约束条件下的二次规划](.\最优化.ipynb\#QuandprogWithEqConstraint)可解得：
$$
\mathbf{h}_k = \mathbf{V}^{-1}\mathbf{X}(\mathbf{X}'\mathbf{V}^{-1}\mathbf{X})^{-1}\boldsymbol{\iota}_k
$$
所有 K 个因子的因子组合表示为：
$$
\mathbf{W} = (\mathbf{h}_1,\ldots,\mathbf{h}_K) = \mathbf{V}^{-1}\mathbf{X}(\mathbf{X}'\mathbf{V}^{-1}\mathbf{X})^{-1}
$$
其中，$\mathbf{W}$ 的第 k 列即为 k 因子的因子组合。

**多因子模型下的因子组合**

考虑在多因子模型假设下的因子组合，其优化的目标函数可调整为：
$$
\mathbf{h}'\mathbf{V}\mathbf{h} = (\mathbf{X}'\mathbf{h})'\cdot\mathbf{F}\cdot(\mathbf{X}'\mathbf{h}) + \mathbf{h}'\boldsymbol{\Delta}\mathbf{h} = \boldsymbol{\iota}'_k\mathbf{F}\boldsymbol{\iota}_k + \mathbf{h}'\boldsymbol{\Delta}\mathbf{h} = F_{k,k} + \mathbf{h}'\boldsymbol{\Delta}\mathbf{h}
$$
原问题等价于最小化 $\mathbf{h}'\boldsymbol{\Delta}\mathbf{h}$。

解为：
$$
\mathbf{W} = \boldsymbol{\Delta}^{-1}\mathbf{X}(\mathbf{X}'\boldsymbol{\Delta}^{-1}\mathbf{X})^{-1}\boldsymbol{\iota}_k
$$

如果将 (\ref{MultiFactorModel}) 式看做横截面回归方程，则 $\mathbf{W}'$ 刚好是广义最小二乘(GLS)估计的投影矩阵：
$$
\hat{\mathbf{b}} = (\mathbf{X}'\boldsymbol{\Delta}^{-1}\mathbf{X})^{-1}\mathbf{X}'\boldsymbol{\Delta}^{-1}\mathbf{r} = \mathbf{W}'\mathbf{r}
$$
从而，因子收益率可以看做其对应的因子组合的收益率。

# References

1. Richard C. Grinold, Ronald N. Kahn, Active Portfolio Management-A Quantitative Approach for Providing Superior Returns and Controlling Risk, 2000.