# 使用Yelu-Walker方法计算AR(p)
计算一个均值为0的离散随机时间序列$\{X_i\} ^ N$的AR(p)参数，怎么做？
我们要估计的也就是下面公式中的$\xi_{i+1}$

$$
x_{i+1}=\phi_{1} x_{i}+\phi_{2} x_{i-1}+\cdots+\phi_{p} x_{i-p+1}+\xi_{i+1} \tag 1
$$

# 1.转置

## 1.1 p=1

p=1的时候，公式变成这样$$X_{i+1} = \phi_1 x_i  + \epsilon_{i+1}$$
上面的形式可以进一步写成这样：
$$
\underbrace{\left(\begin{array}{c}
x_{2} \\
x_{3} \\
\vdots \\
x_{N}
\end{array}\right)}_{\mathbf{b}}=\underbrace{\left(\begin{array}{c}
x_{1} \\
x_{2} \\
\vdots \\
x_{N-1}
\end{array}\right)}_{\mathbf{A}} \phi_{1}
$$

可以使用最小二乘法求解：
$$
\hat{\phi}_{1}=\left(\mathbf{A}^{T} \mathbf{A}\right)^{-1} \mathbf{A}^{T} \mathbf{b}=\frac{\sum_{i=1}^{N-1} x_{i} x_{i+1}}{\sum_{i=1}^{N-1} x_{i}^{2}}=\frac{c_{1}}{c_{o}}=r_{1}
$$
上面的$c_{i}$、$r_{i}$分别是第i个自协方差和自协方差系数。

## 1.2 p=2
p=2的时候，公式变成这样$$X_{i+1} = \phi_1 x_i  +\phi_2 x_{i-1}  + \epsilon_{i+1}$$
上面的形式进一步写成这样：

$$
\underbrace{\left(\begin{array}{c}
x_{3} \\
x_{4} \\
\vdots \\
x_{N}
\end{array}\right)}_{\mathbf{b}}=\underbrace{\left(\begin{array}{cc}
x_{2} & x_{1} \\
x_{3} & x_{2} \\
\vdots & \vdots \\
x_{N-1} & x_{N-2}
\end{array}\right)}_{\mathbf{A}} \underbrace{\left(\begin{array}{c}
\phi_{1} \\
\phi_{2}
\end{array}\right)}_{\Phi} .
$$

和第一个不一样，这个时候上面的等式写成这样：
$$
\hat{\boldsymbol{\Phi}}=\left(\mathbf{A}^{T} \mathbf{A}\right)^{-1} \mathbf{A}^{T} \mathbf{b}
$$
是这么计算的：
$$
\begin{gathered}
\left(\mathbf{A}^{T} \mathbf{A}\right)^{-1}=\left[\left(\begin{array}{llll}
x_{2} & x_{3} & \cdots & x_{N-1} \\
x_{1} & x_{2} & \cdots & x_{N-2}
\end{array}\right)\left(\begin{array}{cc}
x_{2} & x_{1} \\
x_{3} & x_{2} \\
x_{N-1} & x_{N-2}
\end{array}\right)\right]^{-1} \\
=\left(\begin{array}{cc}
\sum_{i=2}^{N-1} x_{i}^{2} & \sum_{i=2}^{N-1} x_{i} x_{i-1} \\
\sum_{i=2}^{N-1} x_{i} x_{i-1} & \sum_{i=1}^{N-2} x_{i}^{2}
\end{array}\right)^{-1} \\
=\frac{1}{\sum_{i=2}^{N-1} x_{i}^{2} \sum_{i=1}^{N-2} x_{i}^{2}-\sum_{i=2}^{N-1} x_{i} x_{i-1} \sum_{i=2}^{N-1} x_{i} x_{i-1}}\left(\begin{array}{cc}
\sum_{i=1}^{N-2} x_{i}^{2} & -\sum_{i=2}^{N-1} x_{i} x_{i-1} \\
-\sum_{i=2}^{N-1} x_{i} x_{i-1} & \sum_{i=2}^{N-1} x_{i}^{2}
\end{array}\right)
\end{gathered}
$$

接下来，假设时间序列是平稳的，所以说自协方差只和滞后多少项相关。利用这个性质，在这个案例里面可以得到这样的等式：

$$
\begin{gathered}
\left(\mathbf{A}^{T} \mathbf{A}\right)^{-1}=\frac{1}{c_{o}^{2}-c_{1}^{2}}\left(\begin{array}{rr}
c_{o} & -c_{1} \\
-c_{1} & c_{o}
\end{array}\right) \\
\left(\mathbf{A}^{T} \mathbf{A}\right)^{-1}=\frac{1}{c_{o}^{2}\left(1-r_{1}^{2}\right)}\left(\begin{array}{rr}
c_{o} & -c_{1} \\
-c_{1} & c_{o}
\end{array}\right) \\
\left(\mathbf{A}^{T} \mathbf{A}\right)^{-1}=\frac{1}{c_{o}\left(1-r_{1}^{2}\right)}\left(\begin{array}{rr}
r_{o} & -r_{1} \\
-r_{1} & r_{o}
\end{array}\right)
\end{gathered}
$$
而且：
$$
\mathbf{A}^{T} \mathbf{b}=\left(\begin{array}{llll}
x_{2} & x_{3} & \cdots & x_{N-1} \\
x_{1} & x_{2} & \cdots & x_{N-2}
\end{array}\right)\left(\begin{array}{l}
x_{3} \\
x_{4} \\
\vdots \\
x_{N}
\end{array}\right)=\left(\begin{array}{l}
\sum_{i=3}^{N} x_{i} x_{i-1} \\
\sum_{i=3}^{N} x_{i} x_{i-2},
\end{array}\right)
$$

又因为这个时间序列是平稳的，所以：

$$
\mathbf{A}^{T} \mathbf{b}=\left(\begin{array}{l}
c_{1} \\
c_{2}
\end{array}\right)
$$

结合上面的公式，可以有：
$$
\begin{gathered}
\left(\mathbf{A}^{T} \mathbf{A}\right)^{-1} \mathbf{A}^{T} \mathbf{b}=\frac{1}{c_{o}\left(1-r_{1}^{2}\right)}\left(\begin{array}{rr}
r_{o} & -r_{1} \\
-r_{1} & r_{o}
\end{array}\right)\left(\begin{array}{l}
c_{1} \\
c_{2}
\end{array}\right) \\
=\frac{1}{1-r_{1}^{2}}\left(\begin{array}{rr}
1 & -r_{1} \\
-r_{1} & 1
\end{array}\right)\left(\begin{array}{l}
r_{1} \\
r_{2}
\end{array}\right) .
\end{gathered}
$$
将上面的矩阵分为两个部分，可以得到：
$$
\hat{\phi}_{1}=\frac{r_{1}\left(1-r_{2}\right)}{1-r_{1}^{2}}
$$

以及
$$
\hat{\phi}_{2}=\frac{r_{2}-r_{1}^{2}}{1-r_{1}^{2}}
$$

虽然可以按照p=2继续计算p=3的情况，但是那样的话，代数计算会变得很复杂。
幸运的是，有一种简单的方法来计算AR(p)的系数，这个方法就叫Yule-Waler公式。

# 2. Yule-Waler公式

这是一个AR(p)公式：
$$
x_{i+1}=\phi_{1} x_{i}+\phi_{2} x_{i-1}+\cdots+\phi_{p} x_{i-p+1}+\xi_{i+1}
$$

## 2.1 lag=1（滞后1）

在左右两边乘上$x_{i}$，得
$$
x_{i} x_{i+1}=\sum_{j=1}^{p}\left(\phi_{j} x_{i} x_{i-j+1}\right)+x_{i} \xi_{i+1}
$$

i和j是各自的时间索引。把$\{\phi_j\}$都拎出来，$x_j$都写到一起，得到这样的公式：
$$
\left\langle x_{i} x_{i+1}\right\rangle=\sum_{j=1}^{p}\left(\phi_{j}\left\langle x_{i} x_{i-j+1}\right\rangle\right)+\left\langle x_{i} \xi_{i+1}\right\rangle
$$

注意到$\left\langle x_{i} \xi_{i+1}\right\rangle = 0$ 因为截距$\xi$和当前时间是无关的，因此：
$$
\left\langle x_{i} x_{i+1}\right\rangle=\sum_{j=1}^{p}\left(\phi_{j}\left\langle x_{i} x_{i-j+1}\right\rangle\right)
$$

再除以N-1，再利用自协方差的平衡性:$c_{-l} = c_{l}$，得：
$$
c_{1}=\sum_{j=1}^{p} \phi_{j} c_{j-1}
$$

再除以$c_0$，得：
$$
r_{1}=\sum_{j=1}^{p} \phi_{j} r_{j-1}
$$


## 2.2 lag=2（滞后2）

两边乘以$x_{i-1}$, 得到：

$$
x_{i-1} x_{i+1}=\sum_{j=1}^{p}\left(\phi_{j} x_{i-1} x_{i-j+1}\right)+x_{i-1} \xi_{i+1}
$$

然后：
$$
\left\langle x_{i-1} x_{i+1}\right\rangle=\sum_{j=1}^{p}\left(\phi_{j}\left\langle x_{i-1} x_{i-j+1}\right\rangle\right)+\left\langle x_{i-1} \xi_{i+1}\right\rangle
$$

然后：
$$
\left\langle x_{i-1} x_{i+1}\right\rangle=\sum_{j=1}^{p}\left(\phi_{j}\left\langle x_{i-1} x_{i-j+1}\right\rangle\right)
$$

然后：
$$
c_{2}=\sum_{j=1}^{p} \phi_{j} c_{j-2}
$$

然后：
$$
r_{2}=\sum_{j=1}^{p} \phi_{j} r_{j-2}
$$


## 2.3 lag=k(滞后k)

两边乘以$x_{i-k-1}$, 得到：

$$
x_{i-k+1} x_{i+1}=\sum_{j=1}^{p}\left(\phi_{j} x_{i-k+1} x_{i-j+1}\right)+x_{i-k+1} \xi_{i+1}
$$

然后：
$$
\left\langle x_{i-k+1} x_{i+1}\right\rangle=\sum_{j=1}^{p}\left(\phi_{j}\left\langle x_{i-k+1} x_{i-j+1}\right\rangle\right)+\left\langle x_{i-k+1} \xi_{i+1}\right\rangle
$$

然后：
$$
\left\langle x_{i-k+1} x_{i+1}\right\rangle=\sum_{j=1}^{p}\left(\phi_{j}\left\langle x_{i-k+1} x_{i-j+1}\right\rangle\right)
$$

然后：
$$
c_{k}=\sum_{j=1}^{p} \phi_{j} c_{j-k}
$$

然后：
$$
r_{k}=\sum_{j=1}^{p} \phi_{j} r_{j-k}
$$



## 2.4 lag=p(滞后p)

两边乘以$x_{i-p-1}$, 得到：

$$
x_{i-p+1} x_{i+1}=\sum_{j=1}^{p}\left(\phi_{j} x_{i-p+1} x_{i-j+1}\right)+x_{i-p+1} \xi_{i+1}
$$

然后：
$$
\left\langle x_{i-p+1} x_{i+1}\right\rangle=\sum_{j=1}^{p}\left(\phi_{j}\left\langle x_{i-p+1} x_{i-j+1}\right\rangle\right)+\left\langle x_{i-p+1} \xi_{i+1}\right\rangle
$$

然后：
$$
\left\langle x_{i-p+1} x_{i+1}\right\rangle=\sum_{j=1}^{p}\left(\phi_{j}\left\langle x_{i-p+1} x_{i-j+1}\right\rangle\right)
$$

然后：
$$
c_{p}=\sum_{j=1}^{p} \phi_{j} c_{j-p}
$$

然后：
$$
r_{p}=\sum_{j=1}^{p} \phi_{j} r_{j-p}
$$


## 2.5 将上面的公式放一起

有：
$$
\begin{gathered}
r_{1}=\phi_{1} r_{o}+\phi_{2} r_{1}+\phi_{3} r_{2}+\cdots+\phi_{p-1} r_{p-2}+\phi_{p} r_{p-1} \\
r_{2}=\phi_{1} r_{1}+\phi_{2} r_{o}+\phi_{3} r_{1}+\cdots+\phi_{p-1} r_{p-3}+\phi_{p} r_{p-2} \\
\vdots \\
r_{p-1}=\phi_{1} r_{p-2}+\phi_{2} r_{p-3}+\phi_{3} r_{p-4}+\cdots+\phi_{p-1} r_{o}+\phi_{p} r_{1} \\
r_{p}=\phi_{1} r_{p-1}+\phi_{2} r_{p-2}+\phi_{3} r_{p-3}+\cdots+\phi_{p-1} r_{1}+\phi_{p} r_{o}
\end{gathered}
$$
可以被写成：
$$
\left(\begin{array}{c}
r_{1} \\
r_{2} \\
\vdots \\
r_{p-1} \\
r_{p}
\end{array}\right)=\left(\begin{array}{cccccc}
r_{o} & r_{1} & r_{2} & \cdots & r_{p-2} & r_{p-1} \\
r_{1} & r_{o} & r_{1} & \cdots & r_{p-3} & r_{p-2} \\
& \vdots & & & \vdots & \\
r_{p-2} & r_{p-3} & r_{p-4} & \cdots & r_{o} & r_{1} \\
r_{p-1} & r_{p-2} & r_{p-3} & \cdots & r_{1} & r_{o}
\end{array}\right)\left(\begin{array}{c}
\phi_{1} \\
\phi_{2} \\
\vdots \\
\phi_{p-1} \\
\phi_{p}
\end{array}\right)
$$

又因为$r_0 = 1$，所以可以写成：
$$
\underbrace{\left(\begin{array}{c}
r_{1} \\
r_{2} \\
\vdots \\
r_{p-1} \\
r_{p}
\end{array}\right)}_{\mathbf{r}} \underbrace{\left(\begin{array}{cccccc}
1 & r_{1} & r_{2} & \cdots & r_{p-2} & r_{p-1} \\
r_{1} & 1 & r_{1} & \cdots & r_{p-3} & r_{p-2} \\
& \vdots & & & \vdots & \\
r_{p-2} & r_{p-3} & r_{p-4} & \cdots & 1 & r_{1} \\
r_{p-1} & r_{p-2} & r_{p-3} & \cdots & r_{1} & 1
\end{array}\right)}_{\mathbf{R}} \underbrace{\left(\begin{array}{c}
\phi_{1} \\
\phi_{2} \\
\vdots \\
\phi_{p-1} \\
\phi_{p}
\end{array}\right)}_{\boldsymbol{\Phi}}
$$
整理成：
$$
\mathbf{R} \boldsymbol{\Phi}=\mathbf{r} \tag 2
$$

最终可以写成这样
$$
\hat{\boldsymbol{\Phi}}=\mathbf{R}^{-1} \mathbf{r}
$$

# 3. Yule-Walker公式求解过程

- 循环i，$1 \leq i \leq p$

  - 计算$\mathbf{R} ^ {(i)}$ 和 $\mathbf{r} ^ {(i)}$
  - 然后计算$\hat{\boldsymbol{\Phi}}^{(i)}$，公式为：
$
\hat{\boldsymbol{\Phi}}^{(i)}=\left(\mathbf{R}^{(i)}\right)^{-1} \mathbf{r}^{(i)}=\left(\begin{array}{c}
\hat{\phi}_{1} \\
\hat{\phi}_{2} \\
\vdots \\
\hat{\phi}_{i}
\end{array}\right)
$
  - 只保留$\hat{\phi}_{i}$，在$1 \leq j \leq {i-1}$范围内的$\hat{\phi}_{j}$都不要。
  - 第i个pacf系数这个时候就等于$pacf(i) = \hat{\phi}_{i}$

- 结束循环i。


# 4. python计算Yule-Walker公式






In [2]:
from scipy.linalg import toeplitz
import numpy as np


def cal_my_yule_walker(x, nlags=5):
    """
    自己实现yule_walker理论
    :param x:
    :param nlags:
    :return:
    """
    x = np.array(x, dtype=np.float64)
    x -= x.mean()
    n = x.shape[0]

    r = np.zeros(shape=nlags+1, dtype=np.float64)
    r[0] = (x ** 2).sum()/n

    for k in range(1, nlags+1):
        r[k] = (x[0:-k] * x[k:]).sum() / (n-k*1)


    R = toeplitz(c=r[:-1])
    result = np.linalg.solve(R, r[1:])
    return result

def cal_my_pacf_yw(x, nlags=5):
    """
    自己通过yule_walker方法求出pacf的值
    :param x:
    :param nlags:
    :return:
    """
    pacf = np.empty(nlags+1) * 0
    pacf[0] = 1.0
    for k in range(1, nlags+1):
        pacf[k] = cal_my_yule_walker(x,nlags=k)[-1]

    return pacf


# 测试函数
data_x = np.random.randint(low=10, high=20, size=20)

# 使用yelu_walker方法计算pacf
cal_my_pacf_yw(data_x)

array([ 1.        , -0.09547168, -0.38853085,  0.24985203,  0.24707613,
        0.26419663])