# ACF  Autocorrelation Function


# 定义

在统计学中，随机过程的自相关是不同时间过程值之间的Pearson相关性，作为两次或时滞的函数。设X是随机过程，并且t是任何时间点（t可以是离散时间过程的整数或连续时间过程的实数）。然后，Xt是在时间t由给定的过程运行产生的值（或实现）。假设对于每个t，设该过程在时间t具有平均值μt和方差σt2。然后定义时间s和t之间的自相关的公式:
   $$R(s,t)=\frac{E[(X_{t} - \mu_{t})(X_{s} - \mu_{s})]}{\sigma_{t}\sigma_{s}}$$ 
   



其中“E”是预期值运算符。请注意，此表达式没有为所有时间序列或过程定义良好，因为均值可能不存在，或者方差可能为零（对于常量过程）或无限（对于分布缺乏良好行为时刻的过程，例如作为某些类型的幂律）。如果函数R是明确定义的，则其值必须位于[-1,1]范围内，其中1表示完美相关，-1表示完全反相关。



如果Xt是广义平稳过程，那么平均值μ和方差σ2是时间无关的，并且自相关仅取决于t和s之间的滞后：相关性仅取决于这对值之间的时间距离。但不是他们的时间位置。这进一步意味着自相关可以表示为时滞的函数，并且这将是滞后τ= s-t的偶函数。这给出了更熟悉的形式
$$R(\tau) = \frac{E[(X_{t} - \mu)(X_{t+\tau} - \mu)]}{\sigma^{2}}$$

等价于:
$$R(\tau) = R(-\tau)$$

除了统计和时间序列分析之外，在一些学科中通常的做法是将归一化降低σ2并将术语“自相关”与“自协方差”互换使用。然而，归一化是重要的，因为将自相关的解释作为相关性提供了统计依赖强度的无标度测量，并且因为归一化对估计的自相关的统计特性具有影响。

## Properties
在下文中，我们将仅描述一维自相关的属性，因为大多数属性很容易从一维情况转移到多维情况。这些属性适用于广义静止过程

自相关的基本属性是对称性 **R(i) = R(-i)** 这很容易从定义中证明。在连续的情况下，自相关是一个偶函数
$$R_{f}(\tau) = R_{f}(-\tau)$$ 当f是一个真正的函数时候. 并且自相关是Hermitian函数
$$R_{f}(\tau) = R^{*}_{f}(-\tau)$$ 当f是一个复杂的函数时候

- 连续自相关函数在原点处达到其峰值，其中它取实数值，即对于任何延迟$$|R_{f}(\tau)| \le R_{f}(0)$$ 这是重新排列不平等的结果。在离散情况下也有相同的结果。

- 周期函数的自相关本身是相同周期的周期性的

- 两个完全不相关的函数之和的自相关(所有的互相关为零)是每个函数的自相关的总和。

- 由于自相关是一种特定类型的互相关，因此它保持了互相关的所有属性。

- 连续时间白噪声信号的自相关将在（tau = 0）tau = 0处具有强峰值（由狄拉克δ函数表示）并且对于所有其他t将精确地为0。

- Wiener-Khinchin定理通过傅里叶变换将自相关函数与功率谱密度联系起来： $$R({\tau}) = \int^{\infty}_{-\infty}S(f)e^{j2\pi f\tau}   df$$ $$S(f) = \int^{\infty}_{-\infty} R(\tau)e^{-j2\pi f\tau} d\tau$$
- 对于实值函数，对称自相关函数具有实对称变换，因此Wiener-Khinchin定理只能用实余弦重新表达：
 $$R(\tau) = \int^{\infty}_{-\infty}S(f)cos(2\pi f\tau) df$$
 $$S(f) = \int^{\infty}_{-\infty}R(\tau)cos(2\pi f\tau)d\tau$$



### Estimation

对于具有已知均值和方差的离散过程，我们观察到n个观察值 {X1, X2, ...., Xn}, 可以获得自相关的估计 $$\widehat{R} = \frac{1}{(n-k)\sigma^{2}}\sum^{n-k}{t=1}(X_{t} - \mu)(X_{t+k} - \mu)$$ 对于任何正整数 k < n. 当平均值和方差已知, 
这个估计是公正的。如果不知道过程的真实均值和方差，有几种可能性：


- 如果均值和方差被样本均值和样本方差的标准公式替换，那么这是一个有偏差的估计。
- 基于周期图的估计取代 n-k 在上面的公式中的n. 这种估计总是有偏差的;但是，它通常具有较小的均方误差
- 其他可能性来自处理两部分数据 $${X_{1}, X_{2}, X_{3}, ... X_{n-k}}$$  $${X_{k+1}, X_{k+2}, ...  ,X_{n}}$$ 分别计算单独的样本均值和/或样本方差，用于定义估计。
估计最后一种类型的优点是估计自相关的集合，作为函数K, 然后形成一个有效的自相关函数，因为它可以定义一个具有完全自相关的理论过程。其他估计可能会遇到这样的问题：如果它们用于计算线性组合的方差X's, 计算出的方差可能会变为负数。