# 滚动分析（Rolling Analysis）

给定历史数据，滚动分析通常用于回测模型的稳定性和预测性。传统时间序列建模的关键假定是模型的参数对于时间是不变的，然而经济环境经常发生较大的变化，没有任何理由假设模型的参数是常数。用于评价模型参数不变性的通用方法是在一个滚动窗口中估计模型参数，如果模型参数确实在整个样本期间是固定的，那么不同滚动窗口里得到的估计值应该不会有显著差异，反之参数在样本中的某个时点发生了变化，则滚动估计量应该可以捕捉到这种不稳定性。

滚动分析的作用:
* 模型对于时间的稳定性
* 模型预测的准确性


## 参数稳定性

假设有包含所有时期的样本数据：
1. 选择一个窗口长度，比如 m，m 依赖于样本的整体大小 T 以及数据的周期性。通常，对于较短时间间隔收集的数据可以选择较小的 m，较长的时间间隔则对应较大的 m。较大的窗长倾向于产生更光滑的滚动窗口估计量。
2. 假设连续两个滚动窗口的增量是 1 期，则整个数据集被分成 N=T-m+1 个子样本。第一个滚动窗口包含第 1 到 m 个观测，第二个窗口包含第 2 到 m+1 个观测，以此类推。对样本的划分有很多变体，比如，对于季度数据，可以设置窗口之间的增量是 4。
3. 在每个滚动窗口中使用子样本估计模型参数。
4. 绘制参数估计量以及执行区间相对于窗口索引的图像，如果图像呈现出明显的趋势或者较大的波动，则说明模型参数是时变的。


## 预测效果

比较不同模型的预测效果：
1. 选择一个窗口长度，比如 m，m 依赖于样本的整体大小 T 以及数据的周期性。通常，对于较短时间间隔收集的数据可以选择较小的 m，较长的时间间隔则对应较大的 m。较大的窗长倾向于产生更光滑的滚动窗口估计量。
2. 选择一个预测期，比如 h，h 依赖于实际应用的要求以及数据的周期性。
3. 假设连续两个滚动窗口的增量是 1 期，则整个数据集被分成 N=T-m+1 个子样本。第一个滚动窗口包含第 1 到 m 个观测，第二个窗口包含第 2 到 m+1 个观测，以此类推。对样本的划分有很多变体，比如，对于季度数据，可以设置窗口之间的增量是 4。
4. 在每个滚动窗口中：
    * 估计模型；
    * 估计向前 h 步预测；
    * 计算预测误差，$e_{nj}=y_{m-h+n+j}-\hat{y}_{nj}$，其中，$e_{nj}$ 为第 n 个滚动窗口的第 j 步向前预测误差，$y$ 是响应变量的观测值，$\hat{y}_{nj}$ 是第 n 个滚动窗口的第 j 步向前预测值；
5. 计算预测的均方根误差（Root Mean Squared Error, RMSE）：
$$
RMSE_{j}=\sqrt{\frac{\sum_\limits{n=1}^{N} e_{nj}^{2}}{n}}, j=1,\ldots,h
$$
6. 比较不同模型的 RMSE，具有最小 RMSE 的模型预测效果最好。

![滚动窗口](.\\images\\滚动窗口.PNG)