### 参考

1. [移动平均法（Moving average，MA） 指数平滑法（Exponential Smoothing，ES）](https://blog.csdn.net/tz_zs/article/details/78341306)
2. [时间序列模型 （二）：移动平均法](https://blog.csdn.net/qq_29831163/article/details/89440426)

## 移动平均法（Moving average，MA）

移动平均法又称滑动平均法、滑动平均模型法

**移动平均法是用一组最近的实际数据值来预测未来一期或几期内公司产品的需求量、公司产能等的一种常用方法**。移动平均法适用于**即期预测**。当产品需求既不快速增长也不快速下降，且不存在季节性因素时，移动平均法能有效地消除预测中的随机波动，是非常有用的。移动平均法根据预测时使用的各元素的权重不同，可以分为：**简单移动平均**和**加权移动平均,**。

**移动平均法是一种简单平滑预测技术**，它的基本思想是：根据时间序列、逐项推移，依次计算包含一定项数的时序平均值，以反映长期趋势的方法。因此，当时间序列的数值由于受周期变动和随机波动的影响，起伏较大，不易显示出事件的发展趋势时，使用移动平均法可以消除这些因素的影响，显示出事件的发展方向与趋势（即趋势线），然后依趋势线分析预测序列的长期趋势。

### 简单移动平均法

简单移动平均的**各元素的权重都相等**。简单的移动平均的计算公式如下：

$$F_t = (A_{t-1}+A_{t-2}+A_{t-3}+\cdots+A_{t-n})/n$$

1. $F_t$:对下一期的预测值；
2. n:移动平均的时期个数；
3. $A_{t-1},A_{t-2},A_{t-3},A_{t-n}$:前一期实际值、前两期、前三期直至前n期的实际值。

**当预测目标的基本趋势是在某一水平上下波动时，可用一次简单移动平均方法构建预测模型。**

**其预测标准误差：**$$S = \sqrt{\frac{\sum_{t=N+1}^{T}(y_t^*-y_t)^2}{T-N}}$$

近N期序列值的平均值作为未来各期的预测结果。**一般 N 的取值范围： 5≤N≤ 200**。当历史序列的基本趋势变化不大且序列中**随机变动成分较多时，N的取值应较大一些**。否则 N 的取值应小一些。在有确定的季节变动周期的资料中，移动平均的项数应取周期长度。**选择N值的一个有效方法是，比较若干模型的预测误差。预测标准误差小者为好。**

简单移动平均法**只适合做近期预测**，而且是预测目标的**发展趋势变化不大**的情况。 如果目标的发展趋势存在其它的变化，采用简单移动平均法就会产生**较大的预测偏差和滞后**。 

例 1  某企业 1 月～11 月份的销售收入时间序列如表所示。试用一次简单滑动平均法预测第 12 月份的销售收入。 

|t|$y_t$|
|:--:|:--:|
|1|533.8|
|2|574.6|
|3|606.9|
|4|649.8|
|5|705.1|
|6|772.0|
|7|816.4|
|8|892.7|
|9|963.9|
|10|1015.1|
|11|1102.7|
|12|****|

In [95]:
import math
def SMA(Yt, N):
    # 移动平均
    return sum(Yt[len(Yt)-N:])/N

def SE(Yt, N):
    # 预测标准误差
    se = 0
    for i in range(N, len(Yt)):
        se += pow(SMA(Yt[i-N:i],N)-Yt[i],2)
    se = se/(len(Yt) - N)
    se = math.sqrt(se)
    return se

In [96]:
Yt = [533.8,574.6,606.9,649.8,705.1,772.0,816.4,892.7,963.9,1015.1,1102.7]
print(SMA(Yt, 5))


for i in range(1,len(Yt)):
    print(SE(Yt,i))

958.1600000000001
59.36306090490956
87.66301164750794
118.45976285923702
150.51213020645784
182.38506627462675
213.43945459492207
247.76921608378942
279.515582265402
308.7217906341334
349.6700000000001


### 加权移动平均法

在简单移动平均公式中，每期数据在求平均时的作用是等同的。但是，每期数据所包含的信息量不一样，近期数据包含着更多关于未来情况的信心。因此，把各期数据等同看待是不尽合理的，应考虑各期数据的重要性，**对近期数据给予较大的权重**，这就是加权移动平均法的基本思想。

设时间序列为$y_1,y_2,\cdots,y_t,\cdots$; 加权移动平均为：

$$M_{tw}=\frac{w_1y_t+w_2y_{t-1}+\cdots+w_1y_{t-N+1}}{w_1 + w_2 + \cdots + w_N}, t \geq N$$

预测公式：
$$y_{t+1}^*=M_{tw}$$ 

**例 2  我国 1979～1988 年原煤产量如表所示，试用加权移动平均法预测 1989 年 的产量**

|年份|$y_t$|预测值|相对误差|
|:--:|:--:|:--:|:--:|
|1979|6.35|||
|1980|6.20|||
|1981|6.22|||
|1982|6.66|6.235|6.38|
|1983|7.15|6.4367|9.98|
|1984|7.89|6.8317|13.41|
|1985|8.72|7.4383|14.70|
|1986|8.94|8.1817|8.48|
|1987|9.28|8.6917|6.34|
|1988|9.8|9.0733|7.41|
|1989|--|9.4833||

 在加权移动平均法中, $w_{t}$ 的选择同样具有一定的经验性。一般的原则是：**近期数据的权数大，远期数据的权数小**。至于大到什么程度和小到什么程度，则需要按照预 测者对序列的了解和分析来确定。 
解：$w_1 = 3, w_2 = 2, w_3 = 1$

In [126]:
def QMA(Yt, Wt):
    y_ = 0
    Len = len(Yt)-1
    for i in range(len(Wt)):
        y_ += Yt[Len-i]*Wt[i]
        
    y_ /= sum(Wt)
    return y_

In [130]:
# 时间序列数据
Yt = [6.35,6.20,6.22,6.66,7.15,7.89,8.72,8.94,9.28,9.8]
# 权重序列
Wt = [3,2,1]

QMA(Yt,Wt)

for i in range(3,len(Yt)+1):
    print(QMA(Yt[i-3:i],Wt))

6.235
6.436666666666667
6.831666666666667
7.438333333333333
8.181666666666667
8.691666666666668
9.073333333333332
9.483333333333333


In [132]:
# 相对误差：
for i in range(3,len(Yt)):
    err = (Yt[i]-QMA(Yt[i-3:i],Wt))/Yt[i]
    print(err)

0.06381381381381379
0.0997668997668997
0.13413603717786218
0.14698012232415916
0.08482475764354955
0.06339798850574689
0.07414965986394574


总的平均相对误差：$$[1-\frac{\sum y_t^*}{\sum y_t}]*100\%$$

In [143]:
# 总的平均相对误差：
y_ = 0
for i in range(3,len(Yt)):
    y_ += QMA(Yt[i-3:i],Wt)

err = 1-y_/sum(Yt[3:])
print(err)

0.09499771845767735


In [144]:
# 由于总预测值的平均值比实际值低了9.5%，所以可以修正为：

QMA(Yt, Wt)/(1-err)

10.478794945325054

### 趋势移动平均法

趋势移动平均法对于**同时存在直线趋势与周期波动**的序列，是一种既能反映趋势变 化，又可以有效地分离出来周期变动的方法。 

简单移动平均法和加权移动平均法，在时间序列没有明显的趋势变动时，能够准确 反映实际情况。但当时间序列出现**直线增加或减少的变动趋势时**，用简单移动平均法和 加权移动平均法来预测就会出现**滞后偏差**。因此，需要进行修正，**修正的方法是作二次移动平均**，利用移动平均滞后偏差的规律来建立直线趋势的预测模型。这就是趋势移动平均法。  一次移动的平均数为 

$$M_t^{(1)}= \frac{y_t + y_{t-1}+ \cdots + y_{t-N+1}}{N}$$

在一次平均的基础上再进行一次移动平均就是**二次移动平均**，其计算公式：

$$M_t^{(2)} = \frac{M_t^{(1)}+\cdots+M_{t-N+1}^{(1)}}{N}$$

如何利用移动平均的**滞后偏差**建立直线趋势预测模型。

设时间序列$Y_t$从某时期开始具有直线趋势，且认为未来时期也安此直线趋势变化，则可设此**直线预测模型**为：

$$y_{t+T}^* = a_t + b_tT$$

其中t为上前时期数；T为由t至预测期的时期数；$a_t$为截距，$b_t$为斜率，两者有称为**平滑系数**。

$$a_t = y_t$$
$$y_{t-1} = y_t - b_t$$
$$y_{t-2} = y_t -2b_t$$
$$\cdots$$
$$y_{t-N+1} = y_t - (N-1)b_t$$

所以：

$$M_t^{(1)} = \frac{y_t + y_{t-1}+ \cdots + y_{t-N+1}}{N}=\frac{y_t+(y_t - b_t) + \cdots + [y_t - (N-1)b_t]}{N}=\frac{Ny_t-[1+2+\cdots+(N-1)b_t]}{N}=y_t - \frac{N-1}{2}b_t$$

因此：

$$y_t - M_t^{(1)} = \frac{N-1}{2}b_t$$

所以：

$$y_t - y_{t-1} = M_t^{(1)} - M_{t-1}^{(1)} = b_t$$

可得：

$$M_t^{(1)}-M_t^{(2)}=\frac{N-1}{2}b_t$$

于是，**平滑系数**的计算公式：

$$a_t = 2M_t^{(1)}-M_t^{(2)}$$
$$b_t = \frac{2}{N-1}(M_t^{(1)}-M_t^{(2)})$$


**例题：我国 1965～1985 年的发电总量如表所示，试预测1986年和1987年的发电总量。**

|年份|t|$y_t$|一次MA，N=6|二次MA，N=6|
|:--:|:--:|:--:|:--:|:--:|
|1965|1|676|||
|1966|2|825|||
|1967|3|774|||
|1968|4|716|||
|1969|5|940|||
|1970|6|1159|||
|1971|7|1384|||
|1972|8|1524|||
|1973|9|1668|||
|1974|10|1688|||
|1975|11|1958|||
|1976|12|2031|||
|1977|13|2234|||
|1978|14|2566|||
|1979|15|2820|||
|1980|16|3006|||
|1981|17|3093|||
|1982|18|3277|||
|1983|19|3514|||
|1984|20|3770|||
|1985|21|4107|||
|1986|22|--|||

### 移动平均法的优缺点

**使用移动平均法进行预测能平滑掉需求的突然波动对预测结果的影响**。但移动平均法运用时也存在着如下**问题**：

1. 加大移动平均法的期数（即加大n值）会使平滑波动效果更好，但会使预测值对数据实际变动更不敏感；
2. n移动平均值并不能总是很好地反映出趋势。由于是平均值，预测值总是停留在过去的水平上而无法预计会导致将来更高或更低的波动；
3. 移动平均法要由大量的过去数据的记录。