## 参考

1. [预测算法-指数平滑法](https://blog.csdn.net/nieson2012/article/details/51980943)
2. [指数平滑方法深度解析（一次二次三次）](https://www.jianshu.com/p/b9fa7aa061e7)

# Exponential Smoothing(指数平滑法)

## 目录

1. 指数平滑的定义及公式
2. 一次指数平滑预测
3. 二次指数平滑预测
4. 三次指数平滑预测
5. 加权系数a的选择

## 指数平滑的定义及公式

**产生背景**：指数平滑由布朗提出、他认为时间序列的态势具有稳定性或规则性，所以时间序列可被合理地顺势推延；他认为最近的过去态势，在某种程度上会持续的未来，所以将较大的权数放在最近的资料。

**基本原理**：指数平滑法是**移动平均法**中的一种，其特点在于给过去的观测值不一样的权重，即较近期观测值的权重比较远期观测值的权重要大。根据平滑次数不同，指数平滑法分为一次指数平滑法、二次指数平滑法和三次指数平滑法等。但它们的**基本思想**都是：预测值是以前观测值的加权和，且对不同的数据给予不同的权重，新数据给予较大的权重，旧数据给予较小的权重。

**方法应用**：指数平滑法是生产预测中常用的一种方法。也用于中短期经济发展趋势预测，所有预测方法中，指数平滑是用得最多的一种。

**基本公式**：$$ S_t = a*y_t + (1-a)*S_{t-1}$$

1. $S_t$:时间t的平滑值；
2. $y_t$:时间t的实际值；
3. $S_{t-1}$:时间t-1的平滑值；
4. $a$:平滑常数，其取值范围为[0,1]。

Note：根据平滑次数不同，指数平滑法分为：一次指数平滑法、二次指数平滑和三次指数平滑法等。

## 一次指数平滑预测

**当时间数列无明显的趋势变化，可用一次指数平滑预测。其预测公式为：**$$y_{t+1} ^* = a*y_t + (1-a)*y_t ^*$$

1. $y_{t+1}^*$:t+1期的预测值，即本期（t期）的平滑值$S_t$ ；

2. $y_t$:t期的实际值；

3. $y_t^*$:t期的预测值，即上期的平滑值$S_{t-1}$ 。

**例题：已知某种产品最近15个月的销售量如下表所示,用一次指数平滑值预测下个月的销售量$y_{16}$。**

|时间序号（t）|1|2|3|4|5|6|7|8|9|10|11|12|13|14|15|
|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|
|销售量（$y_t$）|10|15|8|20|10|16|18|20|22|24|20|26|27|29|29|

为了分析**加权系数a的不同取值**的特点，分别取**a=0.1,a=0.3,a=0.5**计算一次指数平滑值，并设初始值为最早的三个数据的平均值，：以**a = 0.5**的一次指数平滑值计算为例，有：

**预测值的初始值用前三期（可以改变，8期等等）的平均值表示：**
$$S_0 = \frac{y_1 + y_2 + y_3}{3} = 11.0$$
$$S_1 = 0.5*10 + 0.5*11.0=10.5$$
$$S_2  = 0.5*15 + 0.5*10.5 = 12.8$$

**结果：**

|时间序号（t）|1|2|3|4|5|6|7|8|9|10|11|12|13|14|15|16|
|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|
|销售量（$y_t$）|10|15|8|20|10|16|18|20|22|24|20|26|27|29|29|-|
|平滑值$S_t$|10.5|12.8|10.4|15.2|12.6|14.3|16.2|18.1|20.1|22.0|21.0|23.5|25.3|27.2|28.1|-|
|预测值$y_t ^*$|11.0|10.5|12.8|10.4|15.2|12.6|14.3|16.2|18.1|20.1|22.0|21.0|23.5|25.3|27.2|28.1|-|

**结论：**

1. 指数平滑法对实际序列具有**平滑作用**，权系数（平滑系数）a越小，平滑作用越强，但对实际数据的变动反应较迟缓。
2. 在实际序列的线性变动部分，指数平滑值序列出现一定的滞后偏差的程度随着权系数（平滑系数）a的增大而减少，但当时间序列的变动出现**直线趋势**时，用一次指数平滑法来进行预测仍将存在着明显的滞后偏差。因此，也需要进行修正。
3. 修正的方法也是在一次指数平滑的基础上再进行二次指数平滑，利用滞后偏差的规律找出曲线的发展方向和发展趋势，然后建立**直线趋势预测模型**，故称为二次指数平滑法。

In [9]:
def smoothOne(Yt, avg=3, alpha=0.5):
    St = []
    S0 = sum(Yt[:avg])/avg
    St.append(S0)
    for i in range(len(Yt)):
        St.append(alpha*Yt[i] + (1-alpha)*St[i])
    print(St[-1])
    
    
Y = [10,15,8,20,10,16,18,20,22,24,20,26,27,29,29] 
smoothOne(Y, 3, 0.5)

28.063079833984375


## 二次指数平滑预测

**在一次指数平滑的基础上得二次指数平滑的计算公式为：**$$S_t^{(2)} = \alpha S_t^{(1)} + (1-\alpha)S_{t-1}^{(2)}$$

1. $S_t^{(2)}$:第t周期的二次指数平滑值；
1. $S_t^{(1)}$:第t周期的一次指数平滑值；
1. $S_{t-1}^{(2)}$:第t-1周期的二次指数平滑值；
1. $\alpha$:加权系数（也称为平滑系数）。

二次指数平滑法是对一次指数平滑值作再一次指数平滑的方法。**它不能单独地进行预测，必须与一次指数平滑法配合**，建立预测的数学模型，然后运用数学模型确定预测值。

**二次指数平滑数学模型：**

$$y_{t+T}^* = a_t + b_t * T$$
$$a_t = 2S_t^{(1)}-S_t^{(2)}$$
$$b_t = \frac{\alpha}{1-\alpha}(S_t^{(1)}-S_t^{(2)})$$

**假设时间序列最后一期为$y_{11}$(1993),则：**
$$y_{1996}^* = y_{1993+3}^* = a_{1993} + b_{1993}*3$$
$$y_{1997}^* = y_{1993+4}^* = a_{1993} + b_{1993}*4$$


**例题:某地1983年至1993年财政入的资料如下，试用指数平滑法求解趋势直线方程并预测1996年的财政收入**


|年份|t|财政收入（元）|$S_t^{(1)} = \alpha y_t + (1-\alpha)S_{t-1}^{(1)}$(a=0.9,初始值23)|$S_t^{(2)} = \alpha S_t^{(1)} + (1-\alpha)S_{t-1}^{(2)}$(a=0.9,初始值28.40)|$a_t = 2S_t^{(1)}-S_t^{(2)}$|$b_t = \frac{\alpha}{1-\alpha}(S_t^{(1)}-S_t^{(2)})$|预测值$y_t$|
|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|
|1983|1|29|28.40|28.40|28.40|0.0|28.40|
|1984|2|36|35.24|34.56|35.92|6.16|35.92|
|1985|3|40|39.52|39.10|39.95|3.86|39.95|
|1986|4|48|47.15|46.39|47.92|6.87|47.92|
|1987|5|54|53.32|52.70|53.93|5.55|53.93|
|1988|6|62|61.13|60.35|60.35|7.03|60.35|
|1989|7|70|69.11|68.31|69.91|7.18|69.91|
|1990|8|76|75.31|74.69|75.93|5.58|75.93|
|1991|9|85|84.03|83.16|84.90|7.85|4.90|
|1992|10|94|93.00|92.11|93.90|8.07|93.90|
|1993|11|103|102.00|101.10|102.90|8.10|102.90|
|1994|12||||||111.00|
|1995|13||||||119.09|
|1996|14||||||127.19|
|1997|15||||||135.29|
|1998|16||||||143.39|
|1999|17||||||151.48|
|2000|18||||||159.58|
|2001|19||||||167.68|

In [133]:
def smoothTwo(Yt, S1_0=None, alpha=0.9, T=1):
    S1_t = []
    if S1_0 == None:
        S1_0 = Yt.pop(0)
    S1_t.append(S1_0)
    
    for i in range(len(Yt)):
        S1_t.append(alpha*Yt[i] + (1-alpha)*S1_t[i])
        
    S2_t = [None, S1_t[1]]
    for i in range(2, len(S1_t)):
        S2_t.append(alpha*S1_t[i] + (1-alpha)*S2_t[i-1])
        
    at = []
    bt = []
    for i in range(1, len(S1_t)):
        at.append(2*S1_t[i] - S2_t[i])
        bt.append(alpha/(1-alpha)*(S1_t[i] - S2_t[i]))
        #print("Y{}={};S1_{}={};S2_{}={};a{}={};b{}={};y{}={}".format(i, Yt[i-1], i, S1_t[i], i, S2_t[i], i, at[i-1], i, bt[i-1], i, at[i-1]))
    
    for i in range(T):
        at.append(at[-1]+bt[-1])
        print("y{}={}".format(len(Yt)+i+1, at[-1]))

In [134]:
Yt = [29,36,40,48,54,62,70,76,85,94,103]
smoothTwo(Yt,T= 3)

y11=111.98898725599992
y12=120.97879560262984
y13=129.96860394925977


In [135]:
Yt = [29,36,40,48,54,62,70,76,85,94,103]
smoothTwo(Yt,23,T=8)

y12=111.98898726764
y13=120.9787956248
y14=129.96860398196
y15=138.95841233912
y16=147.94822069628
y17=156.93802905344
y18=165.9278374106
y19=174.91764576776


**例3：已知某厂1978～1998年的钢产量如下表所示，试预测1999年、2000年该厂的钢产量。**

|年份|钢产量|
|:--:|:--:|
|1978|676|
|1979|825|
|1980|774|
|1981|716|
|1982|940|
|1983|1159|
|1984|1384|
|1985|1524|
|1986|1668|
|1987|1688|
|1988|1958|
|1989|2031|
|1990|2234|
|1991|2566|
|1992|2820|
|1993|3006|
|1994|3093|
|1995|3277|
|1996|3514|
|1997|3770|
|1998|4107|
|1999|**4399.13**|
|2000|**4694.92**|

In [118]:
Yt = [626,825,774,716,940,1159,1384,1524,1668,1688,1958,2031,2234,2566,2820,3006,3093,3277,3514,3770,4107]
smoothTwo(Yt,alpha=0.9,T=2)

y21=4399.131879464287
y22=4694.915407421877


## 三次指数平滑预测

 若时间序列的变动呈现出**二次曲线趋势**，则需要采用三次指数平滑法进行预测。三次指数平滑是在二次指数平滑的基础上再进行一次平滑，其计算公式为：$$S_t^{(3)} = \alpha S_t^{(2)} + (1-\alpha)S_{t-1}^{(3)}$$
 
 **三次指数平滑数学模型：**

$$y_{t+T}^* = a_t + b_t * T + c_t*T^2$$
$$a_t = 3S_t^{(1)}-3S_t^{(2)}+S_t^{(3)}$$
$$b_t = \frac{\alpha}{2(1-\alpha)^2}[(6-5\alpha)S_t^{(1)}-2(5-4\alpha)S_t^{(2)}+(4-3\alpha)S_t^{(3)}]$$
$$c_t = \frac{\alpha ^2}{2(1-\alpha)^2}[S_t^{(1)} - 2S_t^{(2)} + S_t^{(3)}]$$

**例4：我国某种耐用消费品1996年至2006年的销售量如表所示，试预测2007、2008年的销售量。**

|年份|t|销售量|预测值$y_t$|
|:--:|:--:|:--:|:--:|
|1996|1|225.2||
|1997|2|249.9||
|1998|3|263.2||
|1999|4|293.6||
|2000|5|318.9||
|2001|6|356.7||
|2002|7|363.3||
|2003|8|424.2||
|2004|9|466.5||
|2005|10|582.0||
|2006|11|750.0||
|2007|12|||
|2008|13|||



In [149]:
def smoothThree(Yt, S1_0=None, alpha=0.9, T=1):
    S1_t = []
    if S1_0 == None:
        S1_0 = Yt.pop(0)
    S1_t.append(S1_0)
    
    for i in range(len(Yt)):
        S1_t.append(alpha*Yt[i] + (1-alpha)*S1_t[i])
        
    S2_t = [None, S1_t[1]]
    for i in range(2, len(S1_t)):
        S2_t.append(alpha*S1_t[i] + (1-alpha)*S2_t[i-1])
        
    S3_t = [None, None, S2_t[1]]
    for i in range(3, len(S2_t)):
        S3_t.append(alpha*S2_t[i] + (1-alpha)*S3_t[i-1])
        
    at = []
    bt = []
    ct = [] 
    for i in range(2, len(S1_t)):
        at.append(3*S1_t[i] - 3*S2_t[i] + S3_t[i])
        bt.append((alpha/(2*(1-alpha)*(1-alpha)))*((6-5*alpha)*S1_t[i]-2*(5-4*alpha)*S2_t[i]+(4-3*alpha)*S3_t[i]))
        ct.append(((alpha*alpha)/(2*(1-alpha)*(1-alpha)))*(S1_t[i] - 2*S2_t[i] + S3_t[i]))             
        
    for i in range(T):
        at.append(at[-1]+bt[-1]+(i+1)*(i+1)*ct[-1])
        print("y{}={}".format(len(Yt)+i+1, at[-1]))
        
    print(at)

In [155]:
Yt = [225.2,249.9,263.2,293.6,318.9,356.7,424.2,466.5,582.0,750.0]
smoothThree(Yt, alpha=0.3, T =2)
Yt = [225.2,249.9,263.2,293.6,318.9,356.7,424.2,466.5,582.0,750.0]
smoothThree(Yt, alpha=0.4, T =2)
Yt = [225.2,249.9,263.2,293.6,318.9,356.7,424.2,466.5,582.0,750.0]
smoothThree(Yt, alpha=0.6, T =2)
Yt = [225.2,249.9,263.2,293.6,318.9,356.7,424.2,466.5,582.0,750.0]
smoothThree(Yt, alpha=0.7, T =2)

y10=816.8518830434
y11=938.7492757201626
[251.8817, 281.54541200000017, 311.50269049999986, 348.96691750999975, 408.80024805199986, 461.8215750109998, 558.4092955925901, 709.1547905601049, 816.8518830434, 938.7492757201626]
y10=865.9110623231995
y11=1024.8150794649594
[255.32639999999998, 287.168576, 316.77312, 354.3152563199999, 417.10010419199995, 467.69470463999994, 570.0488511897601, 730.1352736358397, 865.9110623231995, 1024.8150794649594]
y10=927.2419347967993
y11=1153.9631762892789
[256.7096, 290.83846400000004, 318.68892800000003, 356.23046528, 422.4603345919999, 468.1378695680002, 578.4728326553602, 746.1946832076798, 927.2419347967993, 1153.9631762892789]
y10=948.1393213266016
y11=1206.3244845994766
[255.53729999999996, 291.2632280000002, 318.6258465, 356.40209739, 423.4784162520001, 467.4059061869999, 580.3452998097898, 748.8055923971252, 948.1393213266016, 1206.3244845994766]


## 加权系数a的选择

在指数平滑法中，**预测成功的关键是a的选择**。a的大小规定了在新预测值中新数据和原预测值所占的比例。a值愈大，新数据所占的比重就愈大，原预测值所占比重就愈小，反之亦然。

**指数平滑法的缺点：**

1. 对数据的转折点缺乏鉴别能力，但这一点可通过**调查预测法**或**专家预测法**加以弥补。
2. 长期预测的效果较差，故多用于**短期预测**。

**指数平滑法的优点：**

1. 对不同时间的数据的非等权处理较符合实际情况。
2. 实用中仅需选择一个模型参数a 即可进行预测，简便易行。
3. 具有适应性，也就是说预测模型能自动识别数据模式的变化而加以调整。