# 指数移动平均

指数移动平均（英语：exponential moving average，EMA或EXMA）是以指数式递减加权的移动平均。各数值的加权影响力随时间而指数式递减，越近期的数据加权影响力越重，但较旧的数据也给予一定的加权值。

Peter: 前面的简单移动平均，不能较好的反映近期的变化情况，用指数移动平均可以清楚的反映近期的数据变化。

下图是一个权重分配的例子：

![exponential-moving-average](../images/exponential-moving-average.png)

公式我就不在这里贴了，大家可以去[维基](https://zh.wikipedia.org/wiki/%E7%A7%BB%E5%8B%95%E5%B9%B3%E5%9D%87#%E6%8C%87%E6%95%B8%E7%A7%BB%E5%8B%95%E5%B9%B3%E5%9D%87)上看一下


## 读取澳洲空乘数据

In [3]:
import pandas as pd
import numpy as np
from datetime import datetime

# url = "../data/AirPassengers.csv" 如果把这个仓库下载后可以使用这个地址
# 如果后面有发现文件读不出来，可以自己手工把 .. 换成 https://raw.githubusercontent.com/liuhui998/time-series-little-book/master
# 但是这需要挂了 VPN, 因为课件还在开发过程中，大家多包涵
url = "../data/AirPassengers.csv"
dateparse = lambda dates: datetime.strptime(dates, '%Y-%m')
data = pd.read_csv(url, parse_dates=['Month'], index_col='Month',date_parser=dateparse)
data.head()

Unnamed: 0_level_0,Passengers
Month,Unnamed: 1_level_1
1949-01-01,112
1949-02-01,118
1949-03-01,132
1949-04-01,129
1949-05-01,121


## 进行指数平滑

* 是 ewm, mean 两个参数的组合
* 在 ewm 中指定 span 参数（数据跨度）

In [13]:
data['EMA12'] = data['Passengers'].ewm(span=12).mean()
data['EMA6'] = data['Passengers'].ewm(span=6).mean()

In [11]:
import cufflinks as cf
ewm_fig = data.iplot(asFigure = True, xTitle="时间",yTitle="乘客数量", title="预测最近一年航空乘客数")
ewm_fig.show('svg')

## 参考资料
* [维基-指数移动平均](https://zh.wikipedia.org/wiki/%E7%A7%BB%E5%8B%95%E5%B9%B3%E5%9D%87#%E6%8C%87%E6%95%B8%E7%A7%BB%E5%8B%95%E5%B9%B3%E5%9D%87)