# A Guide to Time Series Forecasting with Prophet in Python 3

这个Notebook主要介绍了如何利用 Prophet 基于现有的时间序列数据进行预测。
注意：FBProphet不支持pystan3.0以上，要安装pystan 2.19.1.1：

!conda install pystan

!pip install prophet

## Prophet in Python

ARIMA 模块需要非常复杂的手动过程来获取模型的参数， R 语言提供了一套参数自动优化的方法。Prophet 是 由 Facebook 的 Core Data Science 团队开源的一套针对时间序列基于 Python 和 R 语言的数据预测工具，其工作发表在论文《Forecasting at scale》(Taylor S J, LethamB. Forecasting at scale[J]. The American Statistician, 2018, 72(1): 37-45)。
    - 注：“at scale”是指数据的复杂度（如数据中存在大量异常点）和预测结果的评估复杂度，不是常说的数据存储和计算复杂度。
用于预测的时间任务常具有以下特征：
    - 对于历史在至少几个月（最好是一年）的每小时、每天或每周的观察
    - 强大的多次的「人类规模级」的季节性：每周的一些天和每年的一些时候
    - 事先知道的以不定期的间隔发生的重要节假日（如，双十一）
    - 合理数量的缺失的观察或大量异常
    - 历史趋势改变，比如因为产品发布或记录变化
    - 非线性增长曲线的趋势，其中有的趋势达到了自然极限或饱和

## 系统要求

1. Language: Python 3
2. Library:  pandas, matplotlib, numpy, cython, fbprophet
3. Others(Optional): Annaconda, Jupyter notebook

## Step 1 Loading Time-series Data

### 1）载入系统所需库
- 注：可能会出现错误 ERROR:fbprophet:Importing plotly failed. Interactive plots will not work. 可能是没有安装 plotly 模块的原因
    > 可行的解决方法： pip install --upgrade plotly

In [None]:
%matplotlib inline
import pandas as pd
from prophet import Prophet

import matplotlib.pyplot as plt
plt.style.use('fivethirtyeight')

### 2）工作的数据集

- 名称：Box and Jenkins (1976) Airline Passengers dataset
- 内容：收集了从 1949 年到 1960 年期间每月飞机乘客数量。
> curl -O https://assets.digitalocean.com/articles/eng_python/prophet/AirPassengers.csv

In [None]:
df = pd.read_csv('./data/AirPassengers.csv')

df.head(5)

- 查看 df 的格式并转换为**datetime**类型

In [None]:
df.dtypes

In [None]:
df['Month'] = pd.DatetimeIndex(df['Month'])
df.dtypes

In [None]:
df = df.rename(columns={'Month': 'ds',
                        'AirPassengers': 'y'})
df.head(5)

- 画图*

In [None]:
ax = df.set_index('ds').plot(figsize=(12, 8))
ax.set_ylabel('Monthly Number of Airline Passengers')
ax.set_xlabel('Date')

plt.show()

## Step 2 Time Series Forecasting with Prophet

- 创建 Prophet 对象并完成初始化

In [None]:
# set the uncertainty interval to 95% (the Prophet default is 80%)
my_model = Prophet(weekly_seasonality=True, daily_seasonality=True, interval_width=0.95)

In [None]:
my_model.fit(df)

- 添加数据列记录预测数据

In [None]:
future_dates = my_model.make_future_dataframe(periods=36, freq='MS')
future_dates.tail()

- 采用 predict 方法来预测数据并填充

In [None]:
forecast = my_model.predict(future_dates)
forecast[['ds', 'yhat', 'yhat_lower', 'yhat_upper']].tail()

- 画图
    - 黑点：观察值
    - 蓝线：预测值
    - 灰蓝色区域：不确定区间

In [None]:
my_model.plot(forecast,
              uncertainty=True)

振幅不是常数，尝试乘法模型

In [None]:
m_model = Prophet(seasonality_mode='multiplicative')
m_model.fit(df)
forecast = m_model.predict(future_dates)
fig = m_model.plot(forecast)