# A Guide to Time Series Visualization with Python 3

时间序列是数据分析的关键模块，这个Notebook主要介绍了如何利用 Python 3 进行时间序列的可视化和预测。


## 系统要求

1. Language: Python 3
2. Library:  pandas, statsmodels, matplotlib
3. Others(Optional): Annaconda, Jupyter notebook

## Step 1 Loading Time-series Data

### 1）载入系统所需库

In [None]:
import pandas as pd
import statsmodels.api as sm
import matplotlib.pyplot as plt

### 2）工作的数据集

- 名称：Atmospheric CO2 from Continuous Air Samples at Mauna Loa Observatory, Hawaii, U.S.A.
- 内容：收集了美国从 1958 年 3 月到 2001 年 12 月期间采样的 CO2 数据。

In [None]:
data = sm.datasets.co2.load_pandas()
co2 = data.data

In [None]:
print(co2.head(25))

## Step 2 Indexing with Time-series Data


In [None]:
co2.index

**结果解析**：dtype 指时间索引是采用 data stamp 对象格式记录，共有 2284 周的采集数据，记录时间是每周的周五。

In [None]:
y = co2['co2'].resample('MS').mean()
y.head(5)

In [None]:
y['1990':]

## Step 3 — Handling Missing Values in Time-series Data

- 显示/统计缺失值

In [None]:
y.isnull().sum()

- 填充缺失值（不同策略）
bfill用下一个非缺失值填充该缺失值
ffill用前一个非缺失值去填充该缺失值

In [None]:
y = y.fillna(y.bfill())
y.isnull().sum()

## Step 4 — Visualizing Time-series Data

当对时间序列数据进行分析时，可以通过数据的可视化来观察到数据的一些特征，比如：
    - 季节性 (seasonality): 数据呈现出清晰的周期特征
    - 趋势 (trend): 数据呈现持续的向上/向下的斜率
    - 噪声 (noise): 背离趋势或季节性特征的数据点

In [None]:
y.plot(figsize=(15, 6))
plt.show()

- 利用 statsmodels 库对数据的季节性和趋势进行分解

In [None]:
from pylab import rcParams
rcParams['figure.figsize'] = 11, 9

decomposition = sm.tsa.seasonal_decompose(y, model='additive')
fig = decomposition.plot()
plt.show()