## Pandas-沿时间轴移动数据

内容介绍:

* 移动指的是沿时间轴将数据前移或后移
* 使用shift方法进行移动
* Series和DataFrame都有shift方法
* 作用：用于执行单纯的前移或后移操作，保持索引不变
* 语法如下：

shift(self, periods=1, freq=None, axis=0, fill_value=None) -> 'Series'

In [1]:
import numpy as np
import pandas as pd
import datetime
import pandas.tseries.offsets as offset

### 1.沿时间轴移动数据

In [2]:
# 示例数据
ts = pd.Series(np.random.randn(4),index=pd.date_range('2018-1-1',periods=4,freq='M'))
ts

2018-01-31    0.435291
2018-02-28    1.268614
2018-03-31   -0.105448
2018-04-30    0.030767
Freq: M, dtype: float64

In [3]:
#单纯前后移动
#不加其他参数是数据移动，产生缺失数据
ts.shift(2)

2018-01-31         NaN
2018-02-28         NaN
2018-03-31    0.435291
2018-04-30    1.268614
Freq: M, dtype: float64

In [4]:
#数据向上移动
ts.shift(-2)

2018-01-31   -0.105448
2018-02-28    0.030767
2018-03-31         NaN
2018-04-30         NaN
Freq: M, dtype: float64

**时间序列数据移动的应用：可以计算时间序列的百分比**

In [7]:
#计算ts数据的环比增长率
(ts/ts.shift(1)-1)*100

2018-01-31           NaN
2018-02-28    191.440209
2018-03-31   -108.312083
2018-04-30   -129.177534
Freq: M, dtype: float64

**移动索引，而不是数据的方法:**

In [15]:
#设置freq参数后，索引移动，数据不动
ts.shift(2,freq='M')

2018-03-31   -0.349219
2018-04-30   -0.750028
2018-05-31    0.245146
2018-06-30    1.704405
Freq: M, dtype: float64

In [16]:
#设置freq参数后，索引移动，数据不动
ts.shift(2,freq='D')

2018-02-02   -0.349219
2018-03-02   -0.750028
2018-04-02    0.245146
2018-05-02    1.704405
dtype: float64

### 2.通过偏移量对日期进行移动

需要使用偏移量模块进行处理

In [None]:
# 需要进一步学习

### 3.时期的数字运算

时期表示时间的区间，比如数日、数月或数年等。Period类表示时期数据类型。

In [21]:
# 创建时期数据对象。'A-DEC'代表每年度12月31日
p = pd.Period(2018,freq='A-DEC')
p

Period('2018', 'A-DEC')

In [20]:
#也可以传入字符串
p2 = pd.Period('2018',freq='A-DEC')
p2

Period('2018', 'A-DEC')

时期的数字运算

* 通过加减整数可以实现对Period的移动
* 相同频率的Period对象的差，是他们之间的单位数量

In [22]:
p+2

Period('2020', 'A-DEC')

In [27]:
p3 = p-2

In [29]:
# 相同的频率可以进行减法
p2-p3

<2 * YearEnds: month=12>

In [30]:
help(pd.period_range)

Help on function period_range in module pandas.core.indexes.period:

period_range(start=None, end=None, periods=None, freq=None, name=None) -> pandas.core.indexes.period.PeriodIndex
    Return a fixed frequency PeriodIndex.
    
    The day (calendar) is the default frequency.
    
    Parameters
    ----------
    start : str or period-like, default None
        Left bound for generating periods.
    end : str or period-like, default None
        Right bound for generating periods.
    periods : int, default None
        Number of periods to generate.
    freq : str or DateOffset, optional
        Frequency alias. By default the freq is taken from `start` or `end`
        if those are Period objects. Otherwise, the default is ``"D"`` for
        daily frequency.
    name : str, default None
        Name of the resulting PeriodIndex.
    
    Returns
    -------
    PeriodIndex
    
    Notes
    -----
    Of the three parameters: ``start``, ``end``, and ``periods``, exactly two
    mu