### Pandas时间序列详解

- 基础概述
- 转换时间戳
- 生成时间戳范围
- DatetimeIndex
- DateOffset对象
- 与时间序列相关的方法
    - 移动
    - 频率转换
    - 重采样

In [1]:
# 导入库
import numpy as np
import pandas as pd

- 生成固定频率日期和时间跨度的序列
- 将时间序列整合/转换为特定频率
- 基于各种非标准时间增量，计算相对日期、或向前向后滚动日期

#### 基础概述

- 时刻数据
    - to_datetime,Timestamp
- Timestamp的索引
    - to_datetime,date_range,DatetimeIndex
- 时期数据
    - Period
- Period
    - period_range,PeriodIndex

- 时间戳 （Timestamp）

In [2]:
pd.Timestamp(2019,5,21)

Timestamp('2019-05-21 00:00:00')

In [4]:
pd.Timestamp("2019-02-02")

Timestamp('2019-02-02 00:00:00')

- 时间跨度（Period）

In [5]:
pd.Period("2018-01")

Period('2018-01', 'M')

In [6]:
pd.Period("2018-05",freq="D")

Period('2018-05-01', 'D')

#### 转换时间戳

- to_datetime 快速将字符串转换为时间戳

In [7]:
pd.to_datetime(pd.Series(["Jul 31 ,2018","2018-05-10",None]))

0   2018-07-31
1   2018-05-10
2          NaT
dtype: datetime64[ns]

In [8]:
pd.to_datetime(["2005/11/23","2010.12.31"])

DatetimeIndex(['2005-11-23', '2010-12-31'], dtype='datetime64[ns]', freq=None)

- 将unix时间转为时间戳

In [9]:
pd.to_datetime([1349720105,1349806505,1349892905],unit="s")

DatetimeIndex(['2012-10-08 18:15:05', '2012-10-09 18:15:05',
               '2012-10-10 18:15:05'],
              dtype='datetime64[ns]', freq=None)

#### 生成时间戳范围

时间戳范围生成
- date_range  日历日
- bdate_range   营业日

In [10]:
pd.date_range("2019-01-03",periods=8)

DatetimeIndex(['2019-01-03', '2019-01-04', '2019-01-05', '2019-01-06',
               '2019-01-07', '2019-01-08', '2019-01-09', '2019-01-10'],
              dtype='datetime64[ns]', freq='D')

In [11]:
pd.bdate_range("2019-02-01",periods= 8)

DatetimeIndex(['2019-02-01', '2019-02-04', '2019-02-05', '2019-02-06',
               '2019-02-07', '2019-02-08', '2019-02-11', '2019-02-12'],
              dtype='datetime64[ns]', freq='B')

- 指定频率，以周来生成时间戳

In [13]:
pd.date_range("2019-03-02",periods=8,freq="W")

DatetimeIndex(['2019-03-03', '2019-03-10', '2019-03-17', '2019-03-24',
               '2019-03-31', '2019-04-07', '2019-04-14', '2019-04-21'],
              dtype='datetime64[ns]', freq='W-SUN')

#### DatetimeIndex

#### DateOffset对象

In [14]:
from pandas.tseries.offsets import *
d = pd.Timestamp("2019-03-02")

In [16]:
d + DateOffset(weeks=2,days= 5)

Timestamp('2019-03-21 00:00:00')

#### 与时间序列相关的方法

- 移动

In [18]:
rng = pd.date_range("2018-6-24", periods=4, freq="W")
ts = pd.Series(range(len(rng)), index=rng)
ts

2018-06-24    0
2018-07-01    1
2018-07-08    2
2018-07-15    3
Freq: W-SUN, dtype: int64

In [19]:
ts.shift(2)

2018-06-24    NaN
2018-07-01    NaN
2018-07-08    0.0
2018-07-15    1.0
Freq: W-SUN, dtype: float64

- 频率转换

In [20]:
ts.asfreq(Day())

2018-06-24    0.0
2018-06-25    NaN
2018-06-26    NaN
2018-06-27    NaN
2018-06-28    NaN
2018-06-29    NaN
2018-06-30    NaN
2018-07-01    1.0
2018-07-02    NaN
2018-07-03    NaN
2018-07-04    NaN
2018-07-05    NaN
2018-07-06    NaN
2018-07-07    NaN
2018-07-08    2.0
2018-07-09    NaN
2018-07-10    NaN
2018-07-11    NaN
2018-07-12    NaN
2018-07-13    NaN
2018-07-14    NaN
2018-07-15    3.0
Freq: D, dtype: float64

- 重采样

In [21]:
#求出每个月的平均值
ts.resample("1M").sum()

2018-06-30    0
2018-07-31    6
Freq: M, dtype: int64

In [23]:
# 求出每个月的数值平均值
ts.resample("1M").mean()

2018-06-30    0
2018-07-31    2
Freq: M, dtype: int64