#### Pandas的时间序列主要包括以下内容：
##### 时间模块(datetime)、时刻数据(Timestamp)、时间戳索引(DatetimeIndex)、时期(Period)、时间序列的索引及切片和重采样。共6部分内容。

In [1]:
import numpy as np
import pandas as pd
import datetime
# 也可以写成 from datetime import date

##### 一、时间模块：datetime（datetime本身并不是pandas里的东西，其属于系统自带的模块。）
##### datetime主要包括datetime.date(), datetime.datetime(), datetime.timedelta()
##### 日期解析方法：parser.parse

In [2]:
# 1、datetime.date()，是date的一个对象。

# 通过today()方法来查看今天的日期。
today = datetime.date.today()
print(today)
# 通过type可以看出，today是datetim.date的类型。
print('today的类型是： \n：',type(today))
print('-------------------------------------')
# 可以通过str来转成字符串
print('将其转化成字符串： \n：', str(today))
print('-------------------------------------')
# 直接创建datetime.date,日期是2020年1月1日
# 年月日之间用逗号分隔，需要注意的是年月日必须填写，否则会报错。
date = datetime.date(2020,1,1)
print(date)

2018-12-02
today的类型是： 
： <class 'datetime.date'>
-------------------------------------
将其转化成字符串： 
： 2018-12-02
-------------------------------------
2020-01-01


In [3]:
# 2、datetime.datetim()是一个datetime对象。
# 通过now()得到当前的时间,这个时间包括年月日时分秒
now = datetime.datetime.now()
print(now)
print('now的类型是： \n：', type(now))
print('-------------------------------------')
# 直接创建datetime.datetime,日期是2020年1月1日1点1分1秒
# 年月日时分秒之间用逗号分隔
time1 = datetime.datetime(2020,1,1,1,1,1)
print(time1)
print('-------------------------------------')
# 如果不写时分秒的话，会默认为0点0分0秒
time2 = datetime.datetime(2020,1,1)
print(time2)
print('-------------------------------------')
# datetime.datetime可以做减法
time3 = time1-time2
print('time1-time2后的结果是： \n', time3)
print('-------------------------------------')
# 需要注意的是time3的类型是datetime.timedelta也就是时间差，而不是datetime.datetime。
print('注意类型的： \n', type(time3))

2018-12-02 21:34:58.653732
now的类型是： 
： <class 'datetime.datetime'>
-------------------------------------
2020-01-01 01:01:01
-------------------------------------
2020-01-01 00:00:00
-------------------------------------
time1-time2后的结果是： 
 1:01:01
-------------------------------------
注意类型的： 
 <class 'datetime.timedelta'>


In [4]:
# 3、datetime.timedelta 时间差
# 注意：pandas里也有时间差，后期会用的多一些。
# 用now()方法给t1赋值，也可以用today来赋值。
t1 = datetime.datetime.now()
t2 = datetime.date.today()
# 设置t3为50天。
t3 = datetime.timedelta(50)
print('当前日期再过50天是什么日期： \n', t1+t3)
print('-------------------------------------')
print('50天前是什么日期： \n', t1-t3)
print('-------------------------------------')
print('当前日期再过50天是什么日期： \n', t2+t3)
print('-------------------------------------')
print('50天前是什么日期： \n', t2-t3)

# 设置t4为50天+1小时，1小时用3600秒来表示。
t4 = datetime.timedelta(50,3600)
print('当前日期再过50天1小时是什么日期： \n', t1+t4)
print('-------------------------------------')
print('50天1小时之前是什么日期： \n', t1-t4)

当前日期再过50天是什么日期： 
 2019-01-21 21:34:58.829102
-------------------------------------
50天前是什么日期： 
 2018-10-13 21:34:58.829102
-------------------------------------
当前日期再过50天是什么日期： 
 2019-01-21
-------------------------------------
50天前是什么日期： 
 2018-10-13
当前日期再过50天1小时是什么日期： 
 2019-01-21 22:34:58.829102
-------------------------------------
50天1小时之前是什么日期： 
 2018-10-13 20:34:58.829102


In [5]:
# 4、parser.parse字符串转换成日期
# parser也是系统自带的模块。

from dateutil.parser import parse

date = '12-31-2018'
# 直接将str转化成datetime.datetime
t1 = parse(date)
print(t1,type(t1))
print('-------------------------------------')
print('t1的类型是: \n',type(t1))
print('-------------------------------------')
# 下面是各种格式的识别
# 如果输入的格式国际通用格式中，也就是日在月之前。可以通过dayfirst来设置
# 通过AM和PM来进行上午和下午的区别。
# 可以通过英文缩写来定义月份
# 注意：不支持中文！！
print(parse('2018-12-31'),'\n',
     parse('12/31/2018'),'\n',
     parse('31/12/2018', dayfirst = True),'\n',  
     parse('Nov 11, 2018 11:11:11 AM'))

2018-12-31 00:00:00 <class 'datetime.datetime'>
-------------------------------------
t1的类型是: 
 <class 'datetime.datetime'>
-------------------------------------
2018-12-31 00:00:00 
 2018-12-31 00:00:00 
 2018-12-31 00:00:00 
 2018-11-11 11:11:11


##### 二、Pandas的时刻数据：Timestamp和to_datetime
##### 单个时间数据用Timestamp,多个时间数据用to_datetime。

In [6]:
# 1、Timestamp() 是pandas的时间数据。
d1 = '2018-11-15 13:30:30'
# datetime可设置时分秒，如果不设置就默认是00:00:00
d2 = datetime.datetime(2018,11,16,16)
# Timestamp可直接识别任何时间格式的字符串。
t1 = pd.Timestamp(d1)
t2 = pd.Timestamp(d2)
print(t1)
print('t1的类型是：\n', type(t1))
print('-------------------------------------')
print(t2)
print('d2的类型是：\n', type(t2))

2018-11-15 13:30:30
t1的类型是：
 <class 'pandas._libs.tslib.Timestamp'>
-------------------------------------
2018-11-16 16:00:00
d2的类型是：
 <class 'pandas._libs.tslib.Timestamp'>


In [7]:
# 2、to_datetime()也是pandas的时间数据，但是和Timestamp有所不同的是，可以对多个时间进行转换。
# 个人理解：to_datetime和Timestamp的最大不同就是对于多时间数据的处理。
d1 = '2018-11-15 13:30:30'
d2 = datetime.datetime(2018,11,16,16)
t1 = pd.to_datetime(d1)
t2 = pd.to_datetime(d2)
print(t1)
print('t1的类型是：\n', type(t1))
print('-------------------------------------')
print(t2)
print('t2的类型是：\n', type(t2))
print('-------------------------------------')

# 定义多个时间
d3 = ['20181112','20181113','20181114']
# 通过to_datetime转换成时间数据。
t3 = pd.to_datetime(d3)
print(t3)
# 转换后的时间数据是DatetimeIndex类型。
print('t3的类型是：\n', type(t3))

2018-11-15 13:30:30
t1的类型是：
 <class 'pandas._libs.tslib.Timestamp'>
-------------------------------------
2018-11-16 16:00:00
t2的类型是：
 <class 'pandas._libs.tslib.Timestamp'>
-------------------------------------
DatetimeIndex(['2018-11-12', '2018-11-13', '2018-11-14'], dtype='datetime64[ns]', freq=None)
t3的类型是：
 <class 'pandas.core.indexes.datetimes.DatetimeIndex'>


In [8]:
# 2.1 to_datetime多时间数据处理说明
d1 = [datetime.datetime(2018,11,1),datetime.datetime(2018,11,2),datetime.datetime(2018,11,3),
      datetime.datetime(2018,11,4),datetime.datetime(2015,11,5)]
d2 = ['2018-5-1','2018-5-2','2018-5-3','2018-5-4','2018-5-5','2018-5-6']
print(d1)
print('-------------------------------------')
print(d2)
print('-------------------------------------')
# 直接将datetime类型和字符串类型都转成时间。类型是DatetimeIndex
t1 = pd.to_datetime(d1)
t2 = pd.to_datetime(d2)
print(t1)
print('-------------------------------------')
print(t2)
print('-------------------------------------')

# 如果一组时间数据中有非时间格式的数据，可用errors参数。并且不加errors参数的话，代码运行时会报错。
d3 =['2018-5-1','2018-5-2','2018-5-3','Hello Python!!!','2018-5-5','2018-5-6']
# 当errors = ignore 表示当发现非时间类型的数据时，依然按原数据显示。
t3 = pd.to_datetime(d3, errors = 'ignore')
print('注意Hello Python!!!: \n', t3)
print('注意类型不是DatetimeIndex了，而是numpy的数组： \n', type(t3))
print('-------------------------------------')
# 当errors = coerce 表示将非时间类型的数据用失值返NaT（Not a Time）代替。
t4 = pd.to_datetime(d3, errors = 'coerce')
print('注意Hello Python!!!已经被NaT代替了: \n', t4)
print('类型是DatetimeIndex： \n', type(t4))
print('-------------------------------------')

[datetime.datetime(2018, 11, 1, 0, 0), datetime.datetime(2018, 11, 2, 0, 0), datetime.datetime(2018, 11, 3, 0, 0), datetime.datetime(2018, 11, 4, 0, 0), datetime.datetime(2015, 11, 5, 0, 0)]
-------------------------------------
['2018-5-1', '2018-5-2', '2018-5-3', '2018-5-4', '2018-5-5', '2018-5-6']
-------------------------------------
DatetimeIndex(['2018-11-01', '2018-11-02', '2018-11-03', '2018-11-04',
               '2015-11-05'],
              dtype='datetime64[ns]', freq=None)
-------------------------------------
DatetimeIndex(['2018-05-01', '2018-05-02', '2018-05-03', '2018-05-04',
               '2018-05-05', '2018-05-06'],
              dtype='datetime64[ns]', freq=None)
-------------------------------------
注意Hello Python!!!: 
 ['2018-5-1' '2018-5-2' '2018-5-3' 'Hello Python!!!' '2018-5-5' '2018-5-6']
注意类型不是DatetimeIndex了，而是numpy的数组： 
 <class 'numpy.ndarray'>
-------------------------------------
注意Hello Python!!!已经被NaT代替了: 
 DatetimeIndex(['2018-05-01', '2018-05-02', '201

##### 三、Pandas时间戳索引：DatetimeIndex
##### 说明：这里说的时间戳索引指得就是DatetimeIndex。而不是对DatetimeIndex的索引。

In [9]:
# DatetimeIndex（时间戳索引）和TimeSeries（时间序列）

# 定义一个DatetimeIndex类型的数据，生成DatetimeIndex可以是字符串也可以是datetime.datetime
# 注意： 单个时间戳的类型是Timestamp，而多个时间戳是DatetimeIndex

dti = pd.DatetimeIndex(['2018/12/12','2018/12/13','2018/12/14','2018/12/15','2018/12/16'])
print('这是dti: \n', dti,'\n','这是dti的类型: \n', type(dti))
print('-------------------------------------')

# 注意和多个时间戳类型的区别。
print('这是dti的第一个元素是: \n', dti[0],'\n','这是dti的第一个元素的类型是: \n',type(dti[0]))
print('-------------------------------------')

# 定义TimeSeries
# 说明：以DatetimeIndex为index索引的Series，就是TimeSeries。

# 通过pd.Series定义个Series，但是它的index用的是DatetimeIndex。st就变成了TimeSeries类型。
ts = pd.Series(np.random.rand(len(dti)), index = dti)
print('这是ts，注意！这个数据的索引是: \n', ts)
print('-------------------------------------')
print('这是ts的类型: \n', type(ts))
print('-------------------------------------')
print('这是ts索引的类型: \n', ts.index)

这是dti: 
 DatetimeIndex(['2018-12-12', '2018-12-13', '2018-12-14', '2018-12-15',
               '2018-12-16'],
              dtype='datetime64[ns]', freq=None) 
 这是dti的类型: 
 <class 'pandas.core.indexes.datetimes.DatetimeIndex'>
-------------------------------------
这是dti的第一个元素是: 
 2018-12-12 00:00:00 
 这是dti的第一个元素的类型是: 
 <class 'pandas._libs.tslib.Timestamp'>
-------------------------------------
这是ts，注意！这个数据的索引是: 
 2018-12-12    0.243206
2018-12-13    0.888690
2018-12-14    0.209546
2018-12-15    0.361329
2018-12-16    0.484417
dtype: float64
-------------------------------------
这是ts的类型: 
 <class 'pandas.core.series.Series'>
-------------------------------------
这是ts索引的类型: 
 DatetimeIndex(['2018-12-12', '2018-12-13', '2018-12-14', '2018-12-15',
               '2018-12-16'],
              dtype='datetime64[ns]', freq=None)


##### 1、pd.date_range()

In [10]:
# 1、pd.date_range() 生成时间数据
# 说明：对于时间数据的生产有多种方式，可以直接写，可以读取，也可以通过pd.date_range()来生成数据。
# date_rang()提供了两种生成方式：1、start + end； 2、start/end + periods 。
# pd.date_range(start=None, end=None, periods=None, freq='D', tz=None, 
#               normalize=False, name=None, closed=None, **kwargs)

# 参数说明：
# start：开始时间
# end：结束时间
# periods：偏移量

# 设置来开始和结束的时间，其他参数都是默认。
dr1 = pd.date_range('12/1/2018','12/10/2018')

# 设置开始时间并设置了10天的偏移量，这样就会从 '12/1/2018'到'12/10/2018'。也就说定义了向后10天的偏移量。
dr2 = pd.date_range(start = '12/1/2018', periods = 10)

# 设置了结束时间并设置了10天的偏移量，而且还增加了时分秒。因为设置了结束时间，所以偏移量是向前。而不是向后。
dr3 = pd.date_range(end = '12/31/2017 15:00:00', periods = 10)  
print(dr1)
print('类型是：',type(dr1))
print('-------------------------------------')
print(dr2)
print('类型是：',type(dr2))
print('-------------------------------------')
print(dr3)
print('类型是：',type(dr3))
print('-------------------------------------')

# normalize：将时分秒设置为00:00:00。该参数默认是False，如果设置为True就变成00:00:00
# name：给索引对象起个名字。下面的例子就是给dr4这个DatetimeIndex起了个名字叫‘hello Python!’
dr4 = pd.date_range(start = '12/1/2018 13:31:13', periods = 10, 
                    name = 'hello Python!', normalize = True)
print('注意时分秒的变化,变为00:00:00的时候，就不显示时分秒了： \n', dr4)
print('-------------------------------------')

# closed：默认为None，这种情况是末端包含的。left:左包含右不包含，right:左不包含右包含
# 
dr5 = pd.date_range('2018-12-01','2018-12-10',closed = 'left')
print('包含12-01，不包含12-10：\n',dr5)
print('-------------------------------------')
dr6 = pd.date_range('2018-12-01','2018-12-10',closed = 'right')
print('不包含12-01，包含12-10：\n',dr6)
print('-------------------------------------')

# freq：频率，默认天，pd.date_range()默认频率为日历日，pd.bdate_range()默认频率为工作日
dr7 = pd.date_range('12/1/2018','12/10/2018')
print('日历日： \n',dr7)
print('-------------------------------------')
dr8 = pd.bdate_range('12/1/2018','12/10/2018')
print('工作日： \n',dr8)
print('-------------------------------------')

# 通过list()将时间戳索引进行转换。
# 列表中的元素都是Timestamp，也就说Timestamp是pd里最小的时间刻度单位。
# 注意：Timestamp和DatetimeIndex的区别。
dr9 = list(pd.date_range(start = '2018-12-1',end = '2018-12-5'))
print('列表中的每个元素都是Timestamp： \n', dr9)

DatetimeIndex(['2018-12-01', '2018-12-02', '2018-12-03', '2018-12-04',
               '2018-12-05', '2018-12-06', '2018-12-07', '2018-12-08',
               '2018-12-09', '2018-12-10'],
              dtype='datetime64[ns]', freq='D')
类型是： <class 'pandas.core.indexes.datetimes.DatetimeIndex'>
-------------------------------------
DatetimeIndex(['2018-12-01', '2018-12-02', '2018-12-03', '2018-12-04',
               '2018-12-05', '2018-12-06', '2018-12-07', '2018-12-08',
               '2018-12-09', '2018-12-10'],
              dtype='datetime64[ns]', freq='D')
类型是： <class 'pandas.core.indexes.datetimes.DatetimeIndex'>
-------------------------------------
DatetimeIndex(['2017-12-22 15:00:00', '2017-12-23 15:00:00',
               '2017-12-24 15:00:00', '2017-12-25 15:00:00',
               '2017-12-26 15:00:00', '2017-12-27 15:00:00',
               '2017-12-28 15:00:00', '2017-12-29 15:00:00',
               '2017-12-30 15:00:00', '2017-12-31 15:00:00'],
              dtype='datetime64[

In [11]:
# 2、pd.date_range()-freq参数说明（一）
# freq参数基本说明
# 默认freq = 'D'：每日历日；B：每工作日；
# H：每小时；T/MIN：每分；S：每秒；L：每毫秒（千分之一秒）；U：每微秒（百万分之一秒）
# W-MON：每周从指定星期几开始算起。（星期几缩写：MON/TUE/WED/THU/FRI/SAT/SUN）
# TUE-3MON：每月从指定的第几个星期几开始算，这里是每月第三个星期二

# 日历日
print(pd.date_range(start = '2018-12-1',end = '2018-12-10',freq = 'd'))
print('-------------------------------------')
# 工作日
print(pd.date_range(start = '2018-12-1',end = '2018-12-10',freq = 'b'))
print('-------------------------------------')
# 小时(H/h)
print(pd.date_range(start = '2018-12-1',end = '2018-12-2',freq = 'h'))
print('-------------------------------------')
# 分钟(T/MIN)
print(pd.date_range('2018/12/1 12:00','2018/12/1 12:10', freq = 't'))
print('-------------------------------------')
# 每秒
print(pd.date_range('2018/12/1 12:00:00','2018/12/1 12:00:10', freq = 'S')) 
print('-------------------------------------')
# 每毫秒
print(pd.date_range('2018/12/1 12:00:00','2018/12/1 12:00:10', freq = 'L'))
print('-------------------------------------')
# 每微秒
print(pd.date_range('2018/12/1 12:00:00','2018/12/1 12:00:10', freq = 'U'))
print('-------------------------------------')
# 指定了从周几开始计算。
# 从周二开始计算
print(pd.date_range('2018/11/1','2018/12/1', freq = 'W-TUE'))
print('-------------------------------------')
# 指定从每个月的第几周的星期几开始计算
# 从每个月的第三周的星期3开始。
print(pd.date_range('2018/5/1','2018/12/1', freq = 'WOM-3WED'))
print('-------------------------------------')

DatetimeIndex(['2018-12-01', '2018-12-02', '2018-12-03', '2018-12-04',
               '2018-12-05', '2018-12-06', '2018-12-07', '2018-12-08',
               '2018-12-09', '2018-12-10'],
              dtype='datetime64[ns]', freq='D')
-------------------------------------
DatetimeIndex(['2018-12-03', '2018-12-04', '2018-12-05', '2018-12-06',
               '2018-12-07', '2018-12-10'],
              dtype='datetime64[ns]', freq='B')
-------------------------------------
DatetimeIndex(['2018-12-01 00:00:00', '2018-12-01 01:00:00',
               '2018-12-01 02:00:00', '2018-12-01 03:00:00',
               '2018-12-01 04:00:00', '2018-12-01 05:00:00',
               '2018-12-01 06:00:00', '2018-12-01 07:00:00',
               '2018-12-01 08:00:00', '2018-12-01 09:00:00',
               '2018-12-01 10:00:00', '2018-12-01 11:00:00',
               '2018-12-01 12:00:00', '2018-12-01 13:00:00',
               '2018-12-01 14:00:00', '2018-12-01 15:00:00',
               '2018-12-01 16:00:00', '

In [12]:
# 3、pd.date_range()-freq参数说明（二）
# M：每个月的最后一天，也就是每月最后一个日历日。
# Q-月：指定哪个月为季度的最后一个月，但是这个月不是随便写的。只有三种情况：1-4-7-10,2-5-8-11,3-6-9-12。而且显示的是这个月的最后一个日历日
# A-月：指定每年哪个月份的最后一个日历日
# 月缩写：JAN/FEB/MAR/APR/MAY/JUN/JUL/AUG/SEP/OCT/NOV/DEC

# 显示从2016年到2018年  “之前”  每个月的最后一个日历日
print(pd.date_range('2016','2018', freq = 'M'))
print('-------------------------------------')

# 显示从2016年到2018年  “之前”  以3-6-9-12这4个月为季度末的最后一个日历日。
print(pd.date_range('2016','2018', freq = 'Q-DEC'))
print('-------------------------------------')

# 显示从2016年到2018年  “之前”  的2月的最后一个日历日。
print(pd.date_range('2016','2018', freq = 'A-FEB')) 
print('-------------------------------------')



# 将参数M、Q、A后面+上S，变成MS、QS-月、AS-月。就表示每个月的第一个日历日

print(pd.date_range('2016','2018', freq = 'MS'))
print('-------------------------------------')
print(pd.date_range('2016','2018', freq = 'QS-DEC'))
print('-------------------------------------')
print(pd.date_range('2016','2018', freq = 'AS-FEB')) 
print('-------------------------------------')

# 将参数M、Q、A前面+上B，变成BM、BQ-月、BA-月。就表示每月的最后一个工作日

print(pd.date_range('2016','2018', freq = 'BM'))
print('-------------------------------------')
print(pd.date_range('2016','2018', freq = 'BQ-DEC'))
print('-------------------------------------')
print(pd.date_range('2016','2018', freq = 'BA-FEB')) 
print('-------------------------------------')

# 将参数M、Q、A前面+上B，后面+上S，变成BMS、BQS-月、BAS-月。就表示每月的第一个工作日

print(pd.date_range('2016','2018', freq = 'BMS'))
print('-------------------------------------')
print(pd.date_range('2016','2018', freq = 'BQS-DEC'))
print('-------------------------------------')
print(pd.date_range('2016','2018', freq = 'BAS-FEB')) 
print('-------------------------------------')

DatetimeIndex(['2016-01-31', '2016-02-29', '2016-03-31', '2016-04-30',
               '2016-05-31', '2016-06-30', '2016-07-31', '2016-08-31',
               '2016-09-30', '2016-10-31', '2016-11-30', '2016-12-31',
               '2017-01-31', '2017-02-28', '2017-03-31', '2017-04-30',
               '2017-05-31', '2017-06-30', '2017-07-31', '2017-08-31',
               '2017-09-30', '2017-10-31', '2017-11-30', '2017-12-31'],
              dtype='datetime64[ns]', freq='M')
-------------------------------------
DatetimeIndex(['2016-03-31', '2016-06-30', '2016-09-30', '2016-12-31',
               '2017-03-31', '2017-06-30', '2017-09-30', '2017-12-31'],
              dtype='datetime64[ns]', freq='Q-DEC')
-------------------------------------
DatetimeIndex(['2016-02-29', '2017-02-28'], dtype='datetime64[ns]', freq='A-FEB')
-------------------------------------
DatetimeIndex(['2016-01-01', '2016-02-01', '2016-03-01', '2016-04-01',
               '2016-05-01', '2016-06-01', '2016-07-01', '2016-

In [13]:
# 4、pd.date_range()的复合频率
# 在参数freq中增加数字就可以根据需要来控制天数。

# 从2018年11月1日开始，每隔6天显示一个时间数据，一直到2018年12月1日之前。
print(pd.date_range('2018/11/1','2018/12/1', freq = '6D'))
print('-------------------------------------')
# 从2018年12月1日的00:00:00开始，每隔1小时15分钟显示一个时间数据，一直到2018年12月2日00:00:00之前。
print(pd.date_range('2018/12/1','2018/12/2', freq = '1h15min'))
print('-------------------------------------')
# 从2017年1月开始，每隔2个月显示一个时间数据，一直到2018年1月之前。这里显示的日历日，如果想改成工作日的话，用BM就可以了。其他的类似。
print(pd.date_range('2017','2018', freq = '2M'))
print('-------------------------------------')


DatetimeIndex(['2018-11-01', '2018-11-07', '2018-11-13', '2018-11-19',
               '2018-11-25', '2018-12-01'],
              dtype='datetime64[ns]', freq='6D')
-------------------------------------
DatetimeIndex(['2018-12-01 00:00:00', '2018-12-01 01:15:00',
               '2018-12-01 02:30:00', '2018-12-01 03:45:00',
               '2018-12-01 05:00:00', '2018-12-01 06:15:00',
               '2018-12-01 07:30:00', '2018-12-01 08:45:00',
               '2018-12-01 10:00:00', '2018-12-01 11:15:00',
               '2018-12-01 12:30:00', '2018-12-01 13:45:00',
               '2018-12-01 15:00:00', '2018-12-01 16:15:00',
               '2018-12-01 17:30:00', '2018-12-01 18:45:00',
               '2018-12-01 20:00:00', '2018-12-01 21:15:00',
               '2018-12-01 22:30:00', '2018-12-01 23:45:00'],
              dtype='datetime64[ns]', freq='75T')
-------------------------------------
DatetimeIndex(['2017-01-31', '2017-03-31', '2017-05-31', '2017-07-31',
               '2017-09-30',

In [14]:
# 5、通过asfreq()对时期频率转换

# 创建一个带有时间戳索引的Series
ts = pd.Series(np.random.rand(5), 
              index = pd.date_range('2018-12-01','2018-12-05'))
print(ts)
print('-------------------------------------')
print(type(ts))
print('-------------------------------------')
# 通过asfreq()来改变频率,将原来以天为单位的频率，改成了12小时。
print(ts.asfreq('12H'))
print('-------------------------------------')
# asfreq()有个method参数，作用是插值，如果是ffill表示用之前值填充，bfill用之后值填充。
print(ts.asfreq('12H',method = 'ffill'))
print('-------------------------------------')
print(ts.asfreq('12H',method = 'bfill'))
print('-------------------------------------')

2018-12-01    0.486387
2018-12-02    0.814954
2018-12-03    0.755120
2018-12-04    0.035306
2018-12-05    0.710956
Freq: D, dtype: float64
-------------------------------------
<class 'pandas.core.series.Series'>
-------------------------------------
2018-12-01 00:00:00    0.486387
2018-12-01 12:00:00         NaN
2018-12-02 00:00:00    0.814954
2018-12-02 12:00:00         NaN
2018-12-03 00:00:00    0.755120
2018-12-03 12:00:00         NaN
2018-12-04 00:00:00    0.035306
2018-12-04 12:00:00         NaN
2018-12-05 00:00:00    0.710956
Freq: 12H, dtype: float64
-------------------------------------
2018-12-01 00:00:00    0.486387
2018-12-01 12:00:00    0.486387
2018-12-02 00:00:00    0.814954
2018-12-02 12:00:00    0.814954
2018-12-03 00:00:00    0.755120
2018-12-03 12:00:00    0.755120
2018-12-04 00:00:00    0.035306
2018-12-04 12:00:00    0.035306
2018-12-05 00:00:00    0.710956
Freq: 12H, dtype: float64
-------------------------------------
2018-12-01 00:00:00    0.486387
2018-12-01 12

In [15]:
# 6、通过shift()来对日期范围对应的数字进行向前或者向后的调整。
ts = pd.Series(np.random.rand(5), 
              index = pd.date_range('2018-12-01','2018-12-05'))
print(ts)
print('-------------------------------------')
print(type(ts))
print('-------------------------------------')

# shift()的第一个参数用数字来表示，+数表示向后，-数表示向前。表示了位移的是数据，index不跟着移动。
# 将日期对应的数据整体向后移1。也就是2018-12-01原来对应的数据，对应到了2018-12-02上。现在2018-12-01对应的为NaN
print(ts.shift(1))
print('-------------------------------------')
# 将日期对应的数据整体向前移1。也就是2018-12-05原来对应的数据，对应到了2018-12-04上。现在2018-12-05对应的为NaN
print(ts.shift(-1))
print('-------------------------------------')

# shift()除了有第一个数字参数外，有增加了频率参数。就表示对index进行位移，而不对数据进行位移。

# 将index向后位移2天。
print(ts.shift(2, freq = 'D'))
print('-------------------------------------')

# 将index向后位移2个小时
print(ts.shift(2, freq = 'T'))

2018-12-01    0.970576
2018-12-02    0.189316
2018-12-03    0.604965
2018-12-04    0.788641
2018-12-05    0.109377
Freq: D, dtype: float64
-------------------------------------
<class 'pandas.core.series.Series'>
-------------------------------------
2018-12-01         NaN
2018-12-02    0.970576
2018-12-03    0.189316
2018-12-04    0.604965
2018-12-05    0.788641
Freq: D, dtype: float64
-------------------------------------
2018-12-01    0.189316
2018-12-02    0.604965
2018-12-03    0.788641
2018-12-04    0.109377
2018-12-05         NaN
Freq: D, dtype: float64
-------------------------------------
2018-12-03    0.970576
2018-12-04    0.189316
2018-12-05    0.604965
2018-12-06    0.788641
2018-12-07    0.109377
Freq: D, dtype: float64
-------------------------------------
2018-12-01 00:02:00    0.970576
2018-12-02 00:02:00    0.189316
2018-12-03 00:02:00    0.604965
2018-12-04 00:02:00    0.788641
2018-12-05 00:02:00    0.109377
Freq: D, dtype: float64


In [16]:
# 7、shift()的特别说明
# 在实际工作中有时需要比对一段时间内前后两天的变化情况。那么就可以使用这个方法。
ts = pd.Series(np.random.rand(5), 
              index = pd.date_range('2018-12-01','2018-12-05'))
print(ts)
print('-------------------------------------')

# 计算一下12月前5天，每天的数据变化。通过将当前数据向后位移，并与当前数值进行比较，来得出每天数据的变化。
p = ts/ts.shift(1) - 1
print(p)
print('-------------------------------------')

2018-12-01    0.856043
2018-12-02    0.779887
2018-12-03    0.658649
2018-12-04    0.899490
2018-12-05    0.630668
Freq: D, dtype: float64
-------------------------------------
2018-12-01         NaN
2018-12-02   -0.088963
2018-12-03   -0.155455
2018-12-04    0.365660
2018-12-05   -0.298861
Freq: D, dtype: float64
-------------------------------------


##### 四、Pandas时期：Period

In [17]:
# 1、通过pd.Period()创建时期
# Period和DatetimeIndex的区别是，Period更多的是代表一段时期，而DatetimeIndex代表的是一个时间节点。

# 在定义的时候，都是'2018'，但是根据生成的结果来看是不同的。
# 通过type可以看到Period是一个构造器。
p = pd.Period('2018')
dt = pd.DatetimeIndex(['2018'])
print(p)
print(type(p))
print('-------------------------------------')
print(dt)
print(type(dt))
print('-------------------------------------')

# Period也有freq参数
# 以月为单位的Period
p1 = pd.Period('2018', freq = 'M')
print(p1)
print('-------------------------------------')

# Period可以通过+-来调整。

# 变成了2017年
print(p-1)
print('-------------------------------------')
# 变成了2018-02
print(p1+1)

2018
<class 'pandas._libs.period.Period'>
-------------------------------------
DatetimeIndex(['2018-01-01'], dtype='datetime64[ns]', freq=None)
<class 'pandas.core.indexes.datetimes.DatetimeIndex'>
-------------------------------------
2018-01
-------------------------------------
2017
-------------------------------------
2018-02


In [18]:
# 2、通过period_range()创建一个时期范围
# 通过Period_range()创建的数据，类型是PeriodIndex。

# period_range()和date_range()在创建时参数相同，但是结果却不一样。同样的类型也不相同。
pr = pd.period_range('2018-1-1', '2019-1-1', freq='M')
dtr = pd.date_range('2018-1-1', '2019-1-1', freq='M')
print(pr)
print(dtr)
print('-------------------------------------')
print(type(pr))
print(type(dtr))
print('-------------------------------------')

# 两个数据的索引和类型都是不同的。
# 整体的数据类型是PeriodIndex，单个数据的类型是Period.
print(pr[0])
print(type(pr[0]))
print('-------------------------------------')
# 整体的数据类型是DatetimeIndex.单个数据的类型是Timestamp.
print(dtr[0])
print(type(dtr[0]))
# # 数据格式为PeriodIndex，单个数值为Period

# 创建一个Series并以PeriodIndex为它的index.
ps = pd.Series(np.random.rand(len(pr)), index = pr)
# 创建一个Series并以DatetimeIndex为它的index.
ds = pd.Series(np.random.rand(len(dtr)),index = dtr)
print(ts)
print(type(ts))
print(ts.index)
print('-------------------------------------')
print(ds)
print(type(ds))
print(ds.index)

PeriodIndex(['2018-01', '2018-02', '2018-03', '2018-04', '2018-05', '2018-06',
             '2018-07', '2018-08', '2018-09', '2018-10', '2018-11', '2018-12',
             '2019-01'],
            dtype='period[M]', freq='M')
DatetimeIndex(['2018-01-31', '2018-02-28', '2018-03-31', '2018-04-30',
               '2018-05-31', '2018-06-30', '2018-07-31', '2018-08-31',
               '2018-09-30', '2018-10-31', '2018-11-30', '2018-12-31'],
              dtype='datetime64[ns]', freq='M')
-------------------------------------
<class 'pandas.core.indexes.period.PeriodIndex'>
<class 'pandas.core.indexes.datetimes.DatetimeIndex'>
-------------------------------------
2018-01
<class 'pandas._libs.period.Period'>
-------------------------------------
2018-01-31 00:00:00
<class 'pandas._libs.tslib.Timestamp'>
2018-12-01    0.856043
2018-12-02    0.779887
2018-12-03    0.658649
2018-12-04    0.899490
2018-12-05    0.630668
Freq: D, dtype: float64
<class 'pandas.core.series.Series'>
DatetimeIndex(['20

In [19]:
# 3、通过asfreq()来对频率进行转换

p = pd.Period('2018')
print(p)
print('-------------------------------------')

# 通过给asfreq()增加参数来改变转换的频率。asfreq的参数和前面的类似。
# 特别说明：how这个参数。
# how = 's'与how = 'start'是等效的，表示这是开始的时间。
# how = 'e'与how = 'end'是等效的，表示这是结束的时间。

# 频率调制为月，并且指定了开始的时间。
print(p.asfreq('M', how = 'start'))
print('-------------------------------------')
# 频率调制为天，并且指定了结束的时间。
print(p.asfreq('D', how = 'end'))
print('-------------------------------------')

# 通过asfreq()来改变index。
ps = pd.period_range('2017','2018',freq = 'M')
ts1 = pd.Series(np.random.rand(len(ps)), index = ps)

# 将频率改成天，并且指定了开始的时间。
ts2 = pd.Series(np.random.rand(len(ps)), index = ps.asfreq('D', how = 'start'))
print(ts1)
print('-------------------------------------')
print(ts2)
# 请注意跟ts2的比较。
ts3 = pd.Series(np.random.rand(len(ps)), index = ps.asfreq('D', how = 'end'))
print(ts3)

2018
-------------------------------------
2018-01
-------------------------------------
2018-12-31
-------------------------------------
2017-01    0.962610
2017-02    0.145349
2017-03    0.572875
2017-04    0.206993
2017-05    0.244389
2017-06    0.994952
2017-07    0.376108
2017-08    0.379370
2017-09    0.667938
2017-10    0.869343
2017-11    0.366212
2017-12    0.517099
2018-01    0.097717
Freq: M, dtype: float64
-------------------------------------
2017-01-01    0.385191
2017-02-01    0.640670
2017-03-01    0.877457
2017-04-01    0.677468
2017-05-01    0.237980
2017-06-01    0.648644
2017-07-01    0.542727
2017-08-01    0.667845
2017-09-01    0.717827
2017-10-01    0.669201
2017-11-01    0.860345
2017-12-01    0.529100
2018-01-01    0.676603
Freq: D, dtype: float64
2017-01-31    0.102022
2017-02-28    0.590059
2017-03-31    0.377382
2017-04-30    0.910080
2017-05-31    0.169009
2017-06-30    0.203333
2017-07-31    0.995056
2017-08-31    0.160032
2017-09-30    0.735435
2017-10-31

In [20]:
# 4、通过to_period()和to_timestamp()来对时间戳与时期之间进行转换：

pdr = pd.date_range('2018/12', periods = 10, freq = 'M')
ppr = pd.period_range('2017','2018', freq = 'M')
print(pdr)
print('-------------------------------------')
print(ppr)
print('-------------------------------------')
ts1 = pd.Series(np.random.rand(len(pdr)), index = pdr)
print('索引是时间戳：\n',ts1)
print('-------------------------------------')
# 将时间戳转换为时期。
print('索引变成了时期：\n',ts1.to_period())
print('-------------------------------------')
# 每月最后一日，转化为每月

ts2 = pd.Series(np.random.rand(len(ppr)), index = ppr)
print('索引是时期：\n',ts2)
print('-------------------------------------')
# 将时期转换为时间戳。
print('索引变成了时间戳：\n',ts2.to_timestamp())

DatetimeIndex(['2018-12-31', '2019-01-31', '2019-02-28', '2019-03-31',
               '2019-04-30', '2019-05-31', '2019-06-30', '2019-07-31',
               '2019-08-31', '2019-09-30'],
              dtype='datetime64[ns]', freq='M')
-------------------------------------
PeriodIndex(['2017-01', '2017-02', '2017-03', '2017-04', '2017-05', '2017-06',
             '2017-07', '2017-08', '2017-09', '2017-10', '2017-11', '2017-12',
             '2018-01'],
            dtype='period[M]', freq='M')
-------------------------------------
索引是时间戳：
 2018-12-31    0.206005
2019-01-31    0.491781
2019-02-28    0.576501
2019-03-31    0.562144
2019-04-30    0.913516
2019-05-31    0.570461
2019-06-30    0.916328
2019-07-31    0.881308
2019-08-31    0.385409
2019-09-30    0.547117
Freq: M, dtype: float64
-------------------------------------
索引变成了时期：
 2018-12    0.206005
2019-01    0.491781
2019-02    0.576501
2019-03    0.562144
2019-04    0.913516
2019-05    0.570461
2019-06    0.916328
2019-07    0.88

#### 五、时间序列的索引及切片

In [21]:
# 1、索引
pdr = pd.date_range('2018/10','2018/12')
ps = pd.Series(np.random.rand(len(pdr)), index = pdr)

# 显示ps的前5个数值，通过.head()来实现。
print(ps.head())
print('-------------------------------------')
print(type(ps))
print('-------------------------------------')

# 时间序列的索引和切片，与之前的用法一直。通过下标的方式来实现。
print(ps[0])
print('-------------------------------------')
print(ps[:2])
print('-------------------------------------')

# 时间序列也可以通过index来索引，而且支持多种时间字符串，同时也支持datatime.
# 由于时间序列已经是按时间的先后顺序进行排列，所以不用考虑顺序问题。
# 可以看到下面的这些写法，最终返回的结果都是一样的。
print(ps['2018/10/04'])
print(ps['20181004'])
print(ps['10/04/2018'])
print(ps[datetime.datetime(2018,10,4)])
print('-------------------------------------')

# 需要说明的是，这样的索引方法同样适用于Dataframe。

2018-10-01    0.932571
2018-10-02    0.816773
2018-10-03    0.261186
2018-10-04    0.284368
2018-10-05    0.097520
Freq: D, dtype: float64
-------------------------------------
<class 'pandas.core.series.Series'>
-------------------------------------
0.9325712776737548
-------------------------------------
2018-10-01    0.932571
2018-10-02    0.816773
Freq: D, dtype: float64
-------------------------------------
0.2843682901134069
0.2843682901134069
0.2843682901134069
0.2843682901134069
-------------------------------------


In [22]:
# 2、切片
pdr = pd.date_range('2018/10','2018/12')
ps = pd.Series(np.random.rand(len(pdr)), index = pdr)

# 基本的下标切片
print(ps[::10])
print('-------------------------------------')

# 根据index进行切片，只要能识别为时间序列都可以写。
# 注意：这里跟Series一样都是末端包含的
print(ps['20181005':'20181009'])
print('-------------------------------------')
print(ps['2018/10/5':'2018/10/9'])
print('-------------------------------------')

# 直接一个时间序列
# 这里需要注意时间的写法。总之如果是因为写法报错的话，你就改改书写方法。
# 把2018/10改成201810就会报错。
print(ps['2018/10'])
print('-------------------------------------')

# 进行二次索引
print(ps['2018/10'][::5])
print('-------------------------------------')
print(ps['2018/10'][:5])
print('-------------------------------------')

2018-10-01    0.680639
2018-10-11    0.155203
2018-10-21    0.255280
2018-10-31    0.379475
2018-11-10    0.739929
2018-11-20    0.731249
2018-11-30    0.495560
Freq: 10D, dtype: float64
-------------------------------------
2018-10-05    0.452835
2018-10-06    0.804524
2018-10-07    0.802151
2018-10-08    0.195485
2018-10-09    0.654952
Freq: D, dtype: float64
-------------------------------------
2018-10-05    0.452835
2018-10-06    0.804524
2018-10-07    0.802151
2018-10-08    0.195485
2018-10-09    0.654952
Freq: D, dtype: float64
-------------------------------------
2018-10-01    0.680639
2018-10-02    0.898999
2018-10-03    0.570006
2018-10-04    0.397732
2018-10-05    0.452835
2018-10-06    0.804524
2018-10-07    0.802151
2018-10-08    0.195485
2018-10-09    0.654952
2018-10-10    0.317698
2018-10-11    0.155203
2018-10-12    0.350827
2018-10-13    0.822215
2018-10-14    0.334099
2018-10-15    0.709641
2018-10-16    0.353254
2018-10-17    0.833993
2018-10-18    0.788697
2018-10

In [23]:
# 3、有重复索引的时间序列
# 通过is_unique判断值是否唯一
# 通过index.is_unique判断索引是否唯一

# 多个重复的日期
dates = pd.DatetimeIndex(['1/1/2018','1/1/2018','1/3/2018','1/4/2018','1/1/2018','1/2/2018'])
ps = pd.Series(np.random.rand(6), index = dates)
print(ps)
print('-------------------------------------')
print('判断值是否唯一：',ps.is_unique)
print('判断索引是否唯一：',ps.index.is_unique)


# index有重复的将返回多个值
print('多个重复的index，所以返回了多个值： \n',ps['20180101'],type(ps['20180101']))
print('index是唯一的，所以返回了一个值： \n',ps['20180104'],type(ps['20180104']))
print('-------------------------------------')

2018-01-01    0.260083
2018-01-01    0.406878
2018-01-03    0.125650
2018-01-04    0.795033
2018-01-01    0.635317
2018-01-02    0.055136
dtype: float64
-------------------------------------
判断值是否唯一： True
判断索引是否唯一： False
多个重复的index，所以返回了多个值： 
 2018-01-01    0.260083
2018-01-01    0.406878
2018-01-01    0.635317
dtype: float64 <class 'pandas.core.series.Series'>
index是唯一的，所以返回了一个值： 
 2018-01-04    0.795033
dtype: float64 <class 'pandas.core.series.Series'>
-------------------------------------


#### 六、重采样
##### 将一个时间序列从一个种频率转换为另外一种频率就是重采样。重采样分为两种：、
##### 1、升采样：低频率——>高频率
##### 2、降采样：高频率——>低频率

In [24]:
# 1、通过.resample()实现重采样

dr = pd.date_range('20181201', periods = 12)
ps = pd.Series(np.arange(12), index = dr)
print(ps)

# 通过resample将频率改为5天。
# 注意：通过resample只是得到了一个重采样构建器，而不是真正的数据。
ps_re = ps.resample('5D')

# 通过.sum()进行聚合后得到真正的数据。
# 因为频率是5天，所以聚合的时候会以每5天聚合一次。
ps_re2 = ps.resample('5D').sum()
print('注意这里得到的是构建器：\n',ps_re)
print('-------------------------------------')
print('注意这里的类型也是构建器：\n',type(ps_re))
print('-------------------------------------')
print(ps_re2)
print('-------------------------------------')
print(type(ps_re2))
print('-------------------------------------')

# 其他的聚合方法
print('求平均值\n',ps.resample('5D').mean())
print('求最大值\n',ps.resample('5D').max())
print('求最小值\n',ps.resample('5D').min())
print('求中值\n',ps.resample('5D').median())
print('返回第一个值\n',ps.resample('5D').first())
print('返回最后一个值\n',ps.resample('5D').last())

2018-12-01     0
2018-12-02     1
2018-12-03     2
2018-12-04     3
2018-12-05     4
2018-12-06     5
2018-12-07     6
2018-12-08     7
2018-12-09     8
2018-12-10     9
2018-12-11    10
2018-12-12    11
Freq: D, dtype: int32
注意这里得到的是构建器：
 DatetimeIndexResampler [freq=<5 * Days>, axis=0, closed=left, label=left, convention=start, base=0]
-------------------------------------
注意这里的类型也是构建器：
 <class 'pandas.core.resample.DatetimeIndexResampler'>
-------------------------------------
2018-12-01    10
2018-12-06    35
2018-12-11    21
dtype: int32
-------------------------------------
<class 'pandas.core.series.Series'>
-------------------------------------
求平均值
 2018-12-01     2.0
2018-12-06     7.0
2018-12-11    10.5
dtype: float64
求最大值
 2018-12-01     4
2018-12-06     9
2018-12-11    11
dtype: int32
求最小值
 2018-12-01     0
2018-12-06     5
2018-12-11    10
dtype: int32
求中值
 2018-12-01     2.0
2018-12-06     7.0
2018-12-11    10.5
dtype: float64
返回第一个值
 2018-12-01     0
2018-12-06     5
20

In [25]:
# 降采样
# closed参数、label参数
dr = pd.date_range('20181201', periods = 12)
ps = pd.Series(np.arange(12), index = dr)
# 注意ps和ps1在不同，一个是np.arange(12)，一个是np.arange(1,13)
ps1 = pd.Series(np.arange(1,13), index = dr)
print(ps)
print('-------------------------------------')
print(ps1)
print('-------------------------------------')

# 修改频率为5天。在没有参数的情况是这样采样的[1,2,3,4,5]是一部分；[6,7,8,9,10]是一部分；[11,12,13]是一部分。
print(ps.resample('5D').sum())
print('-------------------------------------')
print('注意和ps聚合后的不同')
print(ps1.resample('5D').sum())
print('-------------------------------------')
# 使用采用closed来修改采样，也就是各时间段哪一端是闭合。在默认情况下是左闭右闭
# closed = 'left' 指定间隔左边为结束 [1,2,3,4,5],[6,7,8,9,10],[11,12]
print(ps.resample('5D', closed = 'left').sum())
print('-------------------------------------')
print(ps1.resample('5D', closed = 'left').sum())
print('-------------------------------------')

# 这里是重点
# closed = 'right' 指定间隔右边为结束 → [1],[2,3,4,5,6],[7,8,9,10,11],[12]。
# 我来解释一下为什么会变成这样了，这段会比较长。
'''
1、默认
之前定义的是一共12天。后来通过重采样改成了以5天为单位降采样处理后，变成了三个5天，分别是：
第一个5天：1-2-3-4-5-6
第二个5天：6-7-8-9-10-11
第三个5天：12-13-14-15-16

2、当closed = 'left' 左闭右开
上面的三个5天可以由以下的三个左闭右开的区间构成：
区间1：[1, 6)
区间2: [6, 11)
区间3：[11, 16) 虽然时间只到12号但会往后补足5天

3、closed = 'right' 左开右闭
上面的三个5天可以由以下的四个左开右闭的区间构成。
注意，由于第一个5天是1-6，又是左开区间，所以1号就落不到1-6号而是要往前补足，变成下面这样：
区间1：(26,1]
区间2：(1, 6]
区间3: (6, 11]
区间4：(11, 16]
对于区间1，是对27，28，29，30，1的值求和。

''' 
print(ps.resample('5D', closed = 'right').sum())
print('-------------------------------------')
print(ps1.resample('5D', closed = 'right').sum())
print('-------------------------------------')

# 参数label，有left和right两种情况。默认是left
# 解释一下:这个参数的意思是将计算后的值是用哪个index来表示。
print('每个区间的第一个index：\n',ps.resample('5D', label = 'left').sum())
print('-------------------------------------')
print('每个区间的最后一个index：\n',ps.resample('5D', label = 'right').sum())

2018-12-01     0
2018-12-02     1
2018-12-03     2
2018-12-04     3
2018-12-05     4
2018-12-06     5
2018-12-07     6
2018-12-08     7
2018-12-09     8
2018-12-10     9
2018-12-11    10
2018-12-12    11
Freq: D, dtype: int32
-------------------------------------
2018-12-01     1
2018-12-02     2
2018-12-03     3
2018-12-04     4
2018-12-05     5
2018-12-06     6
2018-12-07     7
2018-12-08     8
2018-12-09     9
2018-12-10    10
2018-12-11    11
2018-12-12    12
Freq: D, dtype: int32
-------------------------------------
2018-12-01    10
2018-12-06    35
2018-12-11    21
dtype: int32
-------------------------------------
注意和ps聚合后的不同
2018-12-01    15
2018-12-06    40
2018-12-11    23
dtype: int32
-------------------------------------
2018-12-01    10
2018-12-06    35
2018-12-11    21
dtype: int32
-------------------------------------
2018-12-01    15
2018-12-06    40
2018-12-11    23
dtype: int32
-------------------------------------
2018-11-26     0
2018-12-01    15
2018-12-06    40
2

In [26]:
# 升采样和插值
# 由低频向高频转的时候主要是看如何进行插值。

pdr = pd.date_range('2018/12/1 0:0:0', periods = 5, freq = 'H')
pdf = pd.DataFrame(np.arange(15).reshape(5,3),
                  index = pdr,columns = ['a','b','c'])
print(pdf)
print('-------------------------------------')

# .asfreq()不做任何的填充，插入的值是Nan
print(pdf.resample('15T').asfreq())
print('-------------------------------------')

# .ffill()：向上填充
print('这里使用前一个值作为填充，进行插值：\n',pdf.resample('15T').ffill())
print('-------------------------------------')

# .bfill()：向下填充
print('这里使用后一个值作为填充，进行插值：\n',pdf.resample('15T').bfill())
print('-------------------------------------')

                      a   b   c
2018-12-01 00:00:00   0   1   2
2018-12-01 01:00:00   3   4   5
2018-12-01 02:00:00   6   7   8
2018-12-01 03:00:00   9  10  11
2018-12-01 04:00:00  12  13  14
-------------------------------------
                        a     b     c
2018-12-01 00:00:00   0.0   1.0   2.0
2018-12-01 00:15:00   NaN   NaN   NaN
2018-12-01 00:30:00   NaN   NaN   NaN
2018-12-01 00:45:00   NaN   NaN   NaN
2018-12-01 01:00:00   3.0   4.0   5.0
2018-12-01 01:15:00   NaN   NaN   NaN
2018-12-01 01:30:00   NaN   NaN   NaN
2018-12-01 01:45:00   NaN   NaN   NaN
2018-12-01 02:00:00   6.0   7.0   8.0
2018-12-01 02:15:00   NaN   NaN   NaN
2018-12-01 02:30:00   NaN   NaN   NaN
2018-12-01 02:45:00   NaN   NaN   NaN
2018-12-01 03:00:00   9.0  10.0  11.0
2018-12-01 03:15:00   NaN   NaN   NaN
2018-12-01 03:30:00   NaN   NaN   NaN
2018-12-01 03:45:00   NaN   NaN   NaN
2018-12-01 04:00:00  12.0  13.0  14.0
-------------------------------------
这里使用前一个值作为填充，进行插值：
                       a   b 

In [31]:
# 时期重采样 - Period

pdr = pd.period_range('2017','2018',freq = 'M')
ps = pd.Series(np.arange(len(pdr)), index = pdr)
print(ps)
print('-------------------------------------')
 # 升采样
print(ps.resample('15D').ffill())
print('-------------------------------------')
# 降采样
print(ps.resample('45D').sum())

2017-01     0
2017-02     1
2017-03     2
2017-04     3
2017-05     4
2017-06     5
2017-07     6
2017-08     7
2017-09     8
2017-10     9
2017-11    10
2017-12    11
2018-01    12
Freq: M, dtype: int32
-------------------------------------
2017-01-01     0
2017-01-16     0
2017-01-31     0
2017-02-15     1
2017-03-02     2
2017-03-17     2
2017-04-01     3
2017-04-16     3
2017-05-01     4
2017-05-16     4
2017-05-31     4
2017-06-15     5
2017-06-30     5
2017-07-15     6
2017-07-30     6
2017-08-14     7
2017-08-29     7
2017-09-13     8
2017-09-28     8
2017-10-13     9
2017-10-28     9
2017-11-12    10
2017-11-27    10
2017-12-12    11
2017-12-27    11
2018-01-11    12
2018-01-26    12
Freq: 15D, dtype: int32
-------------------------------------
2017-01-01    0.0
2017-02-15    NaN
2017-04-01    3.0
2017-05-16    NaN
2017-06-30    NaN
2017-08-14    NaN
2017-09-28    NaN
2017-11-12    NaN
2017-12-27    NaN
Freq: 45D, dtype: float64
