# Time Series（时间序列）
*参考了《利用python进行数据分析》*
- Timestamps（时间戳），具体的某一个时刻
- Fixed periods（固定的时期），比如2007年的一月，或者2010年整整一年
- Intervals of time（时间间隔），通常有一个开始和结束的时间戳。Periods（时期）可能被看做是Intervals（间隔）的一种特殊形式。

### Python中的日期时间
python有标准包用来表示时间和日期数据。datetime, time, calendar，这些模块经常被使用。datetime.datetime类型，或简单写为datetime，被广泛使用：

In [1]:
from datetime import datetime
now = datetime.now()
now

datetime.datetime(2018, 7, 6, 10, 1, 40, 71407)

In [2]:
now.year,now.month,now.day

(2018, 7, 6)

datetime能保存日期和时间到微妙级别。timedelta表示两个不同的datetime对象之间的时间上的不同：

In [3]:
delta = datetime(2011, 1, 7) - datetime(2008, 6, 24, 8, 15)
delta

datetime.timedelta(926, 56700)

timedelta只有（天）和（秒）两种单位，我们可以在一个datetime对象上，添加或减少一个或多个timedelta，这样可以产生新的变化后的对象：

In [4]:
from datetime import timedelta
start = datetime(2011, 1, 7)
start + timedelta(12)

datetime.datetime(2011, 1, 19, 0, 0)

### 字符串与时间的转换
使用str或strftime方法，传入一个特定的时间格式就能把时间类型转为文本类型：

In [5]:
stamp = datetime(2011, 1, 3)
str(stamp)

'2011-01-03 00:00:00'

In [6]:
stamp.strftime('%Y-%m-%d')

'2011-01-03'

下表是关于日期时间类型的格式：

![](source/datetime_format.png)
![](source/datetime_format2.png)

我们可以利用上面的format codes（格式码；时间日期格式）把字符串转换为日期，这要用到datetime.strptime:

In [7]:
value = '2011-01-03'
datetime.strptime(value, '%Y-%m-%d')

datetime.datetime(2011, 1, 3, 0, 0)

### Pandas中的日期时间
pandas中日期类型与python中是一样的，一般是datetime.datetime类型

In [8]:
import pandas as pd
df1 = pd.Series(pd.date_range('20180126','20180204'))
df1

0   2018-01-26
1   2018-01-27
2   2018-01-28
3   2018-01-29
4   2018-01-30
5   2018-01-31
6   2018-02-01
7   2018-02-02
8   2018-02-03
9   2018-02-04
dtype: datetime64[ns]

在pandas中，文本转时间用pandas.to_datetime(Series)，传入的是一个类时间的文本Series，返回一个时间Series

In [9]:
ts_txt = pd.Series(['20180101','20180102','20180303','20180505'])
ts_txt

0    20180101
1    20180102
2    20180303
3    20180505
dtype: object

pd.to_datetime()，可以把常见的时间格式字符串转为时间，无需指定

In [10]:
ts = pd.to_datetime(ts_txt)
ts

0   2018-01-01
1   2018-01-02
2   2018-03-03
3   2018-05-05
dtype: datetime64[ns]

当然，也可以按照字符串的特定格式进行时间转换

In [11]:
ts = pd.to_datetime(ts_txt,format='%Y%m%d')
ts

0   2018-01-01
1   2018-01-02
2   2018-03-03
3   2018-05-05
dtype: datetime64[ns]

在pandas中，时间转字符串使用Series.dt.strftime()

In [12]:
text = ts.dt.strftime('%Y-%m-%d')
text

0    2018-01-01
1    2018-01-02
2    2018-03-03
3    2018-05-05
dtype: object

通过TimeSeries.dt的属性year、month、day、weekday等直接得到整数

In [13]:
ts.dt.weekday

0    0
1    1
2    5
3    5
dtype: int64