# 处理时间序列
本节将介绍的日期与时间数据主要包含三类：
- **时间戳**表示某个具体的时间点（例如 2015 年 7 月 4 日上午 7 点）。
- **时间间隔**与**周期**表示开始时间点与结束时间点之间的时间长度，例如 2015 年（指的是2015 年 1 月 1 日至 2015 年 12 月 31 日这段时间间隔）。周期通常是指一种特殊形式的时间间隔，每个间隔长度相同，彼此之间不会重叠（例如，以 24 小时为周期构成每一天）。
- **时间增量**（time delta）或**持续时间**（duration）表示精确的时间长度（例如，某程序运行持续时间 22.56 秒）。

在开始介绍 Pandas 的时间序列工具之前，我们先简单介绍一下 Python 处理日期与时间数据的工具。在介绍完一些值得深入学习的资源之后，再通过一些简短的示例来演示 Pandas 处理时间序列数据的方法。
## Python的日期与时间工具
### 原生Python的日期与时间工具： datetime与dateutil
用 datetime 类型创建一个日期：

In [1]:
from datetime import datetime
datetime(year=2015,month=7,day=4)

datetime.datetime(2015, 7, 4, 0, 0)

或者使用 dateutil 模块对各种字符串格式的日期进行正确解析：

In [3]:
from dateutil import parser
date=parser.parse("4th of July ,2015")
date

datetime.datetime(2015, 7, 4, 0, 0)

一旦有了 datetime 对象，就可以进行许多操作了，例如打印出这一天是星期几：

In [4]:
date.strftime('%A')

'Saturday'

### NumPy的datetime64类型
Python 原生日期格式的性能弱点促使 NumPy 团队为 NumPy 增加了自己的时间序列类型。datetime64 类型将日期编码为 64 位整数，这样可以让日期数组非常紧凑（节省内存）。datetime64 需要在设置日期时确定具体的输入类型：

In [8]:
import numpy as np
date=np.array('2015-07-04',dtype=np.datetime64)
date

array('2015-07-04', dtype='datetime64[D]')

但只要有了这个日期格式，就可以进行快速的向量化运算：

In [9]:
date + np.arange(12)

array(['2015-07-04', '2015-07-05', '2015-07-06', '2015-07-07',
       '2015-07-08', '2015-07-09', '2015-07-10', '2015-07-11',
       '2015-07-12', '2015-07-13', '2015-07-14', '2015-07-15'],
      dtype='datetime64[D]')

### Pandas的日期与时间工具： 理想与现实的最佳解决方案
Pandas 所有关于日期与时间的处理方法全部都是通过 Timestamp 对象实现的，它利用numpy.datetime64 的有效存储和向量化接口将 datetime 和 dateutil 的易用性有机结合起来。 Pandas 通过一组 Timestamp 对象就可以创建一个可以作为 Series 或DataFrame 索引的DatetimeIndex，我们将在后面介绍许多类似的例子。

In [10]:
import pandas as pd
date=pd.to_datetime("4th of July,2015")
date

  return f(*args, **kwds)


Timestamp('2015-07-04 00:00:00')

In [11]:
date.strftime('%A')

'Saturday'

另外，也可以直接进行 NumPy 类型的向量化运算：

In [12]:
date + pd.to_timedelta(np.arange(12), 'D')

DatetimeIndex(['2015-07-04', '2015-07-05', '2015-07-06', '2015-07-07',
               '2015-07-08', '2015-07-09', '2015-07-10', '2015-07-11',
               '2015-07-12', '2015-07-13', '2015-07-14', '2015-07-15'],
              dtype='datetime64[ns]', freq=None)

## Pandas时间序列： 用时间作索引
略