# 日期和时间数据类型

Python标准库包含了日期和时间数据的数据类型，datetime模块是开始处理时间数据最广泛的。

## datetime的日期和时间数据类型

下面我们先简单的了解下python日期和时间数据类型。

datetime是一个关于时间的库，常用的类有：


| 类型     | 说明                                 |
| -------- | ------------------------------------ |
| date     | 以公历形式存储日历日期（年、月、日） |
| time     | 将时间存储为时、分、秒               |
| datetime | 存储日期和时间                       |



### datetime各个类型的创建和获取

#### 日期(date)类型的使用：

In [9]:
# 导入datetime模块
import datetime
# 创建日期
date = datetime.date(2019, 9, 9)
print(date)
# 获取年
print(date.year)
# 获取月
print(date.month)
# 获取日
print(date.day)

2019-09-09
2019
9
9


#### 时间(time)类型的使用:

In [4]:
# 创建时间
import datetime
time = datetime.time(13, 14, 20)
print(time)
# 获取小时
print(time.hour)
# 获取分钟
print(time.minute)
# 获取秒
print(time.second)

13:14:20
13
14
20


#### **日期和时间的结合体--日期时间(datetime)：**

In [5]:
import datetime
# 创建日期时间
datetime = datetime.datetime(2019, 9, 9, 13, 14, 20)
print(datetime)
# 获取年
print(datetime.year)
# 获取月
print(datetime.month)
# 获取日
print(datetime.day)
# 获取小时
print(datetime.hour)
# 获取分钟
print(datetime.minute)
# 获取秒
print(datetime.second)

2019-09-09 13:14:20
2019
9
9
13
14
20


datetime的time方法可以创建时间，date方法可以创建日期，datetime方法则是日期和时间的结合体。

同过`year`、`month`、`day`、`hour`、`minute`、`second`属性，可以获取到相应的日期或者时间的值。

同样，使用`datetime.datetime.now()`方法可以获取到当前时间：

In [10]:
datetime.datetime.now()

datetime.datetime(2020, 3, 16, 18, 27, 7, 273628)

### datetime与字符串转换

In [12]:
import datetime
date_time = datetime.datetime(2019, 9, 9, 13, 14, 20)
print(type(date_time))
str_date_time = str(date_time)
print(str_date_time)
print(type(str_date_time))


# 需要注意的是它的类型是datetime，并不是str
# 如果我们只是单一的想改变类型，就可以使用强制类型转换：

<class 'datetime.datetime'>
2019-09-09 13:14:20
<class 'str'>


In [13]:
# 将`datetime.datetime(2019, 9, 9, 13, 14, 20)`转换成`9/9/2019 13:14`样式的字符串
import datetime
date_time = datetime.datetime(2019, 9, 9, 13, 14, 20)
str_time = date_time.strftime('%m/%d/%Y %H:%M')
str_time

'09/09/2019 13:14'

In [1]:
import datetime
strp = datetime.datetime.strptime('Aug-23-19 20:13', '%b-%d-%y %H:%M')
print(strp)

2019-08-23 20:13:00


## Pandas时间序列基础

#### 创建一个时间范围

使用Pandas的`date_range()`方法可以快速创建出一个日期范围。

In [18]:
import pandas as pd
# pd.date_range(start=None,end=None,periods=None,freq="D")

DatetimeIndex(['2019-05-05', '2019-05-06', '2019-05-07', '2019-05-08',
               '2019-05-09', '2019-05-10', '2019-05-11', '2019-05-12',
               '2019-05-13', '2019-05-14', '2019-05-15', '2019-05-16',
               '2019-05-17', '2019-05-18', '2019-05-19', '2019-05-20',
               '2019-05-21', '2019-05-22', '2019-05-23', '2019-05-24',
               '2019-05-25', '2019-05-26', '2019-05-27', '2019-05-28',
               '2019-05-29', '2019-05-30', '2019-05-31', '2019-06-01',
               '2019-06-02', '2019-06-03', '2019-06-04', '2019-06-05',
               '2019-06-06'],
              dtype='datetime64[ns]', freq='D')

`start`:日期范围的开始

`end`:日期范围的结束

`periods`:固定日期的个数

`freq`:日期偏移量，取值为string, 默认为'D'，即：一天为日期偏移量

In [20]:
# 使用`start`和`end`以及默认的`freq`参数创建：
date= pd.date_range(start='20190505',end='20190606')
date

DatetimeIndex(['2019-05-05', '2019-05-06', '2019-05-07', '2019-05-08',
               '2019-05-09', '2019-05-10', '2019-05-11', '2019-05-12',
               '2019-05-13', '2019-05-14', '2019-05-15', '2019-05-16',
               '2019-05-17', '2019-05-18', '2019-05-19', '2019-05-20',
               '2019-05-21', '2019-05-22', '2019-05-23', '2019-05-24',
               '2019-05-25', '2019-05-26', '2019-05-27', '2019-05-28',
               '2019-05-29', '2019-05-30', '2019-05-31', '2019-06-01',
               '2019-06-02', '2019-06-03', '2019-06-04', '2019-06-05',
               '2019-06-06'],
              dtype='datetime64[ns]', freq='D')

In [22]:
# 使用`start`和`end`以及频率参数`freq`为10天创建：
date= pd.date_range(start='20190505',end='20190606',freq="10D")
# start和end以及freq配合能够生成start和end范围内以频率freq的一组时间索引。
date

DatetimeIndex(['2019-05-05', '2019-05-15', '2019-05-25', '2019-06-04'], dtype='datetime64[ns]', freq='10D')

In [30]:
# 使用`start`和`periods`以及默认的频率参数创建：
date= pd.date_range(start='20190505',periods=10,freq="D")
# start和periods以及freq配合能够生成从start开始的频率为freq的periods个时间索引。
date

DatetimeIndex(['2019-05-05', '2019-05-06', '2019-05-07', '2019-05-08',
               '2019-05-09', '2019-05-10', '2019-05-11', '2019-05-12',
               '2019-05-13', '2019-05-14'],
              dtype='datetime64[ns]', freq='D')

根据上面的运行结果可以得出以下结论：

>`start`和`end`以及`freq`配合能够生成start和end范围内以频率freq的一组时间索引。
>
>`start`和`periods`以及`freq`配合能够生成从`start`开始的频率为`freq`的`periods`个时间索引。

In [None]:
上面我们提到时间索引，是因为`date_range()`方法生成的对象类型是`DatetimeIndex`，这个类型就是pandas中的时间索引类型。

### 在数据中索引和切片时间序列数据

In [None]:
有时候我们会对一天或者一个月的数据进行分析，这就需要我们将时间设置成数据的索引，然后通过时间索引获取到一定时间范围内的数据进行分析。

现在我们创建一个以时间序列为索引的Series数据。

首先，使用`pd.date_range()`来创建从`2019-01-01`开始的时间索引：

In [24]:
import pandas as pd
time_index = pd.date_range('2019-01-01', periods=365)
time_index

DatetimeIndex(['2019-01-01', '2019-01-02', '2019-01-03', '2019-01-04',
               '2019-01-05', '2019-01-06', '2019-01-07', '2019-01-08',
               '2019-01-09', '2019-01-10',
               ...
               '2019-12-22', '2019-12-23', '2019-12-24', '2019-12-25',
               '2019-12-26', '2019-12-27', '2019-12-28', '2019-12-29',
               '2019-12-30', '2019-12-31'],
              dtype='datetime64[ns]', length=365, freq='D')

In [None]:
最后，创建出以时间序列为索引的Series数据，运行下方代码，查看数据：

In [25]:
import pandas as pd
import numpy as np
time_index = pd.date_range('2019-01-01', periods=400)
time_data = np.random.randint(100,size=400)
date_time = pd.Series(data=time_data,index=time_index)
date_time

2019-01-01     5
2019-01-02    97
2019-01-03    76
2019-01-04     6
2019-01-05    27
              ..
2020-01-31    23
2020-02-01    60
2020-02-02    70
2020-02-03    20
2020-02-04    26
Freq: D, Length: 400, dtype: int64

In [26]:
# 可以依据年份进行索引
date_time['2020']

2020-01-01    31
2020-01-02    83
2020-01-03    77
2020-01-04    12
2020-01-05    52
2020-01-06    93
2020-01-07    38
2020-01-08    75
2020-01-09    17
2020-01-10    34
2020-01-11    18
2020-01-12    32
2020-01-13     0
2020-01-14     8
2020-01-15    75
2020-01-16    10
2020-01-17     0
2020-01-18    60
2020-01-19    40
2020-01-20    48
2020-01-21    97
2020-01-22    17
2020-01-23    45
2020-01-24    52
2020-01-25    45
2020-01-26    22
2020-01-27    89
2020-01-28    37
2020-01-29    85
2020-01-30    49
2020-01-31    23
2020-02-01    60
2020-02-02    70
2020-02-03    20
2020-02-04    26
Freq: D, dtype: int64

In [27]:
# 可以依据年和月进行索引：
date_time['2019-10']

2019-10-01    83
2019-10-02    51
2019-10-03    85
2019-10-04    87
2019-10-05    15
2019-10-06    35
2019-10-07    34
2019-10-08    47
2019-10-09    73
2019-10-10     6
2019-10-11     2
2019-10-12    30
2019-10-13    88
2019-10-14    83
2019-10-15    86
2019-10-16    89
2019-10-17    47
2019-10-18    40
2019-10-19    14
2019-10-20    25
2019-10-21    43
2019-10-22    51
2019-10-23     1
2019-10-24    24
2019-10-25    25
2019-10-26     3
2019-10-27    31
2019-10-28    21
2019-10-29    95
2019-10-30    48
2019-10-31    94
Freq: D, dtype: int64

In [28]:
# 可以使用时间戳进行切片获取数据
date_time['2019-10-05':'2019-10-10']

2019-10-05    15
2019-10-06    35
2019-10-07    34
2019-10-08    47
2019-10-09    73
2019-10-10     6
Freq: D, dtype: int64

### to_datetime改变时间格式

有的时候用csv导入到时间数据时，默认的是字符串的数据类型 ，当可视化的时候，会出现没有按时间先后顺序的方式绘图 ，所以需要将字符串解析为时间类型的数据类型。   

使用Pandas的`to_datetime()`方法可以将字符串形式的日期转换成时间格式。


```python
pd.to_datetime(arg,format=None)
```

> arg：需要修改的数据
>
> format：数据的格式

`to_datetime()`方法会将字符串类型的是时间转换成`Timestamp('2019-10-05 00:00:00')`时间戳类型。

```python
pd.to_datetime('2019-10-05')
```

如果想对时间格式修改，还可以使用`to_pydatetime()`方法将`Timestamp`类型转换成datetime类型。

```python
pd.to_datetime('2019-10-05').to_pydatetime()
```

需要注意的是字符串日期中包含中文，我们可以这样处理：

```python
pd.to_datetime('2019年10月10日',format='%Y年%m月%d日')
```

请抄写上面代码到代码框，并运行。