# `Pandas` - 3
<div>
<img src='https://pandas.pydata.org/static/img/pandas.svg' width='400'/>
</div>

-----------------
主讲人：李显祥

大气科学学院

In [1]:
import pandas as pd
import numpy as np

## 7. 时间序列

### 7.1 `Python` 时间相关模块

时间是一个很重要的物理量。`Python` 中提供了多个关于时间的模块。

- `time`

- `datetime`

- `calendar`

- ...

#### `time` 模块

- `time` 模块是 `Python` 标准库的一部分，它提供了对 Unix 的时间戳（timestamp）的封装，是操作系统平台相关的。

- 时间戳是从协调世界时（UTC, Universal Time Coordinated）1970年1月1日0时0分0秒开始到现在的总秒数，不考虑闰秒。只能表示1970-2038年。

- 该模块主要包括一个类 `struct_time`，另外其他几个函数及相关常量。

- `struct_time` 形式为 `(tm_year, tm_mon, tm_mday, tm_hour, tm_min, tm_sec, tm_wday, tm_yday, tm_isdst1)`

In [2]:
import time

In [3]:
time.time()   #返回的是时间戳

1606899102.264077

In [4]:
time.ctime()  #返回字符串形式的时间，可以传入时间戳格式时间，用来做转化

'Wed Dec  2 16:51:42 2020'

In [5]:
time.localtime()  #返回当前时间的struct_time形式，可传入时间戳格式时间，用来做转化

time.struct_time(tm_year=2020, tm_mon=12, tm_mday=2, tm_hour=16, tm_min=51, tm_sec=42, tm_wday=2, tm_yday=337, tm_isdst=0)

In [6]:
time.gmtime()  #返回当前时间的 struct_time 形式，对应 UTC时区(0时区， GMT+0) ，可传入时间戳格式时间，用来做转化

time.struct_time(tm_year=2020, tm_mon=12, tm_mday=2, tm_hour=8, tm_min=51, tm_sec=42, tm_wday=2, tm_yday=337, tm_isdst=0)

时间格式的相互转化

- `time.mktime()` 将一个以 `struct_time` 格式转换为时间戳

In [7]:
time.mktime(time.localtime())

1606899102.0

- `time.strftime(format[,t])` 把一个 `struct_time` 时间转化为格式化的时间字符串。如果 `t` 未指定，将传入 `time.localtime()`。

In [8]:
time.strftime("%a %Y-%m-%d %H:%M:%S", time.localtime())

'Wed 2020-12-02 16:51:42'

时间转换的 `format` 参数：

- %c 本地相应的日期和时间表示
- %x 本地相应日期
- %X 本地相应时间
- %y 去掉世纪的年份（00 – 99）
- **%Y 完整的年份**
- **%m 月份（01 – 12）**
- %b 本地简化月份名称
- %B 本地完整月份名称
- **%d 一个月中的第几天（01 – 31）**
- **%j 一年中的第几天（001 – 366）**
- %U 一年中的星期数。（00 – 53，星期天是一个星期的开始）第一个星期天之前的所有天数都放在第0周。
- %W 和 %U 基本相同，不同的是 %W 以星期一为一个星期的开始。
- %w 一个星期中的第几天（0 – 6，0是星期天）
- %a 本地（locale）简化星期名称
- %A 本地完整星期名称
- **%H 一天中的第几个小时（24小时制，00 – 23）**
- %I 第几个小时（12小时制，01 – 12）
- %p 本地 am 或者 pm 的相应符，“%p” 只有与 “%I” 配合使用才有效果。
- **%M 分钟数（00 – 59）**
- **%S 秒（01 – 61），文档中强调确实是0 – 61，而不是59，闰年秒占两秒**
- %Z 时区的名字（如果不存在为空字符）
- %% ‘%’字符

- `time.strptime(string[,format])` 把一个格式化时间字符串转化为 `struct_time`，是 `strftime()` 的逆操作。

In [9]:
time.strptime('20201203T162000','%Y%m%dT%H%M%S')

time.struct_time(tm_year=2020, tm_mon=12, tm_mday=3, tm_hour=16, tm_min=20, tm_sec=0, tm_wday=3, tm_yday=338, tm_isdst=-1)

计时器功能

- `time.sleep(secs)`: 线程推迟指定的时间运行，单位为秒。
    
- `time.clock()`: 在不同的系统上含义不同。
    - 在 UNIX 系统上，它返回的是“进程时间”，它是用秒表示的浮点数（时间戳）。
    - 在 WINDOWS 中，第一次调用，返回的是进程运行的实际时间。而第二次之后的调用是自第一次调用以后到现在的运行时间。

-  因此，从 Python 3.3 开始，time.clock 就不建议使用了，并且在 Python 3.8 里删除了；建议使用 `time.perf_counter` 
或者`time.process_time`。
-  两者返回值都以秒为单位，需要连续两次调用用来获得一个操作所消耗的时间。区别是 `time.perf_counter` 
包括 `time.sleep` 的时间，而 `time.process_time` 则不包括。

In [10]:
time.sleep(1)
print("clock1: %s" % time.clock())
time.sleep(1)
print("clock2: %s" % time.clock())
print("clock2_perf: %s" % time.perf_counter())
print("clock2_process: %s" % time.process_time())
time.sleep(1)
print("clock3_perf: %s" % time.perf_counter())
print("clock3_process: %s" % time.process_time())

  


clock1: 0.837222


  after removing the cwd from sys.path.


clock2: 0.838915
clock2_perf: 3.421592317
clock2_process: 0.839297
clock3_perf: 4.422871397
clock3_process: 0.84163


#### `datetime` 模块

- `datetime` 模块是 `time` 模块的高级包装，提供了更多实用的函数。

- `Pandas` 的时间相关功能基本上来自 `datetime` 模块

- `datetime` 模块定义了下面这几个类：

  - `date`：表示日期的类。常用的属性有 `year`, `month`, `day`
  - `time`：表示时间的类。常用的属性有 `hour`, `minute`, `second`, `microsecond`
  - `datetime`：表示日期时间
  - `timedelta`：表示时间间隔，即两个时间点之间的长度
  - `tzinfo`：与时区有关的相关信息
  
注：上面这些类型的对象都是不可变（immutable）的。

In [11]:
import datetime as dt
dt.date.today(), dt.date(2020,12,1).year, dt.date(2020,12,1).month, dt.date(2020,12,1).day

(datetime.date(2020, 12, 2), 2020, 12, 1)

In [12]:
dt.date(2020,12,1).weekday(), dt.date(2020,12,1).isoweekday()

(1, 2)

In [13]:
day1 = dt.date(2020,12,1)
day2 = dt.date.today()
day1 > day2

False

In [14]:
dt.datetime.today() #datetime.datetime(year, month, day[, hour[, minute[, second[, microsecond[, tzinfo]]]]])

datetime.datetime(2020, 12, 2, 16, 51, 45, 342633)

In [15]:
dt.datetime.utcnow()

datetime.datetime(2020, 12, 2, 8, 51, 45, 347585)

In [16]:
day2 - day1

datetime.timedelta(days=1)

`timedelta` 类

`class datetime.timedelta([days[, seconds[, microseconds[, milliseconds[, minutes[, hours[, weeks]]]]]]])`

In [18]:
dt.timedelta(10)

datetime.timedelta(days=10)

In [20]:
dt.date.today() + dt.timedelta(days=30)

datetime.date(2021, 1, 1)

In [21]:
dt.datetime.now() + dt.timedelta(hours=100)

datetime.datetime(2020, 12, 6, 21, 13, 7, 81153)

### 7.2 `Pandas` 时间相关功能

## References

1.[https://www.biaodianfu.com/python-datetime.html](https://www.biaodianfu.com/python-datetime.html)

2.[https://pandas.pydata.org/pandas-docs/stable/user_guide](https://pandas.pydata.org/pandas-docs/stable/user_guide)

3.[https://github.com/datawhalechina/joyful-pandas](https://github.com/datawhalechina/joyful-pandas/tree/master/data)

4.[https://github.com/hangsz/pandas-tutorial](https://github.com/hangsz/pandas-tutorial)