# 一、pd.TimeDelta

## 1 - TimeDelta基本概念

Timedelta在pandas中是一个表示两个datetime值之间的差(如日,秒和微妙)的类型,2个Datetime数据运算相减得出的结果就是一个Timedelta数据类型

Datetime只支持+操作,其余运算符操作不会报错

In [4]:
# 结果是一个Timedelta类型,并且算出了2019年9月4日到2018年1月日共有多少天
import pandas as pd
pd.to_datetime('2019-9-4') - pd.to_datetime('2018-1-1')

Timedelta('611 days 00:00:00')

In [5]:
# 如果只写年，默认一月一号
pd.to_datetime('2019-9-4') - pd.to_datetime('2018')

Timedelta('611 days 00:00:00')

In [6]:
# 如果只写年月，默认一号
pd.to_datetime('2019-9-4') - pd.to_datetime('2018-1')

Timedelta('611 days 00:00:00')

## 2 - Timedelta参数

### 通过字符串传递参数

In [7]:
pd.Timedelta('3 days 3 hours 3minutes 30 seconds')

Timedelta('3 days 03:03:30')

### 通过整数传递参数

In [9]:
pd.Timedelta(5, unit='d')

Timedelta('5 days 00:00:00')

# 通过数据偏移

In [11]:
pd.Timedelta(days = 2)

Timedelta('2 days 00:00:00')

## 3 - Timedelta简单运用

**计算1998年1月1日出生的人今年的年龄**

In [28]:
import datetime
age = (datetime.datetime.now() - pd.to_datetime('1998-1-1')) / pd.Timedelta(days=365)
print('实岁是{}岁'.format(int(age)))
print('虚岁是{}岁'.format(int(age)+1))

实岁是24岁
虚岁是25岁


**利用Timedelta筛选数据**

In [36]:
df = pd.read_excel('./file/message.xlsx')
df.消息发送时间 = pd.to_datetime(df['消息发送时间'])
df[(datetime.datetime.now() - df['消息发送时间']) <= pd.Timedelta(days=45)]

Unnamed: 0,消息内容,会话ID,消息发送时间,经销商,发送方
0,亲 在吗\t\n,1,2022-08-05 14:33:48,佩戴,用户
1,您好，欢迎光临 Apple 授权专营店，很高兴为您服务！\n\niPhone 13 系列领券...,1,2022-08-05 14:33:53,佩戴,商家
2,请问有什么可以帮您？\t\n,1,2022-08-05 14:34:00,佩戴,商家
3,现在购机，有送什么东西嘛\t\n,1,2022-08-05 14:34:11,佩戴,用户
4,您好，iPhone 官方标配的清单：iPhone 手机*1个、USB-C 转闪电连接线*1条...,1,2022-08-05 14:34:22,佩戴,商家
...,...,...,...,...,...
524,头用别的快充头可以么？\t\n,6474,2022-08-06 07:59:32,英龙,用户
525,这款充电套装还包括一个20W的充电头的。\t\n,6474,2022-08-06 07:59:37,英龙,商家
526,建议您使用原装充电器。\t\n,6474,2022-08-06 07:59:45,英龙,商家
527,这个送一个头呗！\t\n,6474,2022-08-06 07:59:52,英龙,用户


# 二、iterrows()、items()、itertuples()

## 1 - iteritems() / items()

遍历 DataFrame 成(column name, Series)对.

- column name——被遍历 DataFrame对象的列标签.

- Series——以index为index，以该列内容为data.

返回值:(column name, Series)对.


In [87]:
data = df.loc[:, ['会话ID', '经销商', '发送方']].head(3)
for key,value in data.items():
    print(key)
    print(value, '\n')

会话ID
0    1
1    1
2    1
Name: 会话ID, dtype: int64 

经销商
0    佩戴
1    佩戴
2    佩戴
Name: 经销商, dtype: object 

发送方
0    用户
1    商家
2    商家
Name: 发送方, dtype: object 



## 2 - iterrows()

遍历 DataFrame 成(index, Series)对.

- index——被遍历 DataFrame对象的行标签.
- Series——以columns为index，以该行内容为data.

返回值：(index, Series)对.

In [72]:
data = df.loc[:, ['会话ID', '经销商', '发送方']].head(3)
for key,value in data.iterrows():
    print(key)
    print(value, '\n')

0
会话ID     1
经销商     佩戴
发送方     用户
Name: 0, dtype: object 

1
会话ID     1
经销商     佩戴
发送方     商家
Name: 1, dtype: object 

2
会话ID     1
经销商     佩戴
发送方     商家
Name: 2, dtype: object 



In [85]:
# 对于每一行，通过列名访问对应的元素
data = df.loc[:, ['会话ID', '经销商', '发送方']].head(3)
for key,value in data.iterrows():
    print(key, value.经销商, value.发送方)

0 佩戴 用户
1 佩戴 商家
2 佩戴 商家


**注意：同一个Series中的元素类型应该相等，而iterrows()函数将同行不同列的数据放在一个Series中。我们知道不同列的数据不一定相等，因此在这过程中itrrows()会自动转变元素类型或者报错。**

## 3 - itertuples

遍历 DataFrame 成Pandas(Index=‘ ’, label1=' ', label2=' ',...)具名元组对.

- Index——行标签.
- label1…——列标签.
- ' '——DataFrame中对应的值 .

itertuples(index=true, name='Xxx')

index——默认为true, 当指定为False时,输出Pandas(label1=' ', label2=' ',…),即去掉具名元组第一个index=' '元素.

name——指定具名元组名称，指定后输出为Xxx(Index=‘ ’, label1=' ', label2=' ',…)

In [78]:
for row in data.itertuples():
    print(row, type(row))
    print(row.经销商)

Pandas(Index=0, 会话ID=1, 经销商='佩戴', 发送方='用户') <class 'pandas.core.frame.Pandas'>
佩戴
Pandas(Index=1, 会话ID=1, 经销商='佩戴', 发送方='商家') <class 'pandas.core.frame.Pandas'>
佩戴
Pandas(Index=2, 会话ID=1, 经销商='佩戴', 发送方='商家') <class 'pandas.core.frame.Pandas'>
佩戴


In [88]:
for row in data.itertuples(index=False, name = 'test'):
    print(row, type(row))

test(会话ID=1, 经销商='佩戴', 发送方='用户') <class 'pandas.core.frame.test'>
test(会话ID=1, 经销商='佩戴', 发送方='商家') <class 'pandas.core.frame.test'>
test(会话ID=1, 经销商='佩戴', 发送方='商家') <class 'pandas.core.frame.test'>


In [93]:
for row in data.itertuples():
    print(getattr(row, '会话ID'), getattr(row, '经销商'), getattr(row, '发送方'))

1 佩戴 用户
1 佩戴 商家
1 佩戴 商家


## 4 - getattr()

getattr() 函数用于返回一个对象属性值。

getattr(object, name[, default])

参数:
- object -- 对象。
- name -- 字符串，对象属性。
- default -- 默认返回值，如果不提供该参数，在没有对应属性时，将触发 AttributeError。

返回值: 返回对象属性值。

In [94]:
class Person(object):
    age = 18
    gender = 'male'

Tom = Person()
age = getattr(Tom, 'age')
print(age)

18
