### NumPy中的通用函数（逐元素数组方法）对pandas对象也有效

In [1]:
import pandas as pd
import numpy as np

In [3]:
frame = pd.DataFrame(np.random.randn(4,3),columns=list('bde'),index=['Utah','Ohio','Texas','Oregon'])
print(frame)

               b         d         e
Utah   -0.733182  2.065104  1.342112
Ohio    0.693093 -0.600856 -1.471940
Texas   0.538751  0.102787  1.173020
Oregon  1.514599 -0.632544 -0.926311


In [4]:
print(np.abs(frame))

               b         d         e
Utah    0.733182  2.065104  1.342112
Ohio    0.693093  0.600856  1.471940
Texas   0.538751  0.102787  1.173020
Oregon  1.514599  0.632544  0.926311


### apply方法

In [5]:
f = lambda x: x.max() - x.min()

result = frame.apply(f)
print(result)

b    2.247781
d    2.697647
e    2.814052
dtype: float64


默认计算的是每一列的结果，若要计算每一行的结果，须显式指定

In [7]:
result = frame.apply(f,axis='columns')
print(result)

Utah      2.798285
Ohio      2.165033
Texas     1.070233
Oregon    2.440911
dtype: float64


f也可以返回带有多个值的Series

In [8]:
def f(x):
    return pd.Series([x.min(),x.max()], index = ['min','max'])

result = frame.apply(f)
print(result)

            b         d         e
min -0.733182 -0.632544 -1.471940
max  1.514599  2.065104  1.342112


### applymap方法
+ 只允许传入一个参数的函数作为map方法的参数

In [9]:
format = lambda x: '%.2f' %x

print(frame.applymap(format))

            b      d      e
Utah    -0.73   2.07   1.34
Ohio     0.69  -0.60  -1.47
Texas    0.54   0.10   1.17
Oregon   1.51  -0.63  -0.93


### Series的map方法
+ 只允许传入一个参数的函数作为map方法的参数

In [11]:
print(frame['e'].map(format))

Utah       1.34
Ohio      -1.47
Texas      1.17
Oregon    -0.93
Name: e, dtype: object


### 总结
1. Series的map方法
+ 将Series中的每个单元格依次使用指定函数
+ map使用的函数只能有一个参数x

2. Series的apply和DataFrame的apply方法
+ Series的apply可以使用带多个参数的函数
+ DataFrame的apply可以使用带多个参数的函数
+ DataFrame使用apply方法时的默认参数为Series

3. DataFrame的applymap方法
+ 逐元素
+ 只能有一个参数

[Pandas教程 | 数据处理三板斧——map、apply、applymap详解](https://zhuanlan.zhihu.com/p/100064394)