# Pandas 函数应用

要将自定义或其他库的函数应用于 Pandas 对象, 有三个重要的方法，使用适当的方法取决于函数是否期望在整个 DataFrame 行、列或者元素上进行操作:

* 表合理函数应用:    pipe()
* 行或列函数应用:    apply()
* 元素函数应用:     applymap()

## 表格函数应用

可以通过将函数和适当数量的参数作为管道参数来执行自定义操作，因此对整个 DataFrame 执行操作，例如，为 DataFrame 中的所有元素相加一个值 2

In [1]:
import pandas as pd
import numpy as np


def adder(ele1, ele2):
    return ele1 + ele2

df = pd.DataFrame(np.random.randn(5, 3), columns=['col1', 'col2', 'col3'])
print(df)
df = df.pipe(adder, 2)
print(df)

       col1      col2      col3
0 -0.744406 -1.480289 -0.549523
1 -0.262307 -0.016121  0.407935
2  0.287441 -0.987571  0.725954
3  0.454443  1.299055 -0.074936
4  1.350927 -0.069097  1.070872
       col1      col2      col3
0  1.255594  0.519711  1.450477
1  1.737693  1.983879  2.407935
2  2.287441  1.012429  2.725954
3  2.454443  3.299055  1.925064
4  3.350927  1.930903  3.070872


## 行或列合理函数应用

可以使用 apply() 方法沿 DataFrame 或 Panel 的轴应用任意函数， 它与描述性统计方法一样，采用 axis 参数，默认按照列执行，将每列列为数组。

In [2]:
print(df.apply(np.mean))
print(df.apply(np.mean, axis=1))
print(df.apply(lambda x: x.max() - x.min()))

col1    2.217219
col2    1.749195
col3    2.316060
dtype: float64
0    1.075261
1    2.043169
2    2.008608
3    2.559520
4    2.784234
dtype: float64
col1    2.095333
col2    2.779343
col3    1.620395
dtype: float64


## 元素合理函数应用

并不是所有的函数都可以向量化， 在 DataFrame 上的方法 applymap() 和类似于在 Series上的 map() 接收任何 Python 函数，并返回单个值

In [4]:
df = pd.DataFrame(np.random.randn(5, 3), columns=['col1', 'col2', 'col3'])
df = df['col1'].map(lambda x: x * 100)
print(df)

0    -65.423266
1     85.063382
2    -48.560126
3    139.818214
4    111.048050
Name: col1, dtype: float64


In [5]:
df = pd.DataFrame(np.random.randn(5, 3), columns=['col1', 'col2', 'col3'])
df = df.applymap(lambda x: x*100)
print(df)

         col1        col2        col3
0  146.237512   26.736371  -97.518660
1   12.868408  127.739031 -142.168787
2  139.832472 -122.824015   21.665961
3  -31.560550 -145.662095   32.920396
4   46.261164 -163.168638   52.012410
