# Operating on Data：数值运算与通用函数

- 对于一元运算，通用函数将在输出结果中保留行索引和列标签；
- 对于二元运算，通用函数将会在自动对齐索引后进行运算。

In [2]:
import numpy as np
import pandas as pd

## 一. 一元运算——保留索引

In [4]:
df = pd.DataFrame(np.random.randint(0,100,(3,4)), columns=['A','B','C','D'])
df

Unnamed: 0,A,B,C,D
0,77,35,18,30
1,9,83,64,52
2,62,26,34,59


In [6]:
np.sin(df * np.pi / 4)

Unnamed: 0,A,B,C,D
0,-0.707107,0.707107,1.0,-1.0
1,0.707107,0.707107,-1.959435e-15,-1.960673e-15
2,-1.0,1.0,1.0,0.7071068


## 二. 二元运算——索引对齐

In [8]:
# Series
# 先进行索引合并操作，求索引的并集，再根据索引进行对齐，对齐后进行运算
area = pd.Series({'Alaska':1723337, 'Texas':695662, 'California':423967}, name = 'area')
population = pd.Series({'Alaska':38332521, 'Texas':26448193, 'New York':19651127}, name = 'population')
population / area

Alaska        22.243195
California          NaN
New York            NaN
Texas         38.018740
dtype: float64

In [10]:
# DataFrame
# 合并，对齐，运算
A = pd.DataFrame(np.random.randint(0,10,(2,3)), columns=list('ABD'))
B = pd.DataFrame(np.random.randint(0,10,(3,3)), columns=list('BCA'))
print(A)
print("="*20)
print(B)
print("="*20)
print(A+B)

   A  B  D
0  1  3  6
1  1  8  6
   B  C  A
0  5  8  5
1  3  3  1
2  3  4  2
     A     B   C   D
0  6.0   8.0 NaN NaN
1  2.0  11.0 NaN NaN
2  NaN   NaN NaN NaN


In [16]:
# 可以使用运算符的通用函数形式，设置fill_value参数：一方有值就不会NaN
A.add(B, fill_value=0)

Unnamed: 0,A,B,C,D
0,6.0,8.0,8.0,6.0
1,2.0,11.0,3.0,6.0
2,2.0,3.0,4.0,


## 三. Series和DataFrame的混合运算

DataFrame和Series的运算规则，与二维数组和一维数组的运算规则相同。

默认按行计算。需要按列计算，则需要利用运算符方法，设置axis参数，`axis=0`。