## pct_change() 函数

Series、DataFrame和Panel 都有 pct_change() 函数，此函数将每个元素与其前一个元素进行比较，并计算变化百分比。 默认情况下， pct_change() 对列进行操作，如果想应用到行上，使用 axis=1 参数.

In [1]:
import pandas as pd
import numpy as np

s = pd.Series([1, 2, 3, 4, 5, 4])
print(s.pct_change())

df = pd.DataFrame(np.random.randn(5, 2))
print(df.pct_change())

0         NaN
1    1.000000
2    0.500000
3    0.333333
4    0.250000
5   -0.200000
dtype: float64
          0         1
0       NaN       NaN
1 -0.093916 -4.787724
2 -1.405140 -0.677258
3  1.746221 -2.421172
4 -1.435947  0.326344


## 协方差

协方差适用于 Series 数据， Series 对象有一个方法 cov 用来计算序列对象之间的协方差， NA 将被自动排除

In [2]:
s1 = pd.Series(np.random.randn(10))
s2 = pd.Series(np.random.randn(10))
print(s1.cov(s2))

0.6101319754689493


当应用于 DataFrame 时， 协方差计算所有列之间的协方差 cov 的值

In [3]:
frame = pd.DataFrame(np.random.randn(10, 5), columns=list('abcde'))
print(frame['a'].cov(frame['b']))
print(frame.cov())

0.19657294262584402
          a         b         c         d         e
a  1.176622  0.196573 -0.486494 -0.187955  0.437149
b  0.196573  1.044610 -0.344721  0.581952  0.864238
c -0.486494 -0.344721  0.647093 -0.152837 -0.571621
d -0.187955  0.581952 -0.152837  0.815126  0.472174
e  0.437149  0.864238 -0.571621  0.472174  1.488120


## 相关性

相关性显示了任何两个数值(Series)之间的线性关系，有多种方法来计算，pearson(默认)、spearman 和 kendall 之间的相关性

In [4]:
print(frame['a'].corr(frame['b']))
print(frame.corr())

0.1773079516061358
          a         b         c         d         e
a  1.000000  0.177308 -0.557539 -0.191921  0.330364
b  0.177308  1.000000 -0.419283  0.630664  0.693167
c -0.557539 -0.419283  1.000000 -0.210442 -0.582513
d -0.191921  0.630664 -0.210442  1.000000  0.428717
e  0.330364  0.693167 -0.582513  0.428717  1.000000


## 数据排名

数据排名为元素数组中的每个元素生成排名，在关系的情况下，分配平均等级

In [7]:
s = pd.Series(np.random.np.random.randn(5), index=list('abcde'))
s['d'] = s['b']
print(s.rank()) 

a    1.0
b    4.5
c    2.0
d    4.5
e    3.0
dtype: float64


1.6104817409915075