### Numpy和原生Python用于数组计算的性能对比

需求：
* 实现两个数组的加法
* 数组A是1~N数字的平方
* 数组B是1~N数字的立方

对比使用Numpy和原生Python的性能对比

### 引入Numpy的包

In [7]:
import numpy as np

In [8]:
np.__version__

'1.18.5'

### 使用Python原生语法实现对比

In [9]:
def python_sum(n):
    """ Python实现数组的加法
    @param n：数组的长度
    """
    a = [i**2 for i in range(n)] # i的二次方
    b = [i**3 for i in range(n)] # i的三次方
    c = []
    for i in range(n):
        c.append(a[i] + b[i])
    return c

In [10]:
# 测试一下
python_sum(10)

[0, 2, 12, 36, 80, 150, 252, 392, 576, 810]

### 使用Numpy实现

In [11]:
def numpy_sum(n):
    """ numpy实现数组的加法
    @param n：数组的长度
    """
    a = np.arange(n) ** 2
    b = np.arange(n) ** 3
    return a+b

In [12]:
# 测试一下
numpy_sum(10)

array([  0,   2,  12,  36,  80, 150, 252, 392, 576, 810], dtype=int32)

### 性能对比：执行1000次

In [13]:
%timeit python_sum(1000)

736 µs ± 13.6 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [14]:
%timeit numpy_sum(1000)

8.95 µs ± 143 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


### 性能对比：执行10W次

In [15]:
%timeit python_sum(10 * 10000)

KeyboardInterrupt: 

In [None]:
%timeit numpy_sum(10 * 10000)

### 性能对比：执行1000W次

In [None]:
%timeit python_sum(1000 * 10000)

In [None]:
%timeit numpy_sum(1000 * 10000)

### 绘制性能对比图

In [None]:
pytimes = [1.06*1000, 104*1000, 10.4*1000*1000]
nptimes = [9.16, 424, 114*1000]

In [None]:
import pandas as pd

In [None]:
df = pd.DataFrame({
    "pytimes":pytimes,
    "nptimes":nptimes,
})

In [None]:
df

In [None]:
%matplotlib inline
df.plot.bar()