## Ch2. Numpy Numerical Calculation

### 0. Introduction

NumPy(Numerical Python)是Python语言的一个扩展程序库，支持大量的维度数组与矩阵运算，此外也针对数组运算提供大量的数学函数库。NumPy的前身Numeric最早是由 Jim Hugunin与其它协作者共同开发，2005年，Travis Oliphant在Numeric中结合了另一个同性质的程序库Numarray的特色，并加入了其它扩展而开发了NumPy。 NumPy为开放源代码并且由许多协作者共同维护开发。本章将为大家介绍python中nmupy库的使用，我们主要将其用于数值计算，包括：

1. 一个强大的N维数组对象 ndarray
2. 广播功能函数
3. 整合 C/C++/Fortran 代码的工具
4. 线性代数、傅里叶变换、随机数生成等功能

NumPy通常与SciPy（Scientific Python）和Matplotlib（绘图库）一起使用，这种组合广泛用于替代MatLab，是一个强大的科学计算环境，有助于我们通过Python学习数据科学或者机器学习。

### 1. Numpy的优势以及为什么要使用Numpy

#### 1.1 Python循环

在python中，循环操作是十分费时的，涉及到大规模的循环操作，会导致程序运行十分缓慢。我们以下面一个求100万个数的倒数的程序为例。我们首先使用for循环来实现，来看看程序的运行性能。我们可以使用`%timeit`来统计运行时间，它是ipython中统计运行时间的魔术方法，通过多次运行取平均值的方式来实现。

In [2]:
def compute_reciprocals(values):
    res = []
    for value in values:
        res.append(1 / value)
    return res

values = list(range(1, 1000000))

%timeit compute_reciprocals(values)

76.2 ms ± 1.88 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


我们看到，使用python的for循环程序运行较为缓慢，这是因为在循环中每遍历到一个元素，python就要判断它的类型并查找适用于该数据类型的正确的操作方式。为了更直观的为大家提供一个对比，我们使用numpy来实现相同的功能并计算其运行时间。

In [3]:
import numpy as np

values = np.arange(1, 1000000)

%timeit 1 / values

1.88 ms ± 71 µs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)


可以看到实现相同的计算，我们使用numpy的运行速度是python循环的几十倍。所以，numpy的优势就在于它可以向量化操作，使得需要大量for循环的运算的速度大大提升。

#### 1.2 为什么numpy如此高校

Numpy的底层是C语言实现的，其实其内部计算仍然是for循环，但是C语言的for循环的运行速度要远远快于python，C在执行时代码整体编译，速度更快。此外，numpy数组是连续的单一类型储存，与分散的多变类型储存相比，这种存储结构与一些更加高效的底层处理方式更加的契合。而且Python语言在执行时有线程锁，无法实现真正的多线程并行，但是C语言可以。

#### 1.3 应该在什么时候使用numpy？

当我们在python中，需要也能用大量的for循环才能实现的向量化、矩阵化操作时，我们就需要优先考虑使用Numpy。

### 2. Numpy常规数组

#### 2.1 Numpy常规数组的创建