##Numpy

[Numpy](http://www.numpy.org/) 是一个Python扩展软件包，主要用于科学计算。它提供了高性能的数据结构，可以有效地处理多维数组和矩阵，也称为“面向数组的计算”。另外，NumPy提供用于操作这些数组的高级数学函数。

NumPy不包含在默认Python中。 用户可以通过[Python软件包索引](https://pypi.org/) 进行安装，例如`pip install numpy`或者`conda install -n my_project numpy`，`my_project`为虚拟环境名称。

要使用NumPy，请使用import将NumPy导入：

In [None]:
import numpy as np

np.sum([1, 2, 3, 4])

------

### 创建NumPy数组
* 使用`array`函数，基于列表和元组手动创建数组：

In [None]:
a = np.array([1, 2, 3, 4])  # from list
b = np.array((5.6, 6.7, 7.8, 8.9, 9.))  # from tuple
print(a)
print(b)
print(a.ndim)  # 1D array
print(a.shape)
print(a.size)
print(a.dtype)

查看数据类型:

In [None]:
type(a), type(b)

创建二位数组：

In [None]:
c = np.array([[1., 2., 3., 4.], [5., 6., 7., 8.]])
print(c)
print(c.ndim)  # 2D array
print(c.shape)  # the shape is 2 x 4
print(c.size)
print(c.dtype)

在创建的时候数据类型可以指定：

In [None]:
d = np.array([[1, 2, 3], [10, 20, 30]], dtype='float64')
print(d.dtype)

* 使用其它函数创建数组：

	`np.arange()` 和 `np.linspace()` 通常用于创建元素间间隔相等的数组. 前者需要指定初始值、结束值和步进，后者则需要给定初始值、结束值和元素的个数。

In [None]:
# In practice, we rarely enter elements one by one.
e = np.arange(6)  # from 0 to n-1 with an increment of 1
print(e)

# Or specify the start, end and increment values
f = np.arange(2, 10, 2)
print(f)

# Or use the linspace function that is similar to that of Matlab
g = np.linspace(2, 13, 12)  # start, end and number of elements
print(g)

一位数组可以转换成多维数组，转换过程中需确保元素的个数相等。

In [None]:
h = g.reshape([2, 6])  # 2D
print(h)
print('\n\n')

i = g.reshape([2, 2, 3])  # 3D
print(i)

 `np.ones()`, `np.zeros()`, `np.random()`, `np.empty()` 和 `np.full()` 通常用于创建尺寸已知的数组。

In [None]:
# Create an array of ones
print('np.ones():\n', np.ones((2, 3)), '\n')

# Create an array of zeros
print('np.zeros():\n', np.zeros((2, 3, 4), dtype=np.int32), '\n')

# Create an array with random values
print('np.random():\n', np.random.random((2, 2)), '\n')

# Create an empty array that has a shape of 3x2
print('np.empty():\n', np.empty((3, 2)), '\n')

# Create a full array that has a shape of 3x2 and is filled with number 10
print('np.full():\n', np.full((3, 2), 10), '\n')

`np.eye()` 用于创建单位矩阵，`np.diag()` 用于创建对角矩阵。

In [None]:
print('np.eye():\n', np.eye(3), '\n')

print('np.diag():\n', np.diag((2, 3, 4, 5)))

`np.mgrid()` 创建一个二维的网格矩阵，类似“meshgrid”。

In [None]:
x, y = np.mgrid[0:4, 1:6]
print('x: \n', x, '\n')
print('y: \n', y, '\n')

------

### Indexing and slicing

Numpy数组元素的访问和列表类似，用方括号表示，第一个元素的索引号为0，同时也支持负的索引号。也可用切片的方式访问多个元素。

In [None]:
a = np.arange(10)
print('Array a: ', a[:])
print('The first element of a: ', a[0])
print('The last element of a: ', a[-1])
print('The first 3 elements of a: ', a[:3])
print('The last 3 elements of a: ', a[-3:])
print('Elements from the third to the end: ', a[2:])
print('Elements from the third to the eighth: ', a[2:8])
print('Elements from the start to the end with a step of 1: ', a[::])
print('Elements from the start to the end with a step of 2: ', a[::2])
print('Elements from the third to the eighth with a step of 2: ', a[2:8:2])

与列表不同的是，多维数组元素的访问通过给定每一维上的索引号：

In [None]:
# Here we use list comprehension to construct a 2-D array
b = np.array([[m + n for m in np.arange(6)] for n in np.arange(4)])
print('Array b:\n', b[:, :], '\n')
print('The second row: ', b[1, :], '\n')
print('A subset of array b:\n', b[1:4, 2:4])

多维数组中若要访问某一维全部的数据，使用 `:`代替索引号或者省略：

In [None]:
print('The first row: ', b[0])  # equivalent to b[0, :]

索引号可以是列表：

In [None]:
idx_row = np.array([0, 2, 3])
idx_col = np.array([1, 3, 5])
print('b[idx_row]:\n', b[idx_row], '\n')
print('b[idx_col]:\n', b[:, idx_col], '\n')
print('b[idx_row, idx_col]:\n', b[idx_row, idx_col])

使用逻辑掩码作为NumPy的索引号对于选择性地访问和处理数组元素非常有用。我们可以将bool数据类型的数组用作索引号，并选择其索引值为true的元素。

In [None]:
masks = np.array([[0, 1, 0, 1, 0, 1], [0, 1, 0, 1, 0, 1], [0, 1, 0, 1, 0, 1], [0, 1, 0, 1, 0, 1]], dtype=bool)
print('b:\n', b, '\n')
print('masks:\n', masks, '\n')
print('Masked b:\n', b[masks])

逻辑判断作为索引号也非常的有用。数组中的每个元素将做逻辑判断，然后返回逻辑为真的元素，例如提取大于2的元素。

In [None]:
b[b > 2]

------

### 运算
#### 算数运算
`+`, `-`, `*` 和 `/`为加减乘除运算，可以是两个数组或者一个数组与一个标量。记住，算术运算是按元素的运算（element-wise）：

In [None]:
a = 10.5
array1 = np.array([[m + n for m in np.arange(6)] for n in np.arange(4)], dtype=np.float32)  # 4 x 6 2D arrays
array2 = np.array([[m - n for m in np.arange(6)] for n in np.arange(4)], dtype=np.float32)  # 4 x 6 2D arrays

In [None]:
print(array1 + a, '\n')
print(array1 - array2, '\n')
print(array1 / a, '\n')
print(array1 * array2)

`+=`, `-=`, `*=` and `/=` 与上述常规操作不同，此操作发生在本地进而修改当前的数组，而不是创建新的数组。

In [None]:
array3 = np.array(np.arange(10), dtype=float)
print(array3)
array3 += 2.5
print(array3)

#### 线性代数运算

数组操作不是矩阵操作。前者是基于元素的运算，而后者则遵循线性代数的数学规则。如果我们将NumPy数组用作线性代数的运算（例如，点乘np.dot（）），则两个数组的形状应与数学规则匹配。

In [None]:
A = np.array([[m + n for m in np.arange(4)] for n in np.arange(4)])  # 4 x 4 2D arrays
B = np.array([[m - n for m in np.arange(3)] for n in np.arange(4)])  # 4 x 3 2D arrays
C = np.arange(4)  # 1D vector with a size of 4
A, B, C

In [None]:
print(np.dot(A, B), '\n')
print(np.dot(A, C))

或者使用 `np.matrix()`函数创建一个矩阵：

In [None]:
AM = np.matrix(A)
BM = np.matrix(B)
CM = np.matrix(C)
AM, BM, CM

然后 `+`, `-`, 和 `*`的运算将遵循线性代数，而不是按元素。

In [None]:
# dot product
AM * BM

In [None]:
AM * CM.T  # here .T means Transport that converts CM to a column vector

In [None]:
# inner product
CM * CM.T  # you can also use np.inner() function

In [None]:
# outer product
CM.T * CM  # you can also use np.outer() function

In [None]:
# Matrix addition
CM.T + AM * CM.T

举证的行列式和逆矩阵：

In [None]:
# Determinant
M = np.array([[6, 1, 2], [2, -4, 6], [3, 5, 8]])
np.linalg.det(M)

In [None]:
# Inverse
np.linalg.inv(M)

#### 其它常用函数：

Numpy还提供了大量的数学函数，如统计学函数 `np.sum()`, `np.mean()`, `np.min()`, `np.max()`, `np.std()`, `np.var()`, `np.prod()`, and `np.trace()`和三角函数。完整的数学函数的列表： [here](https://docs.scipy.org/doc/numpy-1.13.0/reference/routines.math.html).

------

### Copies and Views

Python中的内存处理通常很麻烦。对于数组操作，有些操作会将数组数据复制到新数组，有些则不然。尤其是对于初学者来说，很容混淆。让我们看看什么是 _copies_ 和 _views_。

#### No copy

数组赋值通常不会复制数组数据，只是给数组另一个变量名。对新数组所做的更改将传递到原始数组。

In [None]:
D = np.array([1, 2, 3, 4, 5])
D

In [None]:
D1 = D
D1 is D

In [None]:
D1[0:2] = 100  # we change D1
print(D)  # D is also changed

记住，将一个可变异的参数作为函数的输入的时候，所传递的是reference，函数内若对传递的参数进行了修改，函数外被传递的参数的值也将被修改。可以理解为函数参数实际上传递的只是参数的名字。

In [None]:
def myfunc(a):
    a[:] = -10

myfunc(D)
D

#### View and shallow copy

不同的数组可以共享相同的数据（相同的内存），并以不同的形式（例如不同的尺寸数）表示相同的数据。 这个称为`view`。

In [None]:
E = np.array([1, 2, 3, 4, 5, 6])
E

In [None]:
E1 = E.view()
E1

In [None]:
E1 is E

In [None]:
E1.shape = (3, 2)  # now E1's shape is 3x2
E1.shape

In [None]:
E.shape

In [None]:
E1[0, :] = 0  # Now we change E1
E  # E is also changed

记住，切片操作返回一个`view`。

In [None]:
E2 = E[2:]
E2

In [None]:
E2[:] = 0  # change E2
E  # E also changed

#### Deep copy
真正的copy：

In [None]:
E3 = E.copy()
E3

In [None]:
E3[:] = 100  # E3 has been changed
E  # E is not affected

为组织函数改变一个数组的值，通常可以将一个数组的copy传递给函数，但是更耗内存。

In [None]:
myfunc(E.copy())
E

In [None]:
# If we pass E directly to the function
myfunc(E)
E

------

### 数组的操作
#### Flattening, reshaping and resizing
使用`flatten` 或者 `ravel`函数可以将任意一个多维数组可以转变成一个一维数组。 前者返回一个copy或者返回view。

In [None]:
A

In [None]:
A1 = A.flatten()
A1

In [None]:
# change A1
A1[1:6] = 99
A1

In [None]:
# verify A
A

In [None]:
A2 = A.ravel()
A2[1:6] = 99  # we change A2
A  # A is changed

np.reshape可改变数组维上的尺寸，返回的是view。尺寸改变前后数组的尺寸应保持一致，例如，数组A有16个元素，我们可以将其重构为`（4，4）`，`（2，8）`或`（2，2，4）`，而不是`（3，4）`， `（3，4）`或其他与数组大小不匹配的尺寸。

In [None]:
A3 = A.reshape(2, 8)
A3

In [None]:
# let's introduce changes to A3
A3[0, 1:6] = 100
A

In [None]:
A4 = np.reshape(A, (2, 8))
A4

In [None]:
A4[0, 1:6] = 200
A

也可以适应数组自带的方法进行本地操作：

In [None]:
A.shape = (2, 8)
A

resize函数：

In [None]:
F = np.array([[m + n + 1 for m in np.arange(3)] for n in np.arange(5)])  # 5 x 3 2D arrays with a size of 15
F.resize(20)  # we change the size from 15 to 20
F

If the new size if larger than the old one, `0` will be used to fill in the gaps.