## 第9章  NumPy基础
前面介绍了序列、字典等数据结构（或容器），这些数据结构能存储大量数据，不过它们由于受内部机制的限制，如果存储和管理大数据效率就不高了。为解决大数据存储管理的问题，人们提出了NumPy,这是一个多维数组（ndarray），它是Python科学计算、数据处理、数据分析的基石，其特点如下：  
（1）ndarray，快速和节省空间的多维数组，提供数组化的算术运算和高级的广播功能。  
（2）使用标准数学函数对整个数组的数据进行快速运算，而不需要编写循环。  
（3）读取/写入磁盘上的阵列数据和操作存储器映像文件的工具。  
（4）线性代数，随机数生成，和傅里叶变换的能力。  
（5）集成C，C++，Fortran代码的工具。


### 9.2 生成NumPy数组  
NumPy是Python的外部库，不在标准库中。因此，若要使用它，需要先导入NumPy。

In [1]:
import numpy as np

导入NumPy后，可通过np.+Tab键，查看可使用的函数，如果对其中一些函数的使用不很清楚，还可以在对应函数+?，再运行，就可很方便的看到如何使用函数的详细信息(包括格式说明、功能介绍、简单示例等)。

#### 9.2.1 从已有数据中创建数组  
（1）将列表转换成 ndarray

In [4]:
import numpy as np

lst1 = [3.14, 2.17, 0, 1, 2]
nd1 =np.array(lst1)
print(nd1)
# [3.14 2.17 0.   1.   2.  ]
print(type(nd1))

[3.14 2.17 0.   1.   2.  ]
<class 'numpy.ndarray'>


（2）嵌套列表可以转换成多维 ndarray

In [5]:
import numpy as np

lst2 = [[3.14, 2.17, 0, 1, 2], [1, 2, 3, 4, 5]]
nd2 =np.array(lst2)
print(nd2)
print(type(nd2))

[[3.14 2.17 0.   1.   2.  ]
 [1.   2.   3.   4.   5.  ]]
<class 'numpy.ndarray'>


#### 9.2.2 利用 random 模块生成数组  
 np.random 模块有很多常用的函数，具体可参考书中对应章节内容。

In [9]:
import numpy as np

nd3 =np.random.random([3, 3])
print("nd3数组：")
print(nd3)
print("nd3的形状为:",nd3.shape)

nd3数组：
[[0.95458012 0.95391888 0.65197347]
 [0.76482928 0.6679304  0.01003095]
 [0.48427667 0.22387634 0.44063122]]
nd3的形状为: (3, 3)


为了每次生成同一份数据，可以指定一个随机种子，使用shuffle函数打乱生成的随机数。

In [11]:
import numpy as np

np.random.seed(123)
nd4 = np.random.randn(2,3)
print(nd4)
np.random.shuffle(nd4)
print("随机打乱后数据:")
print(nd4)

[[-1.0856306   0.99734545  0.2829785 ]
 [-1.50629471 -0.57860025  1.65143654]]
随机打乱后数据:
[[-1.50629471 -0.57860025  1.65143654]
 [-1.0856306   0.99734545  0.2829785 ]]


#### 9.2.3 创建特定形状的多维数组
参数初始化时，有时需要生成一些特殊矩阵，如全是 0 或 1 的数组或矩阵，这时我们可以利用np.zeros、np.ones、np.diag来实现，更多信息可参考书中的表9-2。

In [12]:
import numpy as np

# 生成全是 0 的 3x3 矩阵
nd5 =np.zeros([3, 3])
#生成与nd5形状一样的全0矩阵
#np.zeros_like(nd5)
# 生成全是 1 的 3x3 矩阵
nd6 = np.ones([3, 3])
# 生成 3 阶的单位矩阵
nd7 = np.eye(3)
# 生成 3 阶对角矩阵
nd8 = np.diag([1, 2, 3])
print("nd5矩阵:")
print(nd5)
print("nd6矩阵:")
print(nd6)
print("nd7矩阵:")
print(nd7)
print("nd8矩阵:")
print(nd8)

nd5矩阵:
[[0. 0. 0.]
 [0. 0. 0.]
 [0. 0. 0.]]
nd6矩阵:
[[1. 1. 1.]
 [1. 1. 1.]
 [1. 1. 1.]]
nd7矩阵:
[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]
nd8矩阵:
[[1 0 0]
 [0 2 0]
 [0 0 3]]


有时我们可能需要把生成的数据暂时保存起来，以备后续使用。

In [13]:
import numpy as np

nd9 =np.random.random([5, 5])
#保存矩阵
np.savetxt(X=nd9, fname='./test1.txt')
#装载查看数据数据
nd10 = np.loadtxt('./test1.txt')
print(nd10)

[[0.41092437 0.5796943  0.13995076 0.40101756 0.62731701]
 [0.32415089 0.24475928 0.69475518 0.5939024  0.63179202]
 [0.44025718 0.08372648 0.71233018 0.42786349 0.2977805 ]
 [0.49208478 0.74029639 0.35772892 0.41720995 0.65472131]
 [0.37380143 0.23451288 0.98799529 0.76599595 0.77700444]]


#### 9.2.4 利用 arange、linspace 函数生成数组  
arange 是 numpy 模块中的函数，其格式为: 

In [15]:
import numpy as np

print(np.arange(10))
print(np.arange(0, 10))
print(np.arange(1, 4, 0.5))
print(np.arange(9, -1, -1))

[0 1 2 3 4 5 6 7 8 9]
[0 1 2 3 4 5 6 7 8 9]
[1.  1.5 2.  2.5 3.  3.5]
[9 8 7 6 5 4 3 2 1 0]


In [16]:
import numpy as np

print(np.linspace(0, 1, 10))

[0.         0.11111111 0.22222222 0.33333333 0.44444444 0.55555556
 0.66666667 0.77777778 0.88888889 1.        ]


值得一提的，这里并没有像我们预期的那样，生成 0.1, 0.2, ... 1.0 这样步长为0.1的 ndarray，这是因为 linspace 必定会包含数据起点和终点，那么其步长则为(1-0) / 9 = 0.11111111。如果需要产生 0.1, 0.2, ... 1.0 这样的数据，只需要将数据起点 0 修改为 0.1 即可。

### 9.3 获取元素
ndarray中元素的获取与列表一样，也是通过索引去定位获取，唯一一点不同的就是ndarray可能有些
多维，多维的我们只要把相关方法稍微拓展一下即可，多维的中间用逗号隔开即可，如二维矩阵的情况:
    A[i,j]表示从矩阵A中获取行索引、列索引分别为i，j的元素。其它切片等也是如此，示例如下：
（1）一维情况

In [17]:
import numpy as np
np.random.seed(2019)
nd11 = np.random.random([10])
#获取指定位置的数据，获取第4个元素
nd11[3]
#截取一段数据
nd11[3:6]
#截取固定间隔数据
nd11[1:6:2]
#倒序取数
nd11[::-2]


array([0.4057498 , 0.90320616, 0.29917202, 0.6378774 , 0.39308051])

（2）二维或多维情况

In [30]:
#截取一个多维数组的一个区域内数据
nd12=np.arange(25).reshape([5,5])
print(nd12[1:3,1:3])
#截取一个多维数组中，数值在一个值域之内的数据
print(nd12[(nd12>3)&(nd12<10)])
#截取多维数组中，指定的行,如读取第2,3行
print(nd12[[1,2]])  #或nd12[1:3,:])
##截取多维数组中，指定的列,如读取第2,3列
print(nd12[:,1:3])

[[ 6  7]
 [11 12]]
[4 5 6 7 8 9]
[[ 5  6  7  8  9]
 [10 11 12 13 14]]
[[ 1  2]
 [ 6  7]
 [11 12]
 [16 17]
 [21 22]]


如果对上面这些获取方式还不是很清楚，没关系，下面我们通过图形的方式进一步说明，如图9-2所示，左边为表达式，右边为表达式获取的元素。注意不同的边界，表示不同的表达式。
![image.png](attachment:image.png)

获取数组中的部分元素除通过指定索引标签外，还可以使用一些函数来实现，如通过random.choice函数可以从指定的样本中进行随机抽取数据。

In [32]:
import numpy as np
from numpy import random as nr

a=np.arange(1,25,dtype=float)
c1=nr.choice(a,size=(3,4))  #size指定输出数组形状
c2=nr.choice(a,size=(3,4),replace=False)  #replace缺省为True，即可重复抽取。
#下式中参数p指定每个元素对应的抽取概率，缺省为每个元素被抽取的概率相同。
c3=nr.choice(a,size=(3,4),p=a / np.sum(a))
print("随机可重复抽取")
print(c1)
print("随机但不重复抽取")
print(c2)
print("随机但按制度概率抽取")
print(c3)

随机可重复抽取
[[19.  6. 24. 22.]
 [21. 17. 16.  2.]
 [23. 15. 13. 11.]]
随机但不重复抽取
[[ 5. 14. 23. 15.]
 [ 8. 24.  6. 18.]
 [13. 10. 21. 11.]]
随机但按制度概率抽取
[[19. 21. 18. 11.]
 [10. 21. 23. 19.]
 [18. 19. 11. 20.]]


### 9.4 NumPy的算术运算
在机器学习和深度学习中，涉及大量的数组或矩阵运算，这节我们重点介绍两种常用的运算。一种是对应元素相乘，又称为逐元乘法(element-wise product)，运算符为np.multiply(), 或 *。另一种是点积或内积元素，运算符为np.dot()。更多信息大家可参考[机器学习基础数学知识](https://www.cnblogs.com/steven-yang/p/6348112.html)

#### 9.4.1对应元素相乘
对应元素相乘（element-wise product）是两个矩阵中对应元素乘积。np.multiply 函数用于数组或矩阵对应元素相乘，输出与相乘数组或矩阵的大小一致，其格式如下:
numpy.multiply(x1, x2, /, out=None, *, where=True,casting='same_kind', order='K', dtype=None, subok=True[, signature, extobj])
	其中x1，x2之间的对应元素相乘遵守广播规则，NumPy的广播规则本章第7小节将介绍。以下我们通过一些示例来进一步说明。


In [36]:
A = np.array([[1, 2], [-1, 4]])
B = np.array([[2, 0], [3, 4]])
print("(A*B结果如下：")
print(A*B)
print("(np.multiply(A,B)结果如下：")
np.multiply(A,B)

(A*B结果如下：
[[ 2  0]
 [-3 16]]
(np.multiply(A,B)结果如下：


array([[ 2,  0],
       [-3, 16]])

A*B运算过程如下图所示：
![image.png](attachment:image.png)
NumPy数组不仅可以和数组进行对应元素相乘，也可以和单一数值（或称为标量）进行运算。运算时，NumPy数组每个元素和标量进行运算，其间会用到广播机制（1.7小节将详细介绍）

In [37]:
print(A*2.0)
print(A/2.0)

[[ 2.  4.]
 [-2.  8.]]
[[ 0.5  1. ]
 [-0.5  2. ]]


由此，推而广之，数组通过一些激活函数后，输出与输入形状一致。<mark style=background-color:yellow>即激活函数不会改变输入数据的形状(shape)
</mark>  

In [38]:
X=np.random.rand(2,3)
def softmoid(x):
    return 1/(1+np.exp(-x))
def relu(x):
    return np.maximum(0,x)
def softmax(x):
    return np.exp(x)/np.sum(np.exp(x))

print("输入参数X的形状：",X.shape)
print("激活函数softmoid输出形状：",softmoid(X).shape)
print("激活函数relu输出形状：",relu(X).shape)
print("激活函数softmax输出形状：",softmax(X).shape)

输入参数X的形状： (2, 3)
激活函数softmoid输出形状： (2, 3)
激活函数relu输出形状： (2, 3)
激活函数softmax输出形状： (2, 3)


#### 9.4.2 点积运算
点积运算（dot product）又称为内积，在NumPy用np.dot表示，其一般格式为：
numpy.dot(a, b, out=None)
以下通过一个示例来说明dot的具体使用及注意事项。


In [39]:
X1=np.array([[1,2],[3,4]])
X2=np.array([[5,6,7],[8,9,10]])
X3=np.dot(X1,X2)
print(X3)

[[21 24 27]
 [47 54 61]]


以上运算，用下图表示：
![image.png](attachment:image.png)

### 9.5 数组变形
NumPy多维数组的形状（shape)可以通过numpy.shape()函数获取，在对数组的实际应用中，经常需要对数组进行变形，如形状为(10,)的一维数据变成形状为（2,5）的二维数组，或反过来（NumPy数组的维度可用numpy.ndim()函数查看）

#### 9.5.1 更改数组的形状
具体函数及其功能请参考书中对应章节，以下为部分示例：

（1）使用reshape函数改变数组的形状

In [56]:
import numpy as np

arr =np.arange(10)
print(arr)
# 将向量 arr 维度变换为2行5列
print(arr.reshape(2, 5))
# 指定维度时可以只指定行数或列数, 其他用 -1 代替
print(arr.reshape(5, -1))
print(arr.reshape(-1, 5))

[0 1 2 3 4 5 6 7 8 9]
[[0 1 2 3 4]
 [5 6 7 8 9]]
[[0 1]
 [2 3]
 [4 5]
 [6 7]
 [8 9]]
[[0 1 2 3 4]
 [5 6 7 8 9]]


<mark style=background-color:red>延伸一下</mark>  
NumPy数组形状（ndarray.shape）与维度(ndarray.ndim)的区别：  
（1）ndarray.ndim表示数组轴的个数，是一个整数  
（2)ndarray.shape表示数组各个维度上数组的大小，它是一个元祖。

In [57]:
print("数组arr的形状:{}，arr的维度:{}".format(np.shape(arr),np.ndim(arr)))
arr1=arr.reshape(2, 5)
print("数组arr1的形状{}，arr1的维度：{}".format(np.shape(arr1),np.ndim(arr1)))

数组arr的形状:(10,)，arr的维度:1
数组arr1的形状(2, 5)，arr1的维度：2


（2）用resize改变数组形状

In [58]:
import numpy as np

arr2 =np.arange(10)
print(arr2)
# 将向量 arr 维度变换为2行5列
arr2.resize(2, 5)
print(arr2)

[0 1 2 3 4 5 6 7 8 9]
[[0 1 2 3 4]
 [5 6 7 8 9]]


（3）数组的转置(.T)

In [60]:
import numpy as np

arr =np.arange(12).reshape(3,4)
# 向量 arr 为3行4列
print(arr)
# 将向量 arr 进行转置为4行3列
print("转置后的矩阵")
print(arr.T)

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
转置后的矩阵
[[ 0  4  8]
 [ 1  5  9]
 [ 2  6 10]
 [ 3  7 11]]


（4）展平数组（ravel）-直接修改原数组

In [61]:
import numpy as np

arr =np.arange(6).reshape(2, -1)
print(arr)
# 按照列优先，展平
print("按照列优先，展平")
print(arr.ravel('F'))
# 按照行优先，展平
print("按照行优先，展平")
print(arr.ravel())


[[0 1 2]
 [3 4 5]]
按照列优先，展平
[0 3 1 4 2 5]
按照行优先，展平
[0 1 2 3 4 5]


（5）展平数组(flatten)

In [63]:
import numpy as np
a =np.floor(10*np.random.random((3,4)))
print(a)
print("展平后的数组")
print(a.flatten())

[[0. 9. 4. 8.]
 [2. 9. 3. 8.]
 [4. 1. 1. 4.]]
展平后的数组
[0. 9. 4. 8. 2. 9. 3. 8. 4. 1. 1. 4.]


（6）对维数为1的维度降维（squeeze）

In [72]:
import numpy as np

arr =np.arange(3).reshape(3, 1)
print("arr数组的形状{}，维度是{}".format(arr.shape,np.ndim(arr)))  #(3,1)
print("变化后数组的形状{},维度是{}".format(arr.squeeze().shape,np.ndim(arr.squeeze())))  #(3,)
arr1 =np.arange(6).reshape(3,1,2,1)
print(arr1.shape) #(3, 1, 2, 1)
print(arr1.squeeze().shape) #(3, 2)


arr数组的形状(3, 1)，维度是2
变化后数组的形状(3,),维度是1
(3, 1, 2, 1)
(3, 2)


（7）改变对数组的轴次序(transpose)  
对高维矩阵进行轴对换，这个在深度学习中经常使用，比如把图片表示颜色的RGB顺序，改为GBR的顺序。

In [73]:
import numpy as np

arr2 = np.arange(24).reshape(2,3,4)
print(arr2.shape)  #(2, 3, 4)
print(arr2.transpose(1,2,0).shape)  #(3, 4, 2)

(2, 3, 4)
(3, 4, 2)


#### 9.5.2 合并或拼接数组

合并数组也是最常见的操作之一，具体函数及其使用请参考书的对应章节。

（1）append
合并一维数组

In [74]:
import numpy as np

a =np.array([1, 2, 3])
b = np.array([4, 5, 6])
c = np.append(a, b)
print(c) 

[1 2 3 4 5 6]


合并多维数组

In [75]:
import numpy as np

a =np.arange(4).reshape(2, 2)
b = np.arange(4).reshape(2, 2)
# 按行合并
c = np.append(a, b, axis=0)
print('按行合并后的结果')
print(c)
print('合并后数据维度', c.shape)
# 按列合并
d = np.append(a, b, axis=1)
print('按列合并后的结果')
print(d)
print('合并后数据维度', d.shape)

按行合并后的结果
[[0 1]
 [2 3]
 [0 1]
 [2 3]]
合并后数据维度 (4, 2)
按列合并后的结果
[[0 1 0 1]
 [2 3 2 3]]
合并后数据维度 (2, 4)


这里涉及多维数组（或矩阵）的axis概念，axis表示轴，axis=0 表示第0轴，axis=1 表示第1轴，下图以一个二维矩阵威力，说明第0轴与第1轴的具体含义：
![image.png](attachment:image.png)

（2）concatenate  
沿指定轴连接或拼接数组或矩阵

In [81]:
import numpy as np
a =np.array([[1, 2], [3, 4]])
b = np.array([[5, 6]])

c = np.concatenate((a, b), axis=0)
print(c)
d = np.concatenate((a, b.T), axis=1)
print(d)

[[1 2]
 [3 4]
 [5 6]]
[[1 2 5]
 [3 4 6]]


（3）stack  
沿指定轴堆叠数组或矩阵

In [82]:
import numpy as np

a =np.array([[1, 2], [3, 4]])
b = np.array([[5, 6], [7, 8]])
print(np.stack((a, b), axis=0))

[[[1 2]
  [3 4]]

 [[5 6]
  [7 8]]]


### 9.6 通用函数  
NumPy提供了两种基本的对象，即ndarray和ufunc对象。前面我们介绍了ndarray，本节将介绍NumPy的另一个对象通用函数(ufunc)，ufunc是universal function的缩写，它是一种能对数组的每个元素进行操作的函数。  
许多ufunc函数都是用c语言级别实现的，因此它们的计算速度非常快。此外，它们比math模块中函数更灵活。math模块的输入一般是标量，但NumPy中函数可以是向量或矩阵，而利用向量或矩阵可以避免使用循环语句，这点在机器学习、深度学习中非常重要。

（1）math与numpy函数的性能比较

In [87]:
import time
import math
import numpy as np

x = [i * 0.001 for i in np.arange(1000000)]
#start = time.clock()
start=time.time()
for i, t in enumerate(x):
    x[i] = math.sin(t)
print ("math.sin:", time.time() - start )

x = [i * 0.001 for i in np.arange(1000000)]
x = np.array(x)
#start = time.clock()
start=time.time()
np.sin(x)
print ("numpy.sin:", time.time() - start )

math.sin: 0.4980285167694092
numpy.sin: 0.0060002803802490234


由此可见，numpy.sin比math.sin快近100倍!

（2）循环与向量运算比较：

In [88]:
import time
import numpy as np

x1 = np.random.rand(1000000)
x2 = np.random.rand(1000000)
##使用循环计算向量点积
tic = time.process_time()
dot = 0
for i in range(len(x1)):
    dot+= x1[i]*x2[i]
toc = time.process_time()
print ("dot = " + str(dot) + "\n for loop----- Computation time = " + str(1000*(toc - tic)) + "ms")
##使用numpy函数求点积
tic = time.process_time()
dot = 0
dot = np.dot(x1,x2)
toc = time.process_time()
print ("dot = " + str(dot) + "\n verctor version---- Computation time = " + str(1000*(toc - tic)) + "ms")


dot = 250443.05312865542
 for loop----- Computation time = 889.2056999999979ms
dot = 250443.05312865914
 verctor version---- Computation time = 0.0ms


### 9.7 广播机制  
NumPy的Universal functions 中要求输入的数组shape是一致的，当数组的shape不相等的时候，则会使用广播机制。不过，调整数组使得shape一样，需满足一定规则，否则将出错。详细内容请看书中对应章节。

In [91]:
import numpy as np
A = np.arange(0, 40,10).reshape(4, 1)
B = np.arange(0, 3)
print("A矩阵的形状:{},B矩阵的形状:{}".format(A.shape,B.shape))
C=A+B
print("C矩阵的形状:{}".format(C.shape))
print(C)

A矩阵的形状:(4, 1),B矩阵的形状:(3,)
C矩阵的形状:(4, 3)
[[ 0  1  2]
 [10 11 12]
 [20 21 22]
 [30 31 32]]


以上运算过程，可用下图表示。
![image.png](attachment:image.png)