# NumPy - 科学计算

## 一、简介

  NumPy是Python语言的一个扩充程序库。支持高级大量的维度数组与矩阵运算，此外也针对数组运算提供大量的数学函数库。Numpy内部解除了[CPython的GIL](https://www.cnblogs.com/wj-1314/p/9056555.html)（全局解释器锁），运行效率极好，是大量机器学习框架的基础库！
NumPy的全名为Numeric Python，是一个开源的Python科学计算库，它包括：
- 一个强大的N维数组对象ndrray；
- 比较成熟的（广播）函数库；
- 用于整合C/C++和Fortran代码的工具包；
- 实用的线性代数、傅里叶变换和随机数生成函数  

NumPy的优点：
- 对于同样的数值计算任务，使用NumPy要比直接编写Python代码便捷得多；
- NumPy中的数组的存储效率和输入输出性能均远远优于Python中等价的基本数据结构，且其能够提升的性能是与数组中的元素成比例的；
- NumPy的大部分代码都是用C语言写的，其底层算法在设计时就有着优异的性能，这使得NumPy比纯Python代码高效得多  

NumPy的缺点:  
- 由于NumPy使用内存映射文件以达到最优的数据读写性能，而内存的大小限制了其对TB级大文件的处理；  
- 此外，NumPy数组的通用性不及Python提供的list容器。  
因此，在科学计算之外的领域，NumPy的优势也就不那么明显。

以下内容来自于：https://www.bilibili.com/video/av8727995?from=search&seid=12457925641538891537

## 二、基本使用
### 2.1 ndarray属性

In [1]:
# 调用
import numpy as np

In [2]:
# 将列表转换为矩阵
a = [[1,2,3],[2,3,4]]
print('list:\n',a)
array = np.array(a)
print('array:\n',array)

list:
 [[1, 2, 3], [2, 3, 4]]
array:
 [[1 2 3]
 [2 3 4]]


In [3]:
# 获取矩阵基本属性
print('num of dim:',array.ndim) # 秩，矩阵维度
print('shape:',array.shape) # 矩阵形状
print('size:',array.size) # 矩阵元素数量

num of dim: 2
shape: (2, 3)
size: 6


### 2.2 矩阵生成
（1）指定元素格式。  
NumPy 支持比 Python 更多种类的数值类型，为了区别于 Python 原生的数据类型，bool、int、float、complex、str 等类型名称末尾都加了_，详细的数据类型列表可在以下网址查看：https://www.cnblogs.com/gl1573/p/10549547.html。

In [4]:
# 将列表转化为指定格式的矩阵
a = np.array([2,3,4],dtype=np.float32)
print(a.dtype)

float32


（2）全零矩阵

In [5]:
zero = np.zeros((3,4))
print(zero)

[[0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]]


(3) 全1矩阵

In [6]:
one = np.ones((3,4),dtype=np.int32)
print(one)

[[1 1 1 1]
 [1 1 1 1]
 [1 1 1 1]]


(4) 全空矩阵

In [7]:
empty = np.empty((3,4))
print(empty)

[[0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]]


(5) 有序数列

In [8]:
range = np.arange(10,20,2) # [10,20)
print(range)

[10 12 14 16 18]


(6) 指定shape的矩阵

In [9]:
shape = np.arange(12).reshape((3,4))
print(shape)

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]


(7) 线段

In [10]:
line = np.linspace(10,20,5)
print(line)

[10.  12.5 15.  17.5 20. ]


### 2.3 按位运算

(1) 加减乘除  
直接加减乘除是对矩阵各元素同位运算：

In [11]:
a1 = np.array([5,8,11,15,20])
a2 = np.arange(1,6)
b1 = a1 + a2
print(b1)
b2 = a1 - a2
print(b2)
b3 = a1 * a2
print(b3)
b4 = a1 / a2
print(b4)

[ 6 10 14 19 25]
[ 4  6  8 11 15]
[  5  16  33  60 100]
[5.         4.         3.66666667 3.75       4.        ]


(2) 幂次方 （双星号）

In [12]:
b5 = a2**3
print(b5)

[  1   8  27  64 125]


(4) sin/cos

In [13]:
b6 = 10*np.sin(a2)
print(b6)

[ 8.41470985  9.09297427  1.41120008 -7.56802495 -9.58924275]


(5) 判断

In [14]:
print(a2<5)

[ True  True  True  True False]


### 2.4 矩阵运算

In [15]:
c1 = np.array([[1,2],[1,2]])
c2 = np.arange(4).reshape((2,2))
print(c1)
print(c2)

[[1 2]
 [1 2]]
[[0 1]
 [2 3]]


(1) 乘

In [16]:
c_dot = np.dot(c1,c2) 
c_dot2 = c1.dot(c2)
print(c_dot)
print(c_dot2)

[[4 7]
 [4 7]]
[[4 7]
 [4 7]]


(2) 矩阵求和/最大值/最小值/平均值

In [17]:
c3 = np.random.random((2,4))
print(c3)

[[0.33013443 0.35689548 0.97856181 0.40584133]
 [0.47531833 0.22821532 0.37049442 0.66761687]]


In [18]:
print(np.sum(c3))
print(np.sum(c3,axis=1)) # 行内

3.8130779886731725
[2.07143305 1.74164494]


In [19]:
print(np.min(c3))
print(np.sum(c3,axis=0)) # 列内

0.22821531752731306
[0.80545276 0.5851108  1.34905622 1.0734582 ]


In [20]:
print(np.max(c3))

0.9785618051493579


In [21]:
print(np.mean(c3))
print(c3.mean())

0.47663474858414656
0.47663474858414656


(3) 元素索引

In [22]:
print(np.argmin(c3))

5


In [23]:
print(np.argmax(c3))

2


(4) 元素累加

In [24]:
print(np.cumsum(c3))

[0.33013443 0.68702991 1.66559172 2.07143305 2.54675138 2.7749667
 3.14546112 3.81307799]


(5) 矩阵转置

In [25]:
print(c3.T)

[[0.33013443 0.47531833]
 [0.35689548 0.22821532]
 [0.97856181 0.37049442]
 [0.40584133 0.66761687]]


(6) 截止(限制矩阵的最大值和最小值)

In [26]:
print(c3.clip(0.25,0.75))

[[0.33013443 0.35689548 0.75       0.40584133]
 [0.47531833 0.25       0.37049442 0.66761687]]


## 三 进阶技巧
### 3.1 索引  
索引都是从0开始

In [27]:
d1 = np.arange(3,15).reshape((3,4))
print(d1)

[[ 3  4  5  6]
 [ 7  8  9 10]
 [11 12 13 14]]


In [28]:
print(d1[1]) # 整行索引
print(d1[1,:]) # 整行索引

[ 7  8  9 10]
[ 7  8  9 10]


In [29]:
print(d1[1][3]) # 
print(d1[1,3]) # 使用这种方法吧

10
10


In [30]:
print(d1[:,2]) # 整列索引

[ 5  9 13]


In [31]:
print(d1[0:2,2]) # 

[5 9]


In [32]:
# 按行打印
for row in d1:
    print(row)

[3 4 5 6]
[ 7  8  9 10]
[11 12 13 14]


In [33]:
# 按列打印
for colum in d1.T:
    print(colum)

[ 3  7 11]
[ 4  8 12]
[ 5  9 13]
[ 6 10 14]


In [34]:
# 按索引打印
for items in d1.flat: #flat将矩阵展开为行矩阵
    print(items)

3
4
5
6
7
8
9
10
11
12
13
14


### 3.2 合并

In [35]:
e1 = np.array([1,1,1])
e2 = np.array([2,2,2])

In [36]:
# 上下合并
f1 = np.vstack((e1,e2))
print(f1)

[[1 1 1]
 [2 2 2]]


In [37]:
# 左右合并
f2 = np.hstack((e1,e2))
print(f2)

[1 1 1 2 2 2]


In [38]:
# 行向量转列向量
print(e1[:,np.newaxis])
print(e1.T) # .T适用于矩阵，不适用于向量

[[1]
 [1]
 [1]]
[1 1 1]


In [39]:
# concatenate行列合并0=列，1=行
f3 = np.concatenate((e1,e2),axis=0)
print(f3)

[1 1 1 2 2 2]


### 3.3 分割

(1) 等量分割

In [40]:
g1 = np.arange(12).reshape((3,4))
print(g1)
print(np.split(g1,2,axis=1))
print(np.split(g1,3,axis=0))

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
[array([[0, 1],
       [4, 5],
       [8, 9]]), array([[ 2,  3],
       [ 6,  7],
       [10, 11]])]
[array([[0, 1, 2, 3]]), array([[4, 5, 6, 7]]), array([[ 8,  9, 10, 11]])]


In [41]:
print(np.hsplit(g1,2))
print(np.vsplit(g1,3))

[array([[0, 1],
       [4, 5],
       [8, 9]]), array([[ 2,  3],
       [ 6,  7],
       [10, 11]])]
[array([[0, 1, 2, 3]]), array([[4, 5, 6, 7]]), array([[ 8,  9, 10, 11]])]


(2) 不等量分割

In [42]:
print(np.array_split(g1,2,axis=0))

[array([[0, 1, 2, 3],
       [4, 5, 6, 7]]), array([[ 8,  9, 10, 11]])]


### 3.4 复制

(1) 浅复制

In [43]:
a = np.arange(4)
b = a
c = a
d = b
a[0] = 15
d[3] = 20
print(a)
print(b)
print(c)
print(d)
print(b is a)

[15  1  2 20]
[15  1  2 20]
[15  1  2 20]
[15  1  2 20]
True


(2) 深复制（deep copy）

In [44]:
a = np.arange(6)
b = np.copy(a)
a[0]=666
print(a)
print(b)

[666   1   2   3   4   5]
[0 1 2 3 4 5]
