# Numpy基础知识点

作者：杨岱川

时间：2019年9月

github：https://github.com/DrDavidS/basic_Machine_Learning

开源协议：[MIT](https://github.com/DrDavidS/basic_Machine_Learning/blob/master/LICENSE)

## 导入Numpy

In [9]:
import numpy as np

np.set_printoptions(suppress=True)

## Numpy数组

先建立一个Python数组，然后转化为Numpy专有数组,并查看其数据类型。

NumPy最重要的一个特点就是其N维数组对象（即ndarray），该对象是一个快速而灵活的大数据集容器。

In [2]:
list_a = [1, 2, 3, 4, 5]
list_a

[1, 2, 3, 4, 5]

In [3]:
ndarray_a = np.array(list_a)
ndarray_a

array([1, 2, 3, 4, 5])

In [4]:
print(type(ndarray_a))

<class 'numpy.ndarray'>


## 数组运算

数组的“加减乘除”。

In [5]:
x = np.array([1.0, 2.0, 3.0])
y = np.array([2.0, 4.0, 6.0])

In [6]:
x + y

array([ 3.,  6.,  9.])

In [7]:
x - y

array([-1., -2., -3.])

In [8]:
x * y

array([  2.,   8.,  18.])

In [9]:
x / y

array([ 0.5,  0.5,  0.5])

In [10]:
x / 2.0

array([ 0.5,  1. ,  1.5])

## 多维数组（矩阵）

### 生成矩阵

- 生成一个2\*2的矩阵
- 查看矩阵的形状
- 查看矩阵的数据类型

In [11]:
A = np.array([[1, 2], [3, 4]])
A

array([[1, 2],
       [3, 4]])

In [12]:
A.shape

(2, 2)

In [13]:
A.dtype

dtype('int32')

### 矩阵的加法

In [14]:
B = np.array([[3, 1],[2, 6]])
B

array([[3, 1],
       [2, 6]])

In [15]:
A + B

array([[ 4,  3],
       [ 5, 10]])

### 矩阵的乘法

#### 元素级别的乘法

针对矩阵的对应元素相乘，要求两个矩阵的shape一直。

In [16]:
A * B

array([[ 3,  2],
       [ 6, 24]])

#### 矩阵的乘积

计算真正意义上的矩阵乘积，同线性代数中矩阵乘法的定义：

In [17]:
A_B_result = np.matmul(A, B)
A_B_result

array([[ 7, 13],
       [17, 27]])

In [18]:
B_A_result = np.matmul(B, A)
B_A_result

array([[ 6, 10],
       [20, 28]])

如果是不同形状的矩阵：

In [19]:
C = np.array([[1, 2, 3], [2, 3, 4]])
print(C)
print(C.shape)

[[1 2 3]
 [2 3 4]]
(2, 3)


In [20]:
D = np.array([[3, 1],[2, 6], [4, 7]])
print(D)
print(D.shape)

[[3 1]
 [2 6]
 [4 7]]
(3, 2)


In [21]:
try:
    print(C * D)
except:
    print("由于两个矩阵形状不同，不能使用对应元素相乘。")

由于两个矩阵形状不同，不能使用对应元素相乘。


In [22]:
result_C_D = np.dot(C, D)
print("矩阵C与矩阵D的乘积是：")
print(result_C_D)

矩阵C与矩阵D的乘积是：
[[19 34]
 [28 48]]


In [23]:
result_D_C = np.dot(D, C)
print("矩阵D与矩阵C的乘积是：")
print(result_D_C)

矩阵D与矩阵C的乘积是：
[[ 5  9 13]
 [14 22 30]
 [18 29 40]]


### 矩阵的广播

不同形状的数组在一定情况下也可以进行运算

In [24]:
A * 10

array([[10, 20],
       [30, 40]])

In [25]:
C = np.array([10, 20])
C

array([10, 20])

In [26]:
A * C 

array([[10, 40],
       [30, 80]])

这里称作为矩阵的广播，标量10和向量(10, 20)都被扩展到了2\*2的形状，让运算可以顺利执行。

### 访问矩阵元素

对矩阵中特定行、特定列，或者特定元素的访问。

使用 

```Python
np.random.randint(low, high=None, size=None, dtype='l')
```

- 生成一个5\*5的随机整数矩阵

  其中low表示下限（包括），high表示上限（不包括），size表示矩阵的形状，dtype表示数据类型，默认为np.int64。

In [27]:
F = np.random.randint(0, 10, size=(5, 5))
F

array([[2, 1, 4, 4, 8],
       [2, 5, 7, 3, 2],
       [1, 8, 8, 0, 0],
       [0, 9, 3, 6, 5],
       [3, 7, 6, 6, 8]])

- 第i行

In [28]:
F[0]  # 第一行，注意是从0开始

array([2, 1, 4, 4, 8])

- 第j列

In [29]:
F[:, 0]  # 第一列，其中 ： 表示全选

array([2, 2, 1, 0, 3])

- 特定元素选择

In [30]:
# 矩阵第三行第二列的元素的两种选择方法
print(F[2, 1])
print(F[2][1])

8
8


### 矩阵操作与计算

#### 2D矩阵的转置

注意：n维矩阵则需要添加参数，详情参见[numpy.ndarray.transpose](https://numpy.org/devdocs/reference/generated/numpy.ndarray.transpose.html)

In [31]:
F = np.matrix(F)

In [32]:
print("原矩阵F：")
print("")
print(F)
print("")

print("转置方法一：")
print("")
print(F.T)
print("")

print("转置方法二：")
print("")
print(F.transpose())

原矩阵F：

[[2 1 4 4 8]
 [2 5 7 3 2]
 [1 8 8 0 0]
 [0 9 3 6 5]
 [3 7 6 6 8]]

转置方法一：

[[2 2 1 0 3]
 [1 5 8 9 7]
 [4 7 8 3 6]
 [4 3 0 6 6]
 [8 2 0 5 8]]

转置方法二：

[[2 2 1 0 3]
 [1 5 8 9 7]
 [4 7 8 3 6]
 [4 3 0 6 6]
 [8 2 0 5 8]]


#### 矩阵求逆

In [16]:
M = np.array([[1., 2.], [3., 4.]])
M = np.matrix(M)

In [17]:
print("原矩阵M：")
print("")
print(M)
print("")

print("求逆方法一：")
print("")
print(M.I)
print("")

print("求逆方法二：")
print("")
print(np.linalg.inv(M))

原矩阵M：

[[1. 2.]
 [3. 4.]]

求逆方法一：

[[-2.   1. ]
 [ 1.5 -0.5]]

求逆方法二：

[[-2.   1. ]
 [ 1.5 -0.5]]


验证：M \* M.I 是否等于E ？

可以看到，由于计算精度的原因，不是一个完美的E矩阵。

In [18]:
result = M * M.I
result

matrix([[1., 0.],
        [0., 1.]])

我们在这里对打印精度做一个设置，可以避免这个问题，参见[numpy.set_printoptions](https://numpy.org/devdocs/reference/generated/numpy.set_printoptions.html)。

In [19]:
np.set_printoptions(suppress=True)
result

matrix([[1., 0.],
        [0., 1.]])

#### 矩阵的迹

矩阵的迹（trace）就是矩阵的主对角线元素之和。

In [37]:
F

matrix([[2, 1, 4, 4, 8],
        [2, 5, 7, 3, 2],
        [1, 8, 8, 0, 0],
        [0, 9, 3, 6, 5],
        [3, 7, 6, 6, 8]])

In [38]:
F.trace()

matrix([[29]])

#### 矩阵的秩

一个矩阵A的列秩是A的线性独立的纵列的极大数，通常表示为r(A)，rk(A)或rank A。

In [39]:
A = np.eye(4)  # 建立一个单位矩阵
A

array([[ 1.,  0.,  0.,  0.],
       [ 0.,  1.,  0.,  0.],
       [ 0.,  0.,  1.,  0.],
       [ 0.,  0.,  0.,  1.]])

In [40]:
np.linalg.matrix_rank(A)

4

#### 矩阵的特征值与特征向量

设 $A$ 是 $n$ 阶方阵，若数 $\lambda$ 和 $n$ 维非零列向量 $x$，使得

$$Ax = \lambda x (x\ne0)$$

成立，则称 $\lambda$ 是方阵 $A$ 的一个特征值，$x$ 为方阵 $A$ 的对应于特征值 $\lambda$ 的一个特征向量。

以下方矩阵为例：

$$
\left[
 \begin{matrix}
   -1 & 2 & 2\\
   2 & -1 & 2\\
   2 & -2 & 1
  \end{matrix} 
\right]
$$

In [57]:
# 例
B = np.array([[-1, 2, 2], 
              [2, -1, -2],
              [2, -2, -1]])
B = np.matrix(B)
B

matrix([[-1,  2,  2],
        [ 2, -1, -2],
        [ 2, -2, -1]])

In [58]:
w, v = np.linalg.eig(B)
print(f"矩阵的特征值为：\n{w}")

矩阵的特征值为：
[ 1. -5.  1.]


In [59]:
# 特征向量参考价值不大，因为是数值
print(f"矩阵的特征向量为：\n{v}")

矩阵的特征向量为：
[[ 0.81649658  0.57735027 -0.03478434]
 [ 0.40824829 -0.57735027 -0.72385699]
 [ 0.40824829 -0.57735027  0.68907264]]
