## 偏导数

自变量为多个元素的情况下, 固定一个自变量为常数, 对另一个自变量进行求导, 理解为固定一个坐标轴作切面, 与函数图像相交的曲线求导数

### 方向导数
函数沿着某个方向的变化率称为函数沿着l方向的方向导数, 单位方向向量(cos alpha, cos beta), 偏导数是一种特殊的方向导数

### 梯度
函数在这一点上变化最大的方向(f'x(a), f'y(a))

## 向量

In [13]:
import numpy as np

In [14]:
# 定义一个向量
x = np.array([2,5,8])
print(x.shape)

(3,)


In [15]:
# 向量的转置
print(x.T)
print(x.shape)

[2 5 8]
(3,)


In [16]:
# 向量相加
y = np.array([1,3,7])
print(x + y)

[ 3  8 15]


In [17]:
# 向量与标量相乘
print(x * 3)

[ 6 15 24]


In [18]:
# 向量与向量相乘, 对应位置元素相乘
print(x * y)

[ 2 15 56]


In [19]:
# 向量点乘
print(np.dot(x, y))
print(x.dot(y))
print(x @ y)

73
73
73


In [20]:
# 计算范数
l0_norm = np.linalg.norm(x, ord=0)
l1_norm = np.linalg.norm(x, ord=1)
l2_norm = np.linalg.norm(x, ord=2)
print(l0_norm)
print(l1_norm)
print(l2_norm)

3.0
15.0
9.643650760992955


## 矩阵
R(m * n): m行n列
方阵: 行数与列数相等
对角矩阵: 主对角线以外的元素为0的方阵
单位矩阵: 主对角线元素全为1的对角矩阵

矩阵加减法与向量同理, 矩阵的乘法为行列分别相乘, 矩阵乘一个单位矩阵是自己本身

对于一个矩阵如果有一个矩阵与其相乘等于单位矩阵, 那么此矩阵为原矩阵的逆矩阵

In [21]:
import numpy as np

In [22]:
A = np.array([[1,2,3], [4,5,6]])
B = np.array([[1,3,7], [5,0,2]])
print(A)
print(A.shape)

[[1 2 3]
 [4 5 6]]
(2, 3)


In [23]:
# 转置
print(A.T)
print(A.T.shape)


[[1 4]
 [2 5]
 [3 6]]
(3, 2)


In [24]:
# 矩阵相加, 形状相同
print(A + B)
# 与标量相乘
print(A * 3)

[[ 2  5 10]
 [ 9  5  8]]
[[ 3  6  9]
 [12 15 18]]


In [25]:
# 与向量相乘, 对应位置相乘
print(A)
x = np.array([2,3,4])
print(x * A)

[[1 2 3]
 [4 5 6]]
[[ 2  6 12]
 [ 8 15 24]]


In [26]:
# 矩阵间 * 乘法
print(A)
print(B)
print(A * B) # 对应位置相乘, 哈达玛积

[[1 2 3]
 [4 5 6]]
[[1 3 7]
 [5 0 2]]
[[ 1  6 21]
 [20  0 12]]


In [27]:
# 矩阵乘法
print(A @ B.T)

[[28 11]
 [61 32]]


In [28]:
# 求逆
C = np.array([[1,2], [3,5]])
C_inv = np.linalg.inv(C)
print(C_inv)

[[-5.  2.]
 [ 3. -1.]]


In [29]:
# 伪逆矩阵
A_inv = np.linalg.pinv(A)
print(A_inv)

[[-0.94444444  0.44444444]
 [-0.11111111  0.11111111]
 [ 0.72222222 -0.22222222]]


### 其他的矩阵运算

1. 矩阵的向量化, 将矩阵转换为m * n列向量(这是默认的列向量化), 也可以按行来进行向量化
2. 矩阵的内积, 对应位置相乘的和
3. 哈达玛积, 对应位置相乘
4. Kronecker积, A中每一个元素都与B完整相乘, A为m * n, B为p * q, Kronecker积是m * n, p * q, 也称为直积或张量积
5. 张量: 视为多维数组, 标量, 1维向量, 2维矩阵的n维推广

In [30]:
# 向量化
print(A.flatten())  # 行向量化
print(B.flatten())

[1 2 3 4 5 6]
[1 3 7 5 0 2]


In [31]:
# 矩阵的内积
print(np.sum(A.flatten() * B.flatten()))

60


In [32]:
# Kronecker积
print(np.kron(A, B))

[[ 1  3  7  2  6 14  3  9 21]
 [ 5  0  2 10  0  4 15  0  6]
 [ 4 12 28  5 15 35  6 18 42]
 [20  0  8 25  0 10 30  0 12]]


In [33]:
# 张量 tensor
tensor = np.array([ [[1,2,3], [4,5,6]] , [[7,8,9], [10,11,12]] ])
print(tensor.shape)

(2, 2, 3)


## 矩阵的求导

本质上就是函数对变元的每个元素进行逐个求导, 最后的结果是向量, 矩阵的形式
![image.png](attachment:debba8b7-0869-4413-a304-63874ae0dd6e.png)

## 梯度矩阵
![image.png](attachment:3296d551-5ec7-4451-b1e8-8ad030110816.png)

In [34]:
# 计算离散梯度
f = np.array([1,2,4,7,11,16])
grad = np.gradient(f)
print(grad)

[1.  1.5 2.5 3.5 4.5 5. ]


In [35]:
print(A)
print(np.gradient(A))

[[1 2 3]
 [4 5 6]]
(array([[3., 3., 3.],
       [3., 3., 3.]]), array([[1., 1., 1.],
       [1., 1., 1.]]))
