In [1]:
import torch
import numpy as np

# BLAS 和 LAPACK概述

![image.png](attachment:image.png)

# 矩阵的形变及特殊矩阵构造方法 

![image.png](attachment:image.png)

In [2]:
# 创建一个2*3的矩阵
t1 = torch.arange(1,7).reshape(2,3).float()
t1

tensor([[1., 2., 3.],
        [4., 5., 6.]])

In [3]:
# 转置
torch.t(t1)

tensor([[1., 4.],
        [2., 5.],
        [3., 6.]])

In [4]:
t1.t()

tensor([[1., 4.],
        [2., 5.],
        [3., 6.]])

In [5]:
torch.eye(3)

tensor([[1., 0., 0.],
        [0., 1., 0.],
        [0., 0., 1.]])

In [6]:
t = torch.arange(5)+1
t

tensor([1, 2, 3, 4, 5])

In [7]:
torch.diag(t)

tensor([[1, 0, 0, 0, 0],
        [0, 2, 0, 0, 0],
        [0, 0, 3, 0, 0],
        [0, 0, 0, 4, 0],
        [0, 0, 0, 0, 5]])

In [8]:
# 对角线向上偏移一位
torch.diag(t,1)

tensor([[0, 1, 0, 0, 0, 0],
        [0, 0, 2, 0, 0, 0],
        [0, 0, 0, 3, 0, 0],
        [0, 0, 0, 0, 4, 0],
        [0, 0, 0, 0, 0, 5],
        [0, 0, 0, 0, 0, 0]])

In [9]:
# 对角线向下偏移一位
torch.diag(t,-1)

tensor([[0, 0, 0, 0, 0, 0],
        [1, 0, 0, 0, 0, 0],
        [0, 2, 0, 0, 0, 0],
        [0, 0, 3, 0, 0, 0],
        [0, 0, 0, 4, 0, 0],
        [0, 0, 0, 0, 5, 0]])

In [10]:
t1 = (torch.arange(9)+1).reshape(3,3)
t1

tensor([[1, 2, 3],
        [4, 5, 6],
        [7, 8, 9]])

In [11]:
# 取上三角矩阵
torch.triu(t1)

tensor([[1, 2, 3],
        [0, 5, 6],
        [0, 0, 9]])

In [12]:
# 取上三角矩阵向左下偏移一位
torch.triu(t1,-1)

tensor([[1, 2, 3],
        [4, 5, 6],
        [0, 8, 9]])

In [13]:
# 取上三角矩阵向右上偏移一位
torch.triu(t1,1)

tensor([[0, 2, 3],
        [0, 0, 6],
        [0, 0, 0]])

In [14]:
# 取下三角矩阵
torch.tril(t1)

tensor([[1, 0, 0],
        [4, 5, 0],
        [7, 8, 9]])

# 矩阵的基本运算 

![image.png](attachment:image.png)

## dot/vdot：点积运算 

注意，在PyTorch中，dot和vdot只能作用于一维张量，且对于数值型对象，二者计算结果并没有区别，两种函数只在进行复数运算时会有区别。更多复数运算的规则，我们将在涉及复数运算的场景中再进行详细说明。

In [15]:
t = torch.arange(1,4)
t

tensor([1, 2, 3])

In [16]:
torch.dot(t,t)

tensor(14)

In [17]:
torch.vdot(t,t)

tensor(14)

In [18]:
# 不能进行除了一维张量以外的计算
# torch.dot(t1,t1)

## mm：矩阵乘法 

在PyTorch中，矩阵乘法其实是一个函数簇，除了矩阵乘法以外，还有批量矩阵乘法、矩阵相乘相加、批量矩阵相乘相加等等函数。

In [19]:
t1 = torch.arange(1,7).reshape(2,3)
t1

tensor([[1, 2, 3],
        [4, 5, 6]])

In [20]:
t2 = torch.arange(1,10).reshape(3,3)
t2

tensor([[1, 2, 3],
        [4, 5, 6],
        [7, 8, 9]])

In [21]:
# 对应位置元素相乘
t1*t1

tensor([[ 1,  4,  9],
        [16, 25, 36]])

In [22]:
# 矩阵乘法
torch.mm(t1,t2)

tensor([[30, 36, 42],
        [66, 81, 96]])

## mv：矩阵和向量相乘 

PyTorch中提供了一类非常特殊的矩阵和向量相乘的函数，矩阵和向量相乘的过程我们可以看成是先将向量转化为列向量然后再相乘。

In [23]:
met = torch.arange(1,7).reshape(2,3)
met

tensor([[1, 2, 3],
        [4, 5, 6]])

In [24]:
vec = torch.arange(1,4)
vec

tensor([1, 2, 3])

在实际执行向量和矩阵相乘的过程中，需要矩阵的列数和向量的元素个数相同

In [25]:
torch.mv(met,vec)

tensor([14, 32])

In [26]:
vec.reshape(3,1)

tensor([[1],
        [2],
        [3]])

In [27]:
torch.mm(met,vec.reshape(3,1))

tensor([[14],
        [32]])

In [28]:
torch.mm(met,vec.reshape(3,1)).flatten()

tensor([14, 32])

## bmm：批量矩阵相乘 

In [29]:
t3 = torch.arange(1,13).reshape(3,2,2)
t3

tensor([[[ 1,  2],
         [ 3,  4]],

        [[ 5,  6],
         [ 7,  8]],

        [[ 9, 10],
         [11, 12]]])

In [30]:
t4 = torch.arange(1,19).reshape(3,2,3)
t4

tensor([[[ 1,  2,  3],
         [ 4,  5,  6]],

        [[ 7,  8,  9],
         [10, 11, 12]],

        [[13, 14, 15],
         [16, 17, 18]]])

In [31]:
torch.bmm(t3,t4)

tensor([[[  9,  12,  15],
         [ 19,  26,  33]],

        [[ 95, 106, 117],
         [129, 144, 159]],

        [[277, 296, 315],
         [335, 358, 381]]])

1.三维张量包含的矩阵个数需要相同。<br>
2.每个内部矩阵，需要满足矩阵乘法的条件，也就是左乘矩阵的行数要等于右乘矩阵的列数。

## addmm：矩阵相乘后相加

![image.png](attachment:image.png)

mat1:矩阵1<br>
mat2:矩阵2<br>
input:输入的矩阵或者张量<br>
alpha:系数<br>
beta:系数<br>

In [32]:
# mat1
t1

tensor([[1, 2, 3],
        [4, 5, 6]])

In [33]:
# mat2
t2

tensor([[1, 2, 3],
        [4, 5, 6],
        [7, 8, 9]])

In [34]:
# input
t = torch.arange(3)
t

tensor([0, 1, 2])

## addbmm：批量矩阵相乘后相加 

和addmm类似，都是先乘后加，并且可以设置权重。不同的是addbmm是批量矩阵相乘，并且，在相加的过程中也是矩阵相加，而非向量加矩阵

# 矩阵的线性代数运算 

![image.png](attachment:image.png)

## 矩阵的迹（trace） 

矩阵的迹的运算相对简单，就是矩阵对角线元素之和，在PyTorch中，可以使用trace函数进行计算。

In [35]:
A = torch.tensor([[1,2],[4,5]]).float()
A

tensor([[1., 2.],
        [4., 5.]])

In [36]:
torch.trace(A)

tensor(6.)

对于矩阵的迹来说，计算过程不需要是方阵

In [37]:
B = torch.arange(1,7).reshape(2,3)
B

tensor([[1, 2, 3],
        [4, 5, 6]])

In [38]:
torch.trace(B)

tensor(6)

## 矩阵的秩（rank） 

矩阵的秩(rank)，是指矩阵中行或列的极大线性无关数，且矩阵中行、列极大无关数总是相同的，任何矩阵的秩都是唯一值，满秩指的是方阵(行数和列数相同的矩阵)中行数、列数和秩相同，满秩矩阵有线性唯一解等重要特性，而其他矩阵也能通过求解秩来降维，同时，秩也是奇异值分解等运算中涉及到的重要概念

linalg.matrix_rank计算矩阵的秩

In [39]:
A = torch.arange(1,5).reshape(2,2).float()
A

tensor([[1., 2.],
        [3., 4.]])

In [40]:
torch.linalg.matrix_rank(A)

tensor(2)

In [41]:
B = torch.tensor([[1,2],[2,4]]).float()
B

tensor([[1., 2.],
        [2., 4.]])

对于矩阵B来说，第一列和第二列明显线性相关，最大线性无关组只有1组，因此矩阵的秩计算结果为1

In [42]:
torch.linalg.matrix_rank(B)

tensor(1)

## 矩阵的行列式（det） 

In [43]:
# 行列式的计算要求浮点型张量
A = torch.tensor([[1,2],[4,5]]).float()
A

tensor([[1., 2.],
        [4., 5.]])

In [44]:
torch.det(A)

tensor(-3.)

In [45]:
# 不满秩 等价于 行列式计算结果为0 等价于 无法求解逆矩阵
B

tensor([[1., 2.],
        [2., 4.]])

In [46]:
torch.det(B)

tensor(-0.)

## 线性方程组的矩阵表达形式 

In [47]:
import torch
A = torch.arange(1,5).reshape(2,2).float()
A

tensor([[1., 2.],
        [3., 4.]])

![image.png](attachment:image.png)

如果更进一步，我们希望在二维空间中找到一条直线，来拟合这两个点，也就是所谓的构建一个线性回归模型，我们可以设置线性回归方程如下:

![image.png](attachment:image.png)

### inverse函数：求解逆矩阵 

In [48]:
A = torch.tensor([[1.0,1],[3,1]])
A

tensor([[1., 1.],
        [3., 1.]])

In [49]:
B = torch.tensor([2.0,4])
B

tensor([2., 4.])

In [50]:
print(torch.inverse(A))

tensor([[-0.5000,  0.5000],
        [ 1.5000, -0.5000]])


In [52]:
torch.mm(torch.inverse(A),A)

tensor([[1., 0.],
        [0., 1.]])

In [53]:
torch.mm(A,torch.inverse(A))

tensor([[1., 0.],
        [0., 1.]])

![image.png](attachment:image.png)

In [54]:
torch.mv(torch.inverse(A),B)

tensor([1., 1.])

X = [1,1] -> a = 1 , b = 1

# 矩阵的分解 

![image.png](attachment:image.png)

## 特征分解（方阵）

![image.png](attachment:image.png)

torch.linalg.eig函数：特征分解

In [55]:
A = torch.arange(1,10).reshape(3,3).float()
A

tensor([[1., 2., 3.],
        [4., 5., 6.],
        [7., 8., 9.]])

In [61]:
# 注：此处需要输入参数为True才会返回矩阵的特征向量
torch.linalg.eig(A)

torch.return_types.linalg_eig(
eigenvalues=tensor([ 1.6117e+01+0.j, -1.1168e+00+0.j,  2.9486e-07+0.j]),
eigenvectors=tensor([[-0.2320+0.j, -0.7858+0.j,  0.4082+0.j],
        [-0.5253+0.j, -0.0868+0.j, -0.8165+0.j],
        [-0.8187+0.j,  0.6123+0.j,  0.4082+0.j]]))

In [62]:
B = torch.tensor([1,2,2,4]).reshape(2,2).float()
B

tensor([[1., 2.],
        [2., 4.]])

In [63]:
torch.linalg.matrix_rank(B)

tensor(1)

In [64]:
torch.linalg.eig(B)

torch.return_types.linalg_eig(
eigenvalues=tensor([0.+0.j, 5.+0.j]),
eigenvectors=tensor([[-0.8944+0.j, -0.4472+0.j],
        [ 0.4472+0.j, -0.8944+0.j]]))

In [68]:
C = torch.tensor([[1,2,3],[2,4,6],[3,6,9]]).float()
C

tensor([[1., 2., 3.],
        [2., 4., 6.],
        [3., 6., 9.]])

In [69]:
torch.linalg.eig(C)

torch.return_types.linalg_eig(
eigenvalues=tensor([ 1.4000e+01+0.j,  6.2356e-08+0.j, -2.8243e-07+0.j]),
eigenvectors=tensor([[-0.2673+0.j,  0.7869+0.j,  0.2873+0.j],
        [-0.5345+0.j, -0.6013+0.j,  0.7500+0.j],
        [-0.8018+0.j,  0.1386+0.j, -0.5958+0.j]]))

## 奇异值分解（SVD（非方阵）） 

![image.png](attachment:image.png)

svd 奇异值分解函数

In [71]:
C

tensor([[1., 2., 3.],
        [2., 4., 6.],
        [3., 6., 9.]])

In [72]:
torch.svd(C)

torch.return_types.svd(
U=tensor([[-2.6726e-01,  9.6362e-01, -3.7767e-08],
        [-5.3452e-01, -1.4825e-01, -8.3205e-01],
        [-8.0178e-01, -2.2237e-01,  5.5470e-01]]),
S=tensor([1.4000e+01, 4.2751e-08, 1.6397e-15]),
V=tensor([[-0.2673, -0.9636,  0.0000],
        [-0.5345,  0.1482, -0.8321],
        [-0.8018,  0.2224,  0.5547]]))

其中： U = U V = V S = S

In [73]:
CU,CS,CV = torch.svd(C)

In [74]:
torch.diag(CS)

tensor([[1.4000e+01, 0.0000e+00, 0.0000e+00],
        [0.0000e+00, 4.2751e-08, 0.0000e+00],
        [0.0000e+00, 0.0000e+00, 1.6397e-15]])

In [75]:
torch.mm(torch.mm(CU,torch.diag(CS)),CV.t())

tensor([[1.0000, 2.0000, 3.0000],
        [2.0000, 4.0000, 6.0000],
        [3.0000, 6.0000, 9.0000]])

能够看出，上述输出完整还原了C矩阵，此时我们可根据svd输出结果对C进行降维，此时C可只保留第一列 (后面的奇异值过小)，即k=1

In [76]:
U1 = CU[:,0].reshape(3,1)
U1

tensor([[-0.2673],
        [-0.5345],
        [-0.8018]])

In [78]:
S1 = CS[0]
S1

tensor(14.0000)

In [77]:
V1 = CV[:,0].reshape(1,3)
V1

tensor([[-0.2673, -0.5345, -0.8018]])

In [79]:
torch.mm((U1*S1),V1)

tensor([[1.0000, 2.0000, 3.0000],
        [2.0000, 4.0000, 6.0000],
        [3.0000, 6.0000, 9.0000]])

另外，我们需要知道的是，除了利用逆矩阵求解线性方程组系数外，比较通用的方法是使用最小二乘法进行求解: