# Lib库解

In [1]:
import torch as tor

导个库先

## 线性代数torch代码的基本实现

### 标量表示

In [2]:
x_scalar = tor.tensor(3.0)
y_scalar = tor.tensor(4.0)

x_scalar + y_scalar, x_scalar * y_scalar, x_scalar / y_scalar, x_scalar ** y_scalar 

(tensor(7.), tensor(12.), tensor(0.7500), tensor(81.))

标量其实就是单个元素的张量，操作方法就是简单的加减乘除和乘方

### 向量(张量)

#### 张量表示

In [3]:
x_tensor = tor.arange(4)
x_tensor

tensor([0, 1, 2, 3])

#### 张量索引访问元素

In [4]:
x_tensor[2] # 从0索引开始哦

tensor(2)

就是直接方括号标出来就好了，记得索引从0开始

#### 张量长度(len)

In [5]:
len(x_tensor)

4

- 函数名称：len(张量/数组【python】)
- 函数作用：给出张量/数组的长度
- 函数输入：张量/数组【python】
- 函数输出：张量/数组的长度（数字，其实就是python的一个标准库中的东西）
- 函数依赖：无

#### 张量形状(shape)

In [6]:
x_tensor.shape

torch.Size([4])

- 函数名称：shape
- 函数作用：返回张量的构型
- 函数输入：无(依赖型)
- 函数输出：torch_tensor的构型
- 函数依赖：是--依赖torch_tensor

#### 指定构型张量创建(reshape)

In [7]:
x_matrix = tor.arange(20)
x_matrix = x_matrix.reshape(5,4)
x_matrix

tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11],
        [12, 13, 14, 15],
        [16, 17, 18, 19]])

- 函数名字：reshape(行,列)
- 函数作用：将torch_tensor在元素不变的情况下结构发生改变，变为 n行 m列
- 函数输入：tensor_hang 要改变成的张量的行 tensor_lie 要改变成的张量的列
- 函数输出：变化后的张量
- 函数依赖：是--依赖torch_tensor

### 矩阵

#### 矩阵转置(.T)

In [8]:
x_1 = tor.zeros(4,5,dtype=tor.float32)
x_1[:] = x_matrix.T # 注意真正的数组赋值
x_1[0,0] = 1
x_matrix.T,x_matrix

(tensor([[ 0,  4,  8, 12, 16],
         [ 1,  5,  9, 13, 17],
         [ 2,  6, 10, 14, 18],
         [ 3,  7, 11, 15, 19]]),
 tensor([[ 0,  1,  2,  3],
         [ 4,  5,  6,  7],
         [ 8,  9, 10, 11],
         [12, 13, 14, 15],
         [16, 17, 18, 19]]))

- 函数名字：T
- 函数作用：将torch_tensor在元素不变的情况下进行矩阵转置
- 函数输入：无
- 函数输出：转置后的张量
- 函数依赖：是--依赖torch_tensor

##### 对称矩阵转置$A = A^T$

In [9]:
A = tor.tensor([[1,2,3],[2,0,4],[3,4,0]])
A

tensor([[1, 2, 3],
        [2, 0, 4],
        [3, 4, 0]])

In [10]:
A == A.T

tensor([[True, True, True],
        [True, True, True],
        [True, True, True]])

#### 更多轴的数据结构

In [11]:
X = tor.arange(24).reshape(2,3,4) # 多了一个轴捏
X

tensor([[[ 0,  1,  2,  3],
         [ 4,  5,  6,  7],
         [ 8,  9, 10, 11]],

        [[12, 13, 14, 15],
         [16, 17, 18, 19],
         [20, 21, 22, 23]]])

![image.png](attachment:image.png)

#### 二元运算(两个张量构型相同)

##### 克隆(clone)[真的开新地址]

In [12]:
A = tor.arange(20,dtype=tor.float32).reshape(5,4)
B = A.clone()
B[0,0] = 100.5
A,B

(tensor([[ 0.,  1.,  2.,  3.],
         [ 4.,  5.,  6.,  7.],
         [ 8.,  9., 10., 11.],
         [12., 13., 14., 15.],
         [16., 17., 18., 19.]]),
 tensor([[100.5000,   1.0000,   2.0000,   3.0000],
         [  4.0000,   5.0000,   6.0000,   7.0000],
         [  8.0000,   9.0000,  10.0000,  11.0000],
         [ 12.0000,  13.0000,  14.0000,  15.0000],
         [ 16.0000,  17.0000,  18.0000,  19.0000]]))

##### +-*/** [元素对元素相加/相减/相乘/相除/相乘方]

In [13]:
A + B, A - B, A * B, A / B, A ** B

(tensor([[100.5000,   2.0000,   4.0000,   6.0000],
         [  8.0000,  10.0000,  12.0000,  14.0000],
         [ 16.0000,  18.0000,  20.0000,  22.0000],
         [ 24.0000,  26.0000,  28.0000,  30.0000],
         [ 32.0000,  34.0000,  36.0000,  38.0000]]),
 tensor([[-100.5000,    0.0000,    0.0000,    0.0000],
         [   0.0000,    0.0000,    0.0000,    0.0000],
         [   0.0000,    0.0000,    0.0000,    0.0000],
         [   0.0000,    0.0000,    0.0000,    0.0000],
         [   0.0000,    0.0000,    0.0000,    0.0000]]),
 tensor([[  0.,   1.,   4.,   9.],
         [ 16.,  25.,  36.,  49.],
         [ 64.,  81., 100., 121.],
         [144., 169., 196., 225.],
         [256., 289., 324., 361.]]),
 tensor([[0., 1., 1., 1.],
         [1., 1., 1., 1.],
         [1., 1., 1., 1.],
         [1., 1., 1., 1.],
         [1., 1., 1., 1.]]),
 tensor([[0.0000e+00, 1.0000e+00, 4.0000e+00, 2.7000e+01],
         [2.5600e+02, 3.1250e+03, 4.6656e+04, 8.2354e+05],
         [1.6777e+07, 3.8742e+08, 

##### 标量相操作

In [14]:
a = 2
a + A, a * A

(tensor([[ 2.,  3.,  4.,  5.],
         [ 6.,  7.,  8.,  9.],
         [10., 11., 12., 13.],
         [14., 15., 16., 17.],
         [18., 19., 20., 21.]]),
 tensor([[ 0.,  2.,  4.,  6.],
         [ 8., 10., 12., 14.],
         [16., 18., 20., 22.],
         [24., 26., 28., 30.],
         [32., 34., 36., 38.]]))

直接就是整体系数了

#### 元素和(sum)

In [15]:
C= tor.arange(10).reshape(2,5)
C.sum(),C

(tensor(45),
 tensor([[0, 1, 2, 3, 4],
         [5, 6, 7, 8, 9]]))

- 函数名字：sum()
- 函数作用：将依赖的torch_tensor进行数值求和
- 函数输入：无
- 函数输出：所有元素的求和
- 函数依赖：是--依赖torch_tensor

##### 指定张量维度求和(用于降维)

In [16]:
C_sum_axis0 = C.sum(axis=0)
C_sum_axis1 = C.sum(axis=1)
C_sum_axis0,C_sum_axis0.shape,C_sum_axis1,C_sum_axis1.shape

(tensor([ 5,  7,  9, 11, 13]),
 torch.Size([5]),
 tensor([10, 35]),
 torch.Size([2]))

我们可以看到对于axis的判定,axis是由在reshape中的定义来进行操作的例如：
- axis=0就是最高维
- axis=1就是次高维
- axis=n就是(max-n)维
> 对于reshape中的维度定义我们可以发现：(高维->低维)

In [21]:
test_vector = tor.arange(24,dtype=tor.float32).reshape(2,3,4)
test_vector,test_vector.sum(axis=0).shape,test_vector.sum(axis=1).shape,test_vector.sum(axis=2).shape,test_vector.sum(axis=0),test_vector.sum(axis=1),test_vector.sum(axis=2)

(tensor([[[ 0.,  1.,  2.,  3.],
          [ 4.,  5.,  6.,  7.],
          [ 8.,  9., 10., 11.]],
 
         [[12., 13., 14., 15.],
          [16., 17., 18., 19.],
          [20., 21., 22., 23.]]]),
 torch.Size([3, 4]),
 torch.Size([2, 4]),
 torch.Size([2, 3]),
 tensor([[12., 14., 16., 18.],
         [20., 22., 24., 26.],
         [28., 30., 32., 34.]]),
 tensor([[12., 15., 18., 21.],
         [48., 51., 54., 57.]]),
 tensor([[ 6., 22., 38.],
         [54., 70., 86.]]))

#### 矩阵形状(shape)

In [22]:
test_vector.shape

torch.Size([2, 3, 4])

- 函数名字：shape
- 函数作用：输出torch_tensor的结构
- 函数输入：无（依赖型）
- 函数输出：torch.Size([高维->低维])【这是一个会描述torch_tensor结构的数据类型】***这也是个矩阵***
- 函数依赖：是--依赖torch_tensor

#### 平均值(mean和average)

In [24]:
test_vector.mean(),test_vector.sum() / test_vector.numel()

(tensor(11.5000), tensor(11.5000))

- 函数名字：mean
- 函数作用：输出torch_tensor的平均值
- 函数输入：无（依赖型）
- 函数输出：torch.tensor()【是一个数值型】
- 函数依赖：是--依赖torch_tensor**且torch_tensor内部填的是float型值**

##### **带axis参数**

In [27]:
test_vector.mean(axis=0),test_vector.sum(axis=0) / test_vector.shape[0]

(tensor([[ 6.,  7.,  8.,  9.],
         [10., 11., 12., 13.],
         [14., 15., 16., 17.]]),
 tensor([[ 6.,  7.,  8.,  9.],
         [10., 11., 12., 13.],
         [14., 15., 16., 17.]]))

带层级结构，和之前的带层级结构的差不多

#### **计算时保持轴数**

In [34]:
keep_test = tor.arange(20).reshape(5,4)
keep_test.sum(axis=1),keep_test.sum(axis=1, keepdims=True)

(tensor([ 6, 22, 38, 54, 70]),
 tensor([[ 6],
         [22],
         [38],
         [54],
         [70]]))

保持轴数,keepdim这个参数的作用就是保证了矩阵的维数不会因为求和或者是求平均值而发生退化现象(求平均值或者是求和之后会出现结果变换为最小维度数的现象,而不是保持原来的层级结构,不利于"传播")

> 传播举例

In [38]:
print("这是原矩阵keep_test")
print(keep_test)
print("这是保持维度之后的矩阵keep_test.sum(axis = 1,keepdim=True)这是保存维度之后的状态")
print(keep_test.sum(axis = 1,keepdim=True))
print("这是计算keep_test / keep_test.sum(axis = 1,keepdim=True)")
print(keep_test / keep_test.sum(axis = 1,keepdim=True))

这是原矩阵keep_test
tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11],
        [12, 13, 14, 15],
        [16, 17, 18, 19]])
这是保持维度之后的矩阵keep_test.sum(axis = 1,keepdim=True)这是保存维度之后的状态
tensor([[ 6],
        [22],
        [38],
        [54],
        [70]])
这是计算keep_test / keep_test.sum(axis = 1,keepdim=True)
tensor([[0.0000, 0.1667, 0.3333, 0.5000],
        [0.1818, 0.2273, 0.2727, 0.3182],
        [0.2105, 0.2368, 0.2632, 0.2895],
        [0.2222, 0.2407, 0.2593, 0.2778],
        [0.2286, 0.2429, 0.2571, 0.2714]])


#### 计算轴上元素总和(cumsum)

In [40]:
cal_matrix = tor.arange(20).reshape(5,4)
cal_matrix,cal_matrix.cumsum(axis = 0),cal_matrix.cumsum(axis = 1)

(tensor([[ 0,  1,  2,  3],
         [ 4,  5,  6,  7],
         [ 8,  9, 10, 11],
         [12, 13, 14, 15],
         [16, 17, 18, 19]]),
 tensor([[ 0,  1,  2,  3],
         [ 4,  6,  8, 10],
         [12, 15, 18, 21],
         [24, 28, 32, 36],
         [40, 45, 50, 55]]),
 tensor([[ 0,  1,  3,  6],
         [ 4,  9, 15, 22],
         [ 8, 17, 27, 38],
         [12, 25, 39, 54],
         [16, 33, 51, 70]]))

- 函数名字：cumsum(axis = n)
- 函数作用：输出torch_tensor的(max- n)维轴向计算元素总和,越后面越大
- 函数输入：无（依赖型）
- 函数输出：torch.tensor()【与输入矩阵一致】
- 函数依赖：是--依赖torch_tensor

#### 点积(dot)$\odot$[ $\quad \vec{x} \odot \vec{y} \quad$ ]

In [41]:
x_dot = tor.ones(4)
y_dot = tor.ones(4)
x_dot,y_dot,tor.dot(x_dot,y_dot)

(tensor([1., 1., 1., 1.]), tensor([1., 1., 1., 1.]), tensor(4.))

- 函数名字：tor.dot(x_tensor,y_tensor)
- 函数作用：输出**两个同结构torch_tensor向量**点积的值
- 函数输入：x_tensor,y_tensor(必须是向量，且同结构)
- 函数输出：torch.tensor()【是一个数值型】
- 函数依赖：无--但操作依赖torch_tensor**且torch_tensor内部填的是float型值**

##### 相等解法

In [42]:
tor.sum(x_dot * y_dot)

tensor(4.)

#### 点积(mv)$\bullet$[ $\quad A \bullet \vec{x}^T \quad$ ]

In [45]:
A_dot = tor.arange(20).reshape(5,4)
x_vec_dot = tor.arange(4)
A_dot,x_vec_dot,tor.mv(A_dot, x_vec_dot)

(tensor([[ 0,  1,  2,  3],
         [ 4,  5,  6,  7],
         [ 8,  9, 10, 11],
         [12, 13, 14, 15],
         [16, 17, 18, 19]]),
 tensor([0, 1, 2, 3]),
 tensor([ 14,  38,  62,  86, 110]))

- 函数名字：tor.mv(matrix, vec)
- 函数作用：输出torch_tensor的$matrix \bullet \vec{vec}^T $
- 函数输入：torch_tensor的matrix, torch_tensor的vector(前后位置敏感)
- 函数输出：torch.tensor的vector
- 函数依赖：否--但输入依赖torch_tensor类

#### 点积(mm)$\bullet$[$\quad A \bullet A \quad$]

In [46]:
M1_dot = tor.arange(20).reshape(5,4)
M2_dot = tor.arange(12).reshape(4,3)
M1_dot,M2_dot,tor.mm(M1_dot,M2_dot)

(tensor([[ 0,  1,  2,  3],
         [ 4,  5,  6,  7],
         [ 8,  9, 10, 11],
         [12, 13, 14, 15],
         [16, 17, 18, 19]]),
 tensor([[ 0,  1,  2],
         [ 3,  4,  5],
         [ 6,  7,  8],
         [ 9, 10, 11]]),
 tensor([[ 42,  48,  54],
         [114, 136, 158],
         [186, 224, 262],
         [258, 312, 366],
         [330, 400, 470]]))

- 函数名字：tor.mm(matrix1,matrix2)
- 函数作用：输出torch_tensor类的两个矩阵的点积
- 函数输入：torch_tensor类matrix1,matrix2(前后位置敏感)
- 函数输出：torch.tensor类matrix
- 函数依赖：否--但输入依赖torch_tensor类型

#### $L_2$范数是向量的平方根(norm)

$$||x||_2 = \sqrt{\sum^n_{i = 1}x^2_i}$$

In [48]:
u = tor.tensor([1.0,2.0,3.0])
tor.norm(u)

tensor(3.7417)

- 函数名字：tor.norm(vector)
- 函数作用：输出torch_tensor的向量的$L_2$范数
- 函数输入：torch_tensor的向量**且torch_tensor内部填的是float型值**
- 函数输出：torch.tensor()【是一个数值型】
- 函数依赖：无

#### $L_1$范数是向量的绝对值的和(组合型)

$$ ||x||_1 = \sum^n_{i = 1}|x_i| $$

In [49]:
tor.abs(u).sum()

tensor(6.)

#### 矩阵的Frobenius范数(Frobenius norm)是矩阵元素平方和的平方根

$$ ||X||_F = \sqrt{\sum^m_{i = 1}\sum^n_{j = 1}x^2_{ij}} $$

In [52]:
U = tor.tensor([[1.0,2.0,3.0],[1.0,2.5,3.7],[4.0,5.2,6.6]])
U,tor.norm(U)

(tensor([[1.0000, 2.0000, 3.0000],
         [1.0000, 2.5000, 3.7000],
         [4.0000, 5.2000, 6.6000]]),
 tensor(11.0245))

- 函数名字：tor.norm(matrix)
- 函数作用：输出torch_tensor的矩阵的Frobenius范数
- 函数输入：torch_tensor的矩阵**且torch_tensor内部填的是float型值**
- 函数输出：torch.tensor()【是一个数值型】
- 函数依赖：无