# 张量
## 概念
- 可以看做就是一个数组，但是它可以在多个维度上进行操作；
- 0维张量就是一个数值变量，N维张量就是一个N维数组；
- 区别于数组，张量可以在多个维度进行并行计算（例如，在多个样本上同时进行计算，因为每个样本的计算是独立的），这使得它在深度学习中非常重要；
- 张量可以在多个样本上同时进行计算，这也是GPU这样的并行计算设备的优势所在，因为GPU可以同时在多个核心上进行计算。

## 张量的运算
张量的运算可以分为四个大类：元素级运算、形状变换运算、归约运算、线性代数运算

### 元素级运算
元素级运算就是对张量的每个元素进行操作，例如加法、减法、乘法、除法等，不改变张量的形状。

元素级运算有三大类：算术运算、数学函数运算、比较运算

#### 算术运行的示例

In [None]:
import torch

In [None]:
# 算术运行的示例
a = torch.tensor([[1, 2, 3], [4, 5, 6]])
b = torch.tensor([[7, 8, 9], [10, 11, 12]])
print('a = ', a)
print('b = ', b)

print('a * 3', a * 3)
print('a + b =', a + b)
print('a - 1 =', a - 1)
print('b / 2 =', b / 2)


#### 数学函数运算的示例

In [None]:
a = torch.tensor([[1, 2, 3], [4, 5, 6]])
b = torch.tensor([[7, 8, 9], [10, 11, 12]])
print('a = ', a)
print('b = ', b)

print('torch.sin(a) = ', torch.sin(a))
#  clamp 函数将 a 中的所有元素限制在 [0, 5] 之间(小于 0 的元素被设为 0，大于 5 的元素被设为 5)
print('torch.clamp(a, min=0, max=5) = ', torch.clamp(a, min=0, max=5))


#### 比较运算的示例

In [None]:
a = torch.tensor([[1, 2, 3], [4, 5, 6]])
b = torch.tensor([[7, 8, 9], [10, 11, 12]])
print('a = ', a)
print('b = ', b)

print('a > b = ', a > b)
print('a >= b = ', a >= b)
print('a < b = ', a < b)
print('a <= b = ', a <= b)
print('a == b = ', a == b)
print('a != b = ', a != b)


### 形状变换运算

这类运算仅改变张量的维度排列/形状，不修改元素本身，是工程编程中处理多位数组的核心操作。

#### 重塑形状
元素总数不变的前提下，修改张量的维度分布

In [None]:
a = torch.tensor([[1, 2, 3], [4, 5, 6]])
print('a =', a)

print('a.reshape(1, 6) =', a.reshape(1, 6))
print('a.reshape(1, 1, 2, 3) =', a.reshape(1, 1, 2, 3))


#### 维度增减

In [None]:
a = torch.tensor([[1, 2, 3], [4, 5, 6]])
print('a =', a)
print('a.shape =', a.shape)

print('a.unsqueeze(0) =', a.unsqueeze(0))
print('a.unsqueeze(0).shape =', a.unsqueeze(0).shape)

print('a.unsqueeze(2) =', a.unsqueeze(2))
print('a.unsqueeze(2).shape =', a.unsqueeze(2).shape)

print('a.squeeze(0).squeeze(0) =', a.squeeze(0).squeeze(0))
print('a.squeeze(0).squeeze(0).shape =', a.squeeze(0).squeeze(0).shape)


#### 转置与维度置换

In [None]:
a = torch.tensor([[1, 2, 3], [4, 5, 6]])
print('a =', a)
print('a.shape =', a.shape)

print('a.t() =', a.t())
print('a.t().shape =', a.t().shape)

img = torch.randn(3, 16, 16)
print('img.shape =', img.shape)
print('img.permute(1, 0, 2).shape =', img.permute(1, 0, 2).shape)


#### 拼接与分割

In [None]:
# 拼接两个(2,2)张量沿维度0（行方向）
a1 = torch.tensor([[1,2],[3,4]])
a2 = torch.tensor([[5,6],[7,8]])
a_cat = torch.cat([a1, a2], dim=0)  # 结果为(4,2)张量
print('a_cat =', a_cat)
print('a_cat.shape =', a_cat.shape)
b_cat = torch.cat([a1, a2], dim=1)  # 结果为(2,4)张量
print('b_cat =', b_cat)
print('b_cat.shape =', b_cat.shape)

### 归约运算

这类运算的核心，是对张量的指定维度进行聚合统计，降低张量的维度，对应工程编程中的数组求和、求积、求均值等操作（reduce）。

常用归约运算有：求和（torch.sum）、求均值（torch.mean）、求最大值（torch.max）、求最小值（torch.min）、求累积和（torch.cumsum）、求方差（torch.var）等

可以指定dim参数控制按照哪个维度进行归约运算。

In [None]:
# 定义(2,3)张量
l = torch.tensor([[1,2,3],[4,5,6]], dtype=torch.float32)
print('l =', l)
print('l.shape =', l.shape)

# 对整个张量求和（返回标量）
l_sum = torch.sum(l)  # 结果：21.0
print('l_sum =', l_sum)
print('l_sum.shape =', l_sum.shape)

# 沿维度1（列方向）求和（降维为(2,)）
l_sum_dim1 = torch.sum(l, dim=1)  # 结果：[6.0, 15.0]
print('l_sum_dim1 =', l_sum_dim1)
print('l_sum_dim1.shape =', l_sum_dim1.shape)

# 沿维度0（行方向）求均值（降维为(3,)）
l_mean_dim0 = torch.mean(l, dim=0)  # 结果：[2.5, 3.5, 4.5]
print('l_mean_dim0 =', l_mean_dim0)
print('l_mean_dim0.shape =', l_mean_dim0.shape)

# 归约后默认删除被聚合维度，设置keepdim=True可以保留被聚合维度
l_sum_dim1_keep = torch.sum(l, dim=1, keepdim=True)  # 结果：[[6.0], [15.0]]
print('l_sum_dim1_keep =', l_sum_dim1_keep)
print('l_sum_dim1_keep.shape =', l_sum_dim1_keep.shape)


### 线性代数运算

这类运算基于线性代数理论，主要针对二维张量（矩阵）和高维张量（如卷积层的输出），是深度学习中模型训练（如权重更新、矩阵乘法）的核心运算。

In [None]:
# 2维张量（矩阵）乘法
m = torch.tensor([[1,2],[3,4]], dtype=torch.float32)
print("矩阵m：\n", m)

n = torch.tensor([[5,6],[7,8]], dtype=torch.float32)
print("矩阵n：\n", n)

o = torch.matmul(m, n)  # 等价于 m @ n
print("矩阵乘法结果：\n", o)

# 2维张量的逆矩阵
m_inv = torch.inverse(m)
print("矩阵逆结果：\n", m_inv)

# 2维张量的行列式
m_det = torch.det(m)
print("矩阵m的行列式：\n", m_det)

## 张量的广播机制

张量的广播机制，是指在进行张量运算时，自动调整张量的形状，使它们的形状兼容，从而可以进行逐元素的运算。

In [60]:
# 张量的广播机制示例
m = torch.tensor([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
n = torch.tensor([4, 5, 6])
o = m + n

print('m = ', m)
print('n = ', n)
print('o = ', o)


m =  tensor([[1, 2, 3],
        [4, 5, 6],
        [7, 8, 9]])
n =  tensor([4, 5, 6])
o =  tensor([[ 5,  7,  9],
        [ 8, 10, 12],
        [11, 13, 15]])


tensor([ 0.0000,  1.1111,  2.2222,  3.3333,  4.4444,  5.5556,  6.6667,  7.7778,
         8.8889, 10.0000])