# 4-1,张量的结构操作

本篇我们介绍张量的结构操作。

张量结构操作主要包括：张量创建，索引切片，维度变换，合并分割。




In [None]:
import torch

print("torch.__version__=" + torch.__version__)

### 一，创建张量

张量创建的许多方法和numpy中创建array的方法很像。

In [None]:
import numpy as np
import torch

In [None]:
a = torch.tensor([1, 2, 3], dtype=torch.float)
print(a)

In [None]:
b = torch.arange(1, 10, step=2)
print(b)

In [None]:
c = torch.linspace(0.0, 2 * 3.14, 10)
print(c)

In [None]:
d = torch.zeros((3, 3))
print(d)

In [None]:
a = torch.ones((3, 3), dtype=torch.int)
b = torch.zeros_like(a, dtype=torch.float)
print(a)
print(b)


In [None]:
torch.fill_(b, 5)  # fill_方法是一个原地操作，会修改原始张量b的内容
print(b)

In [None]:
# 设置随机种子，以确保生成的随机数可复现
torch.manual_seed(0)

# 定义均匀分布的最小值和最大值
minval, maxval = 0, 10

# 使用torch.rand()生成一个包含5个随机数的一维张量
# 这些随机数在[minval, maxval)范围内均匀分布
a = minval + (maxval - minval) * torch.rand([5])

# 打印生成的随机数张量a
print(a)


In [None]:
# 使用torch.normal()生成一个正态分布的随机数张量
# 这里使用了两个参数，mean和std，分别表示均值和标准差
# mean=torch.zeros(3, 3) 表示均值为一个3x3的全零矩阵
# std=torch.ones(3, 3) 表示标准差为一个3x3的全一矩阵
b = torch.normal(mean=torch.zeros(3, 3), std=torch.ones(3, 3))

# 打印生成的正态分布随机数张量b
print(b)


In [None]:
# 定义正态分布的均值和标准差
mean, std = 2, 5

# 使用torch.randn()生成一个正态分布的随机数张量
# 这里的张量形状是(3, 3)，表示一个3x3的矩阵
# 随机数服从均值为mean，标准差为std的正态分布
c = std * torch.randn((3, 3)) + mean

# 打印生成的正态分布随机数张量c
print(c)


In [None]:
# 使用torch.randperm()生成一个包含1到19的整数的随机排列
# 参数20表示生成的整数范围是从0到19（总共20个整数）
d = torch.randperm(20)

# 打印生成的随机排列d
print(d)


In [None]:
# 创建一个3x3的单位矩阵
I = torch.eye(3, 3)

# 打印单位矩阵I
print("单位矩阵（Identity Matrix）：")
print(I)

# 创建一个对角矩阵，对角线上的元素分别为1、2和3
t = torch.diag(torch.tensor([1, 2, 3]))

# 打印对角矩阵t
print("对角矩阵（Diagonal Matrix）：")
print(t)


### 二 ，索引切片

张量的索引切片方式和numpy几乎是一样的。切片时支持缺省参数和省略号。

可以通过索引和切片对部分元素进行修改。

此外，对于不规则的切片提取,可以使用torch.index_select, torch.masked_select, torch.take

如果要通过修改张量的某些元素得到新的张量，可以使用torch.where,torch.masked_fill,torch.index_fill

In [None]:
# 设置随机种子，以确保生成的随机数是可复现的
torch.manual_seed(0)

# 定义均匀分布的最小值和最大值
minval, maxval = 0, 10

# 使用torch.rand()生成一个5x5的均匀分布的随机数矩阵
# 然后使用torch.floor()将随机数矩阵中的每个元素向下取整
# 最后通过.int()方法将结果转换为整数矩阵
t = torch.floor(minval + (maxval - minval) * torch.rand([5, 5])).int()

# 打印生成的均匀随机整数矩阵t
print(t)


In [None]:
#第0行
print(t[0])

In [None]:
#倒数第一行
print(t[-1])

In [None]:
#第1行第3列
print(t[1, 3])
print(t[1][3])

In [None]:
#第1行至第3行
print(t[1:4, :])

In [None]:
#第1行至最后一行，第0列到最后一列每隔两列取一列
print(t[1:4, :4:2])


In [None]:
#可以使用索引和切片修改部分元素
x = torch.Tensor([[1, 2], [3, 4]])
x.data[1, :] = torch.tensor([0.0, 0.0])
x

In [None]:
a = torch.arange(27).view(3, 3, 3)
print(a)

In [None]:
#省略号可以表示多个冒号
print(a[..., 1])

以上切片方式相对规则，对于不规则的切片提取,可以使用torch.index_select, torch.take, torch.gather, torch.masked_select.

考虑班级成绩册的例子，有4个班级，每个班级5个学生，每个学生7门科目成绩。可以用一个4×5×7的张量来表示。


In [None]:
minval = 0
maxval = 100

# 使用 torch.rand() 生成一个形状为 (4, 5, 7) 的均匀随机数张量
# 然后将其缩放和平移，以确保生成在指定的最小值和最大值范围内
# 最后，通过 .int() 方法将结果转换为整数类型的张量
scores = torch.floor(minval + (maxval - minval) * torch.rand([4, 5, 7])).int()

# 打印生成的随机整数张量 scores
print(scores)


In [None]:
#抽取每个班级第0个学生，第2个学生，第4个学生的全部成绩
torch.index_select(scores, dim=1, index=torch.tensor([0, 2, 4]))


In [None]:
# scores 是包含学生成绩的张量，形状为 (班级数, 学生数, 课程数)

# 使用 torch.index_select() 函数抽取每个班级中的第0个、第2个、第4个学生的成绩
# dim=1 表示在学生维度上进行操作，index 指定了要抽取的学生索引

selected_students = torch.index_select(scores, dim=1, index=torch.tensor([0, 2, 4]))

# 使用 torch.index_select() 函数抽取每个班级中的第1门、第3门、第6门课程的成绩
# dim=2 表示在课程维度上进行操作，index 指定了要抽取的课程索引
selected_courses = torch.index_select(selected_students, dim=2, index=torch.tensor([1, 3, 6]))

# 最终得到的 selected_courses 张量包含了所需的成绩信息
q = selected_courses

# 打印抽取的成绩张量 q
print(q)


In [None]:
#抽取第0个班级第0个学生的第0门课程，第2个班级的第3个学生的第1门课程，第3个班级的第4个学生第6门课程成绩

# scores 是包含学生成绩的张量，形状为 (班级数, 学生数, 课程数)
# 使用 torch.take() 函数抽取指定位置的成绩
# 这里我们通过计算索引来获取需要的成绩
# 例如，第0个班级的第0个学生的第0门课程对应的索引是 0 * 5 * 7 + 0 = 0
# 第2个班级的第3个学生的第1门课程对应的索引是 2 * 5 * 7 + 3 * 7 + 1 = 92
# 第3个班级的第4个学生的第6门课程对应的索引是 3 * 5 * 7 + 4 * 7 + 6 = 139
# 这些索引将成绩张量 scores 看作一维数组，并从中抽取所需的元素
selected_scores = torch.take(scores, torch.tensor([0, 92, 139]))

# 最终得到的 selected_scores 包含了所需的成绩信息
s = selected_scores

# 打印抽取的成绩张量 s
print(s)



In [None]:
#抽取分数大于等于80分的分数（布尔索引）

# 使用 torch.masked_select() 函数抽取满足条件（分数大于等于80分）的分数
# scores >= 80 返回一个布尔张量，指示哪些元素满足条件
# 然后 torch.masked_select(scores, scores >= 80) 从 scores 中抽取满足条件的分数
selected_scores = torch.masked_select(scores, scores >= 80)

# 最终得到的 selected_scores 包含了满足条件的成绩信息
g = selected_scores

# 打印抽取的满足条件的成绩张量 g
print(g)


以上这些方法仅能提取张量的部分元素值，但不能更改张量的部分元素值得到新的张量。

如果要通过修改张量的部分元素值得到新的张量，可以使用torch.where,torch.index_fill 和 torch.masked_fill

torch.where可以理解为if的张量版本。

torch.index_fill的选取元素逻辑和torch.index_select相同。

torch.masked_fill的选取元素逻辑和torch.masked_select相同。


In [None]:
# 使用 torch.where() 函数根据条件进行赋值操作
# 当 scores 大于60分时，赋值为1；否则赋值为0
ifpass = torch.where(scores > 60, torch.tensor(1), torch.tensor(0))

# 最终得到的 ifpass 包含了根据条件赋值后的成绩信息
# 大于60分的成绩变为1，小于等于60分的成绩变为0
print(ifpass)

In [None]:
#将每个班级第0个学生，第2个学生，第4个学生的全部成绩赋值成满分
#注意，这是一个原地操作，会修改原始的 scores 张量
torch.index_fill(scores, dim=1, index=torch.tensor([0, 2, 4]), value=100)
#等价于 scores.index_fill(dim = 1,index = torch.tensor([0,2,4]),value = 100)

In [None]:
# 使用 torch.masked_fill() 函数将分数小于60分的分数赋值为60分
# scores < 60 返回一个布尔张量，指示哪些成绩小于60分
# 然后 torch.masked_fill(scores, scores < 60, 60) 对满足条件的元素进行赋值操作
b = torch.masked_fill(scores, scores < 60, 60)

# 最终得到的 b 包含了分数小于60分的成绩被赋值为60分的信息
print(b)

### 三，维度变换

维度变换相关函数主要有 torch.reshape(或者调用张量的view方法), torch.squeeze, torch.unsqueeze, torch.transpose

torch.reshape 可以改变张量的形状。

torch.squeeze 可以减少维度。

torch.unsqueeze 可以增加维度。

torch.transpose/torch.permute 可以交换维度。


In [None]:
# 导入PyTorch库
import torch

# 设置随机种子，以确保生成的随机数是可复现的
torch.manual_seed(0)

# 定义随机整数的最小值和最大值
minval, maxval = 0, 255

# 使用 torch.rand() 生成一个形状为 (1, 3, 3, 2) 的随机整数张量
# 然后通过 .int() 方法将结果转换为整数类型的张量
a = (minval + (maxval - minval) * torch.rand([1, 3, 3, 2])).int()

# 打印生成的随机整数张量 a 的形状和内容
print("原始形状：", a.shape)
print("原始内容：", a)

# 使用 reshape() 方法改变形状
# 这里将形状从 (1, 3, 3, 2) 改变为 (3, 6)
b = a.reshape(3, 6)

# 打印改变形状后的张量 b 的形状和内容
print("改变形状后：", b.shape)
print("改变形状后内容：", b)


In [None]:
# 使用 view() 方法将张量 a 的形状从 (1, 3, 3, 2) 改变为 (3, 6)
b = a.view([3, 6])

# 打印改变形状后的张量 b 的形状和内容
print("改变形状后：", b.shape)
print("改变形状后内容：", b)


In [None]:
# 改回成 [1,3,3,2] 形状的张量
c = torch.reshape(b, [1, 3, 3, 2])  # b.view([1,3,3,2]) 
print(c)

如果张量在某个维度上只有一个元素，利用torch.squeeze可以消除这个维度。

torch.unsqueeze的作用和torch.squeeze的作用相反。

In [None]:
# 创建一个形状为 (1, 2) 的张量 a
a = torch.tensor([[1.0, 2.0]])

# 使用 torch.squeeze() 函数移除维度为1的维度，生成新的张量 s
s = torch.squeeze(a)

# 打印原始张量 a 和新生成的张量 s
print("原始张量 a：", a)
print("新生成的张量 s：", s)

# 打印张量 a 和 s 的形状
print("张量 a 的形状：", a.shape)
print("张量 s 的形状：", s.shape)


In [None]:
# 创建一个形状为 (2,) 的张量 s
s = torch.tensor([1.0, 2.0])

# 使用 torch.unsqueeze() 函数在第0维插入一个长度为1的维度，生成新的张量 d
d = torch.unsqueeze(s, dim=0)

# 打印原始张量 s 和新生成的张量 d
print("原始张量 s：", s)
print("新生成的张量 d：", d)

# 打印张量 s 和 d 的形状
print("张量 s 的形状：", s.shape)
print("张量 d 的形状：", d.shape)


torch.transpose可以交换张量的维度，torch.transpose常用于图片存储格式的变换上。

如果是二维的矩阵，通常会调用矩阵的转置方法 matrix.t()，等价于 torch.transpose(matrix,0,1)。


In [None]:
# 定义最小值和最大值
minval = 0
maxval = 255

# 生成一个形状为 (100, 256, 256, 4) 的随机整数张量 data
data = torch.floor(minval + (maxval - minval) * torch.rand([100, 256, 256, 4])).int()

# 打印 data 的形状
print("原始形状：", data.shape)

# 将 data 转换成 PyTorch 默认的图片格式 (Batch, Channel, Height, Width)
# 需要进行两次维度交换操作
data_t = torch.transpose(torch.transpose(data, 1, 2), 1, 3)

# 打印转换后的 data_t 的形状
print("转换后的形状：", data_t.shape)

# 使用 torch.permute() 对维度的顺序进行重新编排，将 data 转换成 (Batch, Channel, Height, Width) 格式
data_p = torch.permute(data, [0, 3, 1, 2])

# 打印使用 permute() 转换后的 data_p 的形状
print("使用 permute() 转换后的形状：", data_p.shape)


In [None]:
# 创建一个矩阵
matrix = torch.tensor([[1, 2, 3], [4, 5, 6]])

# 打印原始矩阵
print("原始矩阵：")
print(matrix)

# 使用 .t() 方法进行矩阵转置
# 注意：这个方法只适用于2D张量（矩阵）
transposed_matrix_t = matrix.t()

# 打印转置后的矩阵
print("使用 .t() 方法转置后的矩阵：")
print(transposed_matrix_t)

# 使用 torch.transpose() 函数进行矩阵转置
# 这里等价于 torch.transpose(matrix, 0, 1)
transposed_matrix = torch.transpose(matrix, 0, 1)

# 打印使用 torch.transpose() 函数转置后的矩阵
print("使用 torch.transpose() 函数转置后的矩阵：")
print(transposed_matrix)


### 四，合并分割

可以用torch.cat方法和torch.stack方法将多个张量合并，可以用torch.split方法把一个张量分割成多个张量。

torch.cat和torch.stack有略微的区别，torch.cat是连接，不会增加维度，而torch.stack是堆叠，会增加维度。


In [None]:
# 导入PyTorch库
import torch

# 创建三个张量 a、b 和 c
a = torch.tensor([[1.0, 2.0], [3.0, 4.0]])
b = torch.tensor([[5.0, 6.0], [7.0, 8.0]])
c = torch.tensor([[9.0, 10.0], [11.0, 12.0]])

# 使用 torch.cat() 函数将三个张量按行连接（堆叠）
# 这里 dim=0 表示在行的维度上进行连接
abc_cat = torch.cat([a, b, c], dim=0)

# 打印连接后的张量 abc_cat 的形状和内容
print("连接后的形状：", abc_cat.shape)
print("连接后的内容：")
print(abc_cat)


In [None]:
# 使用 torch.stack() 函数将三个张量进行堆叠
# 这里可以使用 axis=0 或 dim=0，效果相同
abc_stack = torch.stack([a, b, c], axis=0)

##
# 使用 torch.stack() 在新的维度上堆叠，形状为 (3, 2, 2)
# 使用 torch.cat() 沿指定维度连接， 形状为 (6, 2)

# 打印堆叠后的张量 abc_stack 的形状和内容
print("堆叠后的形状：", abc_stack.shape)
print("堆叠后的内容：")
print(abc_stack)

In [None]:
torch.cat([a, b, c], axis=1)

In [None]:
torch.stack([a, b, c], axis=1)

torch.split是torch.cat的逆运算，可以指定分割份数平均分割，也可以通过指定每份的记录数量进行分割。

In [None]:
# 打印原始张量 abc_cat
print("原始张量 abc_cat:")
print(abc_cat)

# 使用 torch.split() 函数将张量 abc_cat 沿 dim=0 维度等分割成三份
# 每份包含2个元素
a, b, c = torch.split(abc_cat, split_size_or_sections=2, dim=0)

# 打印分割后的张量 a、b 和 c
print("分割后的张量 a:")
print(a)
print("分割后的张量 b:")
print(b)
print("分割后的张量 c:")
print(c)


In [None]:
# 打印原始张量 abc_cat
print("原始张量 abc_cat:")
print(abc_cat)

# 使用 torch.split() 函数将张量 abc_cat 沿 dim=0 维度不等分割成三份
# 每份分别包含[4, 1, 1]个元素
p, q, r = torch.split(abc_cat, split_size_or_sections=[4, 1, 1], dim=0)

# 打印不等分割后的张量 p、q 和 r
print("不等分割后的张量 p:")
print(p)
print("不等分割后的张量 q:")
print(q)
print("不等分割后的张量 r:")
print(r)
