# 问题一：使用 𝐓𝐞𝐧𝐬𝐨𝐫 初始化一个 𝟏×𝟑 的矩阵 𝑴 和一个 𝟐×𝟏 的矩阵 𝑵，对两矩阵进行减法操作（要求实现三种不同的形式），给出结果并分析三种方式的不同（如果出现报错，分析报错的原因），同时需要指出在计算过程中发生了什么

In [2]:
import torch

# 初始化矩阵 M 和 N
M = torch.rand(1, 3)
N = torch.rand(2, 1)

# 方式1：直接减法操作（不匹配形状）

In [3]:
# 直接相减
result = M - N
print("M:", M)
print("N:", N)
print("Result:", result)

M: tensor([[0.8885, 0.8797, 0.9991]])
N: tensor([[0.4607],
        [0.8617]])
Result: tensor([[0.4278, 0.4190, 0.5384],
        [0.0268, 0.0180, 0.1374]])


在这种情况下，PyTorch 会尝试自动广播（broadcasting）机制使得两个矩阵的形状匹配。矩阵 M 是 1×3，矩阵 N 是 2×1，根据广播机制，矩阵 N 会沿着列复制，矩阵 M 会沿着行复制，使得它们都变成 2×3的矩阵，然后再进行减法操作。
计算过程中的广播机制：
+ M 从 1×3通过行复制扩展为 2×3。
+ N 从 2×1通过列复制扩展为 2×3。

# 方式2：显式转换矩阵形状

In [4]:
# 将 N 变形为 (2, 3)
N_transformed = N.expand(2, 3)

# 相减
result = M - N_transformed
print("M:", M)
print("N (transformed):", N_transformed)
print("Result:", result)

M: tensor([[0.8885, 0.8797, 0.9991]])
N (transformed): tensor([[0.4607, 0.4607, 0.4607],
        [0.8617, 0.8617, 0.8617]])
Result: tensor([[0.4278, 0.4190, 0.5384],
        [0.0268, 0.0180, 0.1374]])


在这种方法中，使用 `expand()` 显式地将矩阵N 的形状变为2*3。这时矩阵M 和 N 的形状已经匹配，所以可以直接进行减法操作。这种方法避免了隐式的广播机制，明确地控制了矩阵的形状。

# 方式3：手动复制矩阵

In [5]:
# 手动复制矩阵 N 的列
N_repeated = N.repeat(1, 3)

# 相减
result = M - N_repeated
print("M:", M)
print("N (repeated):", N_repeated)
print("Result:", result)

M: tensor([[0.8885, 0.8797, 0.9991]])
N (repeated): tensor([[0.4607, 0.4607, 0.4607],
        [0.8617, 0.8617, 0.8617]])
Result: tensor([[0.4278, 0.4190, 0.5384],
        [0.0268, 0.0180, 0.1374]])


在这个实现中，使用 `repeat()` 方法手动复制矩阵 \(N\)，使其形状与矩阵 \(M\) 匹配。然后再进行减法操作。这种方法可以在不依赖广播机制的情况下，精确控制矩阵的复制。