In [1]:
import torch

# 固定 torch 的随机数种子，以便重现结果
torch.manual_seed(0)

# 打印信息
def print_info(A, B):
    print(f"A: {A}\nB: {B}")
    print(f"A 的维度: {A.dim()},\t B 的维度: {B.dim()}")
    print(f"A 的元素总数: {A.numel()},\t B 的元素总数: {B.numel()}")
    print(f"torch.matmul(A, B) = {torch.matmul(A, B)}")
    print(f"torch.matmul(A, B).size() = {torch.matmul(A, B).size()}")
    

In [2]:
# input_d = other_d = 1（两个 tensor 皆为 1 维）
A = torch.randint(0, 5, size=(2,))
B = torch.randint(0, 5, size=(2,))

print_info(A, B)

A: tensor([4, 4])
B: tensor([3, 0])
A 的维度: 1,	 B 的维度: 1
A 的元素总数: 2,	 B 的元素总数: 2
torch.matmul(A, B) = 12
torch.matmul(A, B).size() = torch.Size([])


In [3]:
# input_d = other_d = 2 （两个 tensor 皆为 2 维）
A = torch.randint(0, 5, size=(2, 1))
B = torch.randint(0, 5, size=(1, 2))

print_info(A, B)

A: tensor([[3],
        [4]])
B: tensor([[2, 3]])
A 的维度: 2,	 B 的维度: 2
A 的元素总数: 2,	 B 的元素总数: 2
torch.matmul(A, B) = tensor([[ 6,  9],
        [ 8, 12]])
torch.matmul(A, B).size() = torch.Size([2, 2])


In [4]:
# input_d = 1, other_d = 2
A = torch.randint(0, 5, size=(2, ))
B = torch.randint(0, 5, size=(2, 2))

print_info(A, B)


A: tensor([2, 3])
B: tensor([[1, 1],
        [1, 4]])
A 的维度: 1,	 B 的维度: 2
A 的元素总数: 2,	 B 的元素总数: 4
torch.matmul(A, B) = tensor([ 5, 14])
torch.matmul(A, B).size() = torch.Size([2])


In [5]:
# input_d = 2, other_d = 1
# 这里使用上一次的矩阵和向量，方便对照
print_info(B, A)

A: tensor([[1, 1],
        [1, 4]])
B: tensor([2, 3])
A 的维度: 2,	 B 的维度: 1
A 的元素总数: 4,	 B 的元素总数: 2
torch.matmul(A, B) = tensor([ 5, 14])
torch.matmul(A, B).size() = torch.Size([2])


In [6]:
# input_d > 2, other_d = 2
A = torch.randint(0, 5, size=(2, 1, 2))
B = torch.randint(0, 5, size=(2, 1))

print_info(A, B)

A: tensor([[[3, 1]],

        [[1, 3]]])
B: tensor([[4],
        [3]])
A 的维度: 3,	 B 的维度: 2
A 的元素总数: 4,	 B 的元素总数: 2
torch.matmul(A, B) = tensor([[[15]],

        [[13]]])
torch.matmul(A, B).size() = torch.Size([2, 1, 1])


In [7]:
# input_d > 2, other_d = 1
A = torch.randint(0, 5, size=(2, 1, 2))
B = torch.randint(0, 5, size=(2, ))

print_info(A, B)

A: tensor([[[1, 4]],

        [[1, 4]]])
B: tensor([4, 1])
A 的维度: 3,	 B 的维度: 1
A 的元素总数: 4,	 B 的元素总数: 2
torch.matmul(A, B) = tensor([[8],
        [8]])
torch.matmul(A, B).size() = torch.Size([2, 1])


In [8]:
# input_d > 2, other_d > 2
A = torch.randint(0, 5, size=(2, 1, 2, 1))
B = torch.randint(0, 5, size=(2, 1, 2))

print_info(A, B)

A: tensor([[[[4],
          [4]]],


        [[[4],
          [0]]]])
B: tensor([[[1, 2]],

        [[3, 0]]])
A 的维度: 4,	 B 的维度: 3
A 的元素总数: 4,	 B 的元素总数: 4
torch.matmul(A, B) = tensor([[[[ 4,  8],
          [ 4,  8]],

         [[12,  0],
          [12,  0]]],


        [[[ 4,  8],
          [ 0,  0]],

         [[12,  0],
          [ 0,  0]]]])
torch.matmul(A, B).size() = torch.Size([2, 2, 2, 2])


In [9]:
print_info(B, A)

A: tensor([[[1, 2]],

        [[3, 0]]])
B: tensor([[[[4],
          [4]]],


        [[[4],
          [0]]]])
A 的维度: 3,	 B 的维度: 4
A 的元素总数: 4,	 B 的元素总数: 4
torch.matmul(A, B) = tensor([[[[12]],

         [[12]]],


        [[[ 4]],

         [[12]]]])
torch.matmul(A, B).size() = torch.Size([2, 2, 1, 1])
