# torch.bmm() 与 torch.matmul()

- torch.bmm()强制规定维度和大小相同
- torch.matmul()没有强制规定维度和大小，可以用利用广播机制进行不同维度的相乘操作
- 当进行操作的两个tensor都是3D时，两者等同。

## torch.bmm()

torch.bmm(input, mat2, *, deterministic=False, out=None)

Performs a batch matrix-matrix product of matrices stored in input and mat2.
input and mat2 must be 3-D tensors each containing the same number of matrices.

This function does not broadcast. For broadcasting matrix products, see torch.matmul().

In [1]:
import torch

input = torch.randn(10, 3, 4)
mat2 = torch.randn(10, 4, 5)
res = torch.bmm(input, mat2)
print(res.size())


torch.Size([10, 3, 5])


当tensor维度为2时会报错！

In [2]:
c=torch.randn((2,5))
print(c)

d=torch.reshape(c,(5,2))
print(d)
e=torch.bmm(c,d)



tensor([[-0.9198,  1.3520, -2.0606, -0.0802,  0.4940],
        [ 0.0940,  0.2723,  1.1729,  1.0038, -0.0404]])
tensor([[-0.9198,  1.3520],
        [-2.0606, -0.0802],
        [ 0.4940,  0.0940],
        [ 0.2723,  1.1729],
        [ 1.0038, -0.0404]])


RuntimeError: Expected 3-dimensional tensor, but got 2-dimensional tensor for argument #1 'batch1' (while checking arguments for bmm)

In [None]:
维度为4时也会报错！

In [3]:
ccc=torch.randn((1,2,2,5))
ddd=torch.randn((1,2,5,2))
e=torch.bmm(ccc,ddd)



RuntimeError: Expected 3-dimensional tensor, but got 4-dimensional tensor for argument #1 'batch1' (while checking arguments for bmm)

## torch.matmul()

 torch.matmul()也是一种类似于矩阵相乘操作的tensor联乘操作。但是它可以利用python 中的广播机制，处理一些维度不同的tensor结构进行相乘操作。这也是该函数与torch.bmm()区别所在。

参数：

input,other：两个要进行操作的tensor结构

output:结果

一些规则约定：

（1）若两个都是1D（向量）的，则返回两个向量的点积
————————————————
版权声明：本文为CSDN博主「Foneone」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/foneone/article/details/103876519

In [None]:
import torch
x = torch.rand(2)
y = torch.rand(2)
print(torch.matmul(x,y),torch.matmul(x,y).size())


2）若两个都是2D（矩阵）的，则按照（矩阵相乘）规则返回2D

In [None]:
x = torch.rand(2,4)
y = torch.rand(4,3) ###维度也要对应才可以乘
print(torch.matmul(x,y),'\n',torch.matmul(x,y).size())


若input维度1D，other维度2D，则先将1D的维度扩充到2D（1D的维数前面+1），然后得到结果后再将此维度去掉，得到的与input的维度相同。即使作扩充（广播）处理，input的维度也要和other维度做对应关系。

In [None]:
import torch
x = torch.rand(4) #1D
y = torch.rand(4,3) #2D
print(x.size())
print(y.size())
print(torch.matmul(x,y),'\n',torch.matmul(x,y).size())
 
### 扩充x =>(,4) 
### 相乘x(,4) * y(4,3) =>(,3) 
### 去掉1D =>(3)


（4）若input是2D，other是1D，则返回两者的点积结果。（个人觉得这块也可以理解成给other添加了维度，然后再去掉此维度，只不过维度是(3, )而不是规则(3)中的( ,4)了，但是可能就是因为内部机制不同，所以官方说的是点积而不是维度的升高和下降）

In [None]:
import torch
x = torch.rand(3) #1D
y = torch.rand(4,3) #2D
print(torch.matmul(y,x),'\n',torch.matmul(y,x).size()) #2D*1D
