## Tensor的自动广播机制

PyTorch在0.2版本以后，推出了自动广播语义，即不同形状的Tensor进行计算时，可自动扩展到较大的相同形状，再进行计算。**广播机制的前提是任一个Tensor至少有一个维度，且从尾部遍历Tensor维度时，两者维度必须相等，其中一个要么是1要么不存在。**

In [1]:
import torch

In [2]:
a = torch.Tensor([[[1, 2]], [[3, 4]], [[5, 6]]])
print(a)
print(a.size())

tensor([[[1., 2.]],

        [[3., 4.]],

        [[5., 6.]]])
torch.Size([3, 1, 2])


In [3]:
b = torch.Tensor([[7, 8]])
print(b)
print(b.size())

tensor([[7., 8.]])
torch.Size([1, 2])


In [4]:
#对于a和b，从尾部遍历维度，2对应2，1对应1，3对应不存在，满足广播机制，计算后的维度为3×1×2
print(a+b)
print((a+b).size())

tensor([[[ 8., 10.]],

        [[10., 12.]],

        [[12., 14.]]])
torch.Size([3, 1, 2])


In [5]:
c = torch.Tensor([[9], [10]])
print(c)
print(c.size())

tensor([[ 9.],
        [10.]])
torch.Size([2, 1])


In [6]:
#对于a和c，从尾部遍历维度，2对应1，1对应2，3对应不存在，满足广播机制，计算后的维度为3×2×2
print(a+c)
print((a+c).size())

tensor([[[10., 11.],
         [11., 12.]],

        [[12., 13.],
         [13., 14.]],

        [[14., 15.],
         [15., 16.]]])
torch.Size([3, 2, 2])


In [7]:
d = torch.Tensor([[11, 12, 13], [14, 15, 16]])
print(d)
print(d.size())

tensor([[11., 12., 13.],
        [14., 15., 16.]])
torch.Size([2, 3])


In [8]:
#对于a和d，从尾部遍历维度，2对应3，不满足广播机制，因此报错
print(a+d)
print((a+d).size())

RuntimeError: The size of tensor a (2) must match the size of tensor b (3) at non-singleton dimension 2

## Tensor向量化

向量化操作是指可以在同一时间进行批量地并行计算，例如矩阵运算，以达到更好的计算效率的一种方式。在实际使用时，**应尽量使用向量化直接对Tensor操作，避免低效率的for循环对元素逐个操作**，尤其是在训练网络模型时，如果有大量的for循环，会极大地影响训练的速度。