运行一些操作可能导致为新结果分配内存，例如使用`Y = X + Y`，将取消引用`Y`指向的张量，重新指向新分配内存处的张量。

In [None]:
import torch

X = torch.arange(12,dtype=torch.float32).reshape((3,4))
Y = torch.tensor([[2.0, 1, 4, 3], [1, 2, 3, 4], [4, 3, 2, 1]])

X, Y

Python的`id()`函数可以演示内存重新分配的过程，如下所示：

In [None]:
before = id(Y)
print(before)

Y = X + Y

after = id(Y)
print(after)

before == after

如上所示，运算前后的内存指向不同，说明在运算过程中重新向`Y`分配了内存地址。

大部分时候内存地址的重新分配都是不可接受的：
1. 在机器学习中，可能有数百兆甚至更多的参数，并且在一秒内多次更新所有参数，频繁的内存重新分配会造成极大的性能浪费。
2. 如果不原地更新某些参数，其他引用仍然会指向旧的内存位置，这样某些代码可能会无意中引用旧的参数。

可以通过切片表示法将操作的结果分配给先前分配的变量，例如 `Y[:] = <expression>`：

In [None]:
Z = torch.zeros_like(Y)
print('id(Z) before : ', id(Z))

Z[:] = X + Y
print('id(Z)  after : ', id(Z))

如果在后续的计算中没有重复使用`X`，也可以使用`X[:] = X + Y` 或 `X += Y` 来减少操作的内存开销：

In [None]:
before = id(X)

X += Y

after = id(X)

print(before)
print(after)