In [1]:
import torch

# 创建一个张量
x = torch.tensor([1.0, 2.0, 3.0], requires_grad=True)

# 使用 detach 创建一个新张量
y = x.detach()

# 修改 y 的值
y[0] = 10.0

print("x:", x)

# y 是 x 的一个副本，但 y 不参与梯度计算。修改 y 的值不会影响 x。
print("y:", y)

x: tensor([10.,  2.,  3.], requires_grad=True)
y: tensor([10.,  2.,  3.])


### 在梯度计算中使用 detach()

In [2]:
import torch

# 创建一个张量
x = torch.tensor([1.0, 2.0, 3.0], requires_grad=True)

# 使用 detach 创建一个新张量
y = x.detach()

# 计算一个简单的函数
z = y * 2

# 反向传播
z.sum().backward()

print("x.grad:", x.grad)
print("y.grad:", y.grad)

RuntimeError: element 0 of tensors does not require grad and does not have a grad_fn

### 在模型中使用 detach()

In [3]:
import torch
import torch.nn as nn

# 定义一个简单的模型
class SimpleModel(nn.Module):
    def __init__(self):
        super(SimpleModel, self).__init__()
        self.fc1 = nn.Linear(3, 3)
        self.fc2 = nn.Linear(3, 1)

    def forward(self, x):
        x = self.fc1(x)
        x = x.detach()  # 冻结 fc1 的梯度
        
        x = self.fc2(x)
        return x

# 创建模型
model = SimpleModel()

# 创建输入
input = torch.tensor([1.0, 2.0, 3.0], requires_grad=True)

# 前向传播
output = model(input)

# 反向传播
output.backward()

# 检查梯度
print("fc1.weight.grad:", model.fc1.weight.grad)
print("fc2.weight.grad:", model.fc2.weight.grad)

fc1.weight.grad: None
fc2.weight.grad: tensor([[ 0.8019, -2.9424,  1.0930]])
