In [2]:
import torch
import torch.nn.functional as F

def temperature_sampling(logits, temperature=1.0):
    """
    温度采样 - 通过温度参数调整概率分布
    
    Args:
        logits: 模型输出的logits，形状为 [batch_size, vocab_size]
        temperature: 温度参数，值越大分布越平坦，值越小分布越尖锐
    
    Returns:
        next_token: 采样得到的下一个token id
    """
    assert temperature > 0, "Temperature must be greater than 0"
    
    # 应用温度
    logits = logits / temperature
    
    # 计算概率分布
    probs = F.softmax(logits, dim=-1)
    
    # 从分布中采样
    next_token = torch.multinomial(probs, num_samples=1).squeeze(-1)
    
    return next_token

In [3]:

# 使用示例
logits = torch.tensor([[1.0, 2.0, 3.0, 4.0, 5.0]])
print("原始logits:", logits)

# 使用不同的温度参数
temp_1_0 = temperature_sampling(logits, temperature=1.0)
temp_0_5 = temperature_sampling(logits, temperature=0.5) 
temp_2_0 = temperature_sampling(logits, temperature=2.0)

print(f"温度=1.0时采样结果: {temp_1_0}")
print(f"温度=0.5时采样结果: {temp_0_5}")
print(f"温度=2.0时采样结果: {temp_2_0}")

# 展示不同温度对概率分布的影响
print("\n不同温度下的概率分布:")
print("温度=1.0:", F.softmax(logits / 1.0, dim=-1))
print("温度=0.5:", F.softmax(logits / 0.5, dim=-1))
print("温度=2.0:", F.softmax(logits / 2.0, dim=-1))

原始logits: tensor([[1., 2., 3., 4., 5.]])
温度=1.0时采样结果: tensor([3])
温度=0.5时采样结果: tensor([4])
温度=2.0时采样结果: tensor([4])

不同温度下的概率分布:
温度=1.0: tensor([[0.0117, 0.0317, 0.0861, 0.2341, 0.6364]])
温度=0.5: tensor([[2.9008e-04, 2.1434e-03, 1.5838e-02, 1.1702e-01, 8.6470e-01]])
温度=2.0: tensor([[0.0580, 0.0956, 0.1577, 0.2600, 0.4287]])
