In [1]:
from transformers import pipeline

  from .autonotebook import tqdm as notebook_tqdm


In [1]:
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

# 1. 加载预训练模型和Tokenizer（Tokenizer负责文本编码）
model_name = "distilbert-base-uncased-finetuned-sst-2-english"
tokenizer = AutoTokenizer.from_pretrained(model_name)  # 文本编码工具
model = AutoModelForSequenceClassification.from_pretrained(model_name)  # 分类模型

# 2. 输入文本
text = "I love using Transformers! It's so powerful and easy to use."

# 3. 文本编码（转换为模型可接受的张量）
inputs = tokenizer(
    text,
    return_tensors="pt",  # 返回PyTorch张量（"tf"表示TensorFlow张量）
    padding=True,  # 自动填充
    truncation=True,  # 超长截断
    max_length=512  # 最大序列长度
)

# 4. 模型推理（关闭梯度计算，提升速度）
with torch.no_grad():
    outputs = model(**inputs)  # 解包inputs（包含input_ids、attention_mask等）

# 5. 解析结果（分类任务输出logits，需转成概率）
logits = outputs.logits
probabilities = torch.softmax(logits, dim=1)  # 归一化为概率
predicted_class_id = torch.argmax(probabilities, dim=1).item()  # 预测类别ID

# 6. 映射类别ID到标签
labels = model.config.id2label  # 模型配置中存储的标签映射
print(f"输入文本：{text}")
print(f"预测结果：{labels[predicted_class_id]}（概率：{probabilities[0][predicted_class_id]:.4f}）")

  from .autonotebook import tqdm as notebook_tqdm


输入文本：I love using Transformers! It's so powerful and easy to use.
预测结果：POSITIVE（概率：0.9998）
