In [3]:
# 导入所需的库和模块
import numpy as np  # 导入NumPy库，用于处理数组和矩阵
import torch  # 导入PyTorch库，用于深度学习
from transformers import AutoModelForCausalLM, AutoTokenizer, AutoConfig  # 从transformers库中导入所需的类

# 设置运行设备为CPU
device = "cpu"

# 指定预训练模型的名称
model_name = "Qwen/Qwen2-0.5B-Instruct"

# 加载指定的预训练模型，并将其移动到指定的设备
model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype="auto", device_map=device)
model.eval()  # 设置模型为推理模式，不启用梯度计算

# 打印模型结构（已注释掉）
# print(model)

# 加载与模型对应的分词器
tokenizer = AutoTokenizer.from_pretrained(model_name)

# 加载模型的配置信息
config = AutoConfig.from_pretrained(model_name)

# 定义用户输入的提示
prompt = "一周有几天?"

# 定义消息列表，其中包括系统的角色设定和用户的输入内容
messages = [
    {"role": "system", "content": "You are a helpful assistant."},  # 系统角色设定为"你是一个有帮助的助手"
    {"role": "user", "content": prompt},  # 用户输入的内容
]

# 使用分词器将消息列表转换为模型输入格式，并生成文本
text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)

# 将文本转换为模型输入的张量，并加载到指定的设备上，准备运行
model_inputs = tokenizer([text], return_tensors="pt").to(device)

# 模型的输出，这里指的是模型输出的文本的 ID
# max_new_tokens 用来控制回答的字数
generated_ids = model.generate(model_inputs.input_ids, max_new_tokens=10)

# 对生成的ID进行切片，以去除输入ID部分，保留生成的新内容
generated_ids = [output_ids[len(input_ids) :] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)]

# 使用分词器将生成的ID解码为文本，并跳过特殊标记
response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

# 打印生成的文本
print(response)


Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.


一个星期有7天。
