## 我的版本

### (0) 封装定义

In [None]:
from transformers import AutoModelForCausalLM, AutoTokenizer

def load_model(model_name_or_path):
    '''
    加载模型
    '''
    model = AutoModelForCausalLM.from_pretrained(
        model_name_or_path,
        torch_dtype="auto",
        device_map="auto"
    )
    tokenizer = AutoTokenizer.from_pretrained(model_name_or_path)

    return model, tokenizer

def chat_qwen(model, tokenizer, prompt):
    '''
    与模型进行交互
    '''
    messages = [
        {"role": "system", "content": "You are Qwen, created by Alibaba Cloud. You are a helpful assistant."},
        {"role": "user", "content": prompt}
    ]
    # 使用分词器的 apply_chat_template 方法将消息格式化为模型可理解的输入格式
    text = tokenizer.apply_chat_template(
        messages,
        tokenize=False,  # 别写错了，是tokenize不是tokenizer
        add_generation_prompt=True
    )
    model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
    #生成模型输出
    generated_ids = model.generate(
        **model_inputs,
        max_new_tokens=512
    )
    # 由于模型输出包括输入模型，这里切去输入部分
    generated_ids = [
        output_ids[len(input_ids):] 
        for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
    ]
    # 将模型输出解码为文本
    response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
    return response



  from .autonotebook import tqdm as notebook_tqdm


### (1) 加载模型

In [2]:

model_name_or_path = "../HF/Qwen2.5-7B-Instruct"
model, tokenizer = load_model(model_name_or_path)


Loading checkpoint shards: 100%|██████████| 4/4 [00:05<00:00,  1.27s/it]


### (2) 模型运算

In [3]:

prompt = "你好，请你介绍一下自己。"
response = chat_qwen(model, tokenizer, prompt)
print(response)

你好！我叫Qwen，是由阿里云开发的超大规模语言模型。我的主要功能是生成与给定词语相关的高质量文本，能够回答问题、创作文字，比如写故事、写公文、写邮件、写剧本等等，还能表达观点，撰写代码。我会根据聊天的内容不断调整自己的回答，努力提供准确、有用的信息。如果你有任何问题或需要帮助，都可以随时告诉我哦！


In [None]:

prompt = ""
response = chat_qwen(model, tokenizer, prompt)
print(response)

Hugging Face 是一个致力于自然语言处理（NLP）的社区和平台。它主要提供了一个模型库，其中包含了许多预训练的深度学习模型，特别是用于文本数据的模型。这个库不仅包括了来自学术界和工业界的广泛模型，还提供了丰富的工具和资源，帮助研究人员和开发者更轻松地使用这些模型进行实验和开发。

Hugging Face 还推出了几个重要的项目，比如 Transformers 库，这是一个非常流行的 Python 库，用于构建和使用基于 transformer 架构的机器学习模型。此外，Hugging Face 还创建了一个名为 Datasets 的库，该库提供了一套工具来加载、管理和预处理各种数据集，这对于训练机器学习模型至关重要。

Hugging Face 社区也非常活跃，经常举办相关的研讨会、工作坊和技术分享活动，促进了 NLP 领域的知识交流和发展。
