# 大语言模型Transformer库-Model组件实践

## 模型的加载

In [None]:
from transformers import AutoConfig, AutoModel, AutoTokenizer

# 在线加载
# model = AutoModel.from_pretrained("hfl/rbt3", force_download=True)
# 离线加载
model = AutoModel.from_pretrained("hfl/rbt3")
tokenizer= AutoTokenizer.from_pretrained("hfl/rbt3")

## 模型的保存

In [None]:
# 指定保存模型和分词器的目录路径
model_save_path = "path_to_save_model"
tokenizer_save_path = "path_to_save_tokenizer"

# 保存模型
model.save_pretrained(model_save_path)

# 保存分词器
tokenizer.save_pretrained(tokenizer_save_path)

## 模型加载参数
```bash
BertConfig {
  "_name_or_path": "/root/代码/Model组件/rbt3",
  "architectures": [
    "BertForMaskedLM"
  ],
  "attention_probs_dropout_prob": 0.1,
  "classifier_dropout": null,
  "directionality": "bidi",
  "hidden_act": "gelu",
  "hidden_dropout_prob": 0.1,
  "hidden_size": 768,
  "initializer_range": 0.02,
  "intermediate_size": 3072,
  "layer_norm_eps": 1e-12,
  "max_position_embeddings": 512,
  "model_type": "bert",
  "num_attention_heads": 12,
  "num_hidden_layers": 3,
  "output_past": true,
  "pad_token_id": 0,
  "pooler_fc_size": 768,
  "pooler_num_attention_heads": 12,
  "pooler_num_fc_layers": 3,
  "pooler_size_per_head": 128,
  "pooler_type": "first_token_transform",
  "position_embedding_type": "absolute",
  "transformers_version": "4.35.2",
  "type_vocab_size": 2,
  "use_cache": true,
  "vocab_size": 21128
}
```

In [None]:
model = AutoModel.from_pretrained("hfl/rbt3")
model.config

In [None]:
config = AutoConfig.from_pretrained("hfl/rbt3")
config

## 模型调用

In [None]:
sen = "今天天气不错，我的心情也不错！"
tokenizer = AutoTokenizer.from_pretrained("/root/代码/Model组件/rbt3")
inputs = tokenizer(sen, return_tensors="pt")
inputs

### 不带Model Head的模型调用

In [None]:
# 加载时设置了output_attentions=True。
# 这意味着模型在推理时不仅会输出最终的logits或预测结果，还会输出每个层的注意力权重。
# 这通常用于调试或分析模型的内部工作机制
model = AutoModel.from_pretrained("/root/代码/Model组件/rbt3", output_attentions=True)
output = model(**inputs)
output

### 带Model Head的模型调用

In [None]:
from transformers import AutoModelForSequenceClassification, BertForSequenceClassification
# 使用AutoModelForSequenceClassification类加载一个用于序列分类任务的预训练模型。
# 这个类是专门用于文本分类任务的，如情感分析或主题分类，它期望输出是整个输入序列的分类结果。
# 它从指定路径加载模型，并使用inputs进行推理。
clz_model = AutoModelForSequenceClassification.from_pretrained("/root/代码/Model组件/rbt3")

clz_model(**inputs)

In [None]:
# 这段代码与上面代码类似，但它在加载模型时额外指定了num_labels=2参数。
# 这个参数对于序列分类模型是重要的，因为它告诉模型输出层期望的输出尺寸，即分类标签的数量。
# 如果模型被微调用于一个具有两个标签的分类任务（如正面情感和负面情感），这个参数是必须的。
# 如果没有正确设置num_labels，模型的输出可能无法正确映射到标签空间。
clz_model = AutoModelForSequenceClassification.from_pretrained("/root/代码/Model组件/rbt3", num_labels=2)