## 创建transformer
### 初始化BERT模型需要做的第一件事是加载配置对象：

In [1]:
from transformers import BertConfig, BertModel

# Building the config
config = BertConfig()

# Building the model from the config
model = BertModel(config)

In [2]:
print(config)

BertConfig {
  "attention_probs_dropout_prob": 0.1,
  "classifier_dropout": null,
  "hidden_act": "gelu",
  "hidden_dropout_prob": 0.1,
  "hidden_size": 768,
  "initializer_range": 0.02,
  "intermediate_size": 3072,
  "layer_norm_eps": 1e-12,
  "max_position_embeddings": 512,
  "model_type": "bert",
  "num_attention_heads": 12,
  "num_hidden_layers": 12,
  "pad_token_id": 0,
  "position_embedding_type": "absolute",
  "transformers_version": "4.37.1",
  "type_vocab_size": 2,
  "use_cache": true,
  "vocab_size": 30522
}



### 不同的模型加载方式

1. 使用随机值对其进行初始化

In [None]:
from transformers import BertConfig, BertModel

config = BertConfig()
model = BertModel(config)

# Model is randomly initialized!

2. 加载已经训练过的Transformers模型

In [None]:
from transformers import BertModel

model = BertModel.from_pretrained("bert-base-cased")

模型默认会被缓存到~/.cache/huggingface/transformers中，可以通过设置HF_HOME环境变量来修改缓存路径。

### 保存模型
其中包含两个文件
- config.json 
    - 构建模型体系结构所需的属性。
    - 该文件还包含一些元数据，例如检查点的来源以及上次保存检查点时使用的Transformers版本。
- pytorch_model.bin
    - 包含模型的权重。


In [None]:
model.save_pretrained("directory_on_my_computer")

### 使用Transformers模型进行推理

In [None]:
sequences = ["Hello!", "Cool.", "Nice!"]
# 这些序列转换为ID
encoded_sequences = [
    [101, 7592, 999, 102],
    [101, 4658, 1012, 102],
    [101, 3835, 999, 102],
]

In [None]:
# 将ID的列表转换为张量
import torch

model_inputs = torch.tensor(encoded_sequences)

In [None]:
# 将张量作为模型的输入
output = model(model_inputs)