使用了transformers库中的BertModel模型。

输出结果是一个包含多个字段的BaseModelOutputWithPoolingAndCrossAttentions对象，这些字段代表了模型处理输入后的不同输出。

In [3]:
from transformers import BertModel, BertTokenizer

tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
model = BertModel.from_pretrained('bert-base-uncased')

inputs = tokenizer("Hello, world!", return_tensors="pt")
outputs = model(**inputs)
print(outputs)

BaseModelOutputWithPoolingAndCrossAttentions(last_hidden_state=tensor([[[-0.0781,  0.1587,  0.0400,  ..., -0.2805,  0.0248,  0.4081],
         [-0.2016,  0.1781,  0.4184,  ..., -0.2522,  0.3630, -0.0979],
         [-0.7156,  0.6751,  0.6017,  ..., -1.1032,  0.0797,  0.0567],
         [ 0.0527, -0.1483,  1.3609,  ..., -0.4513,  0.1274,  0.2655],
         [-0.7122, -0.4815, -0.1438,  ...,  0.5602, -0.1062, -0.1301],
         [ 0.9955,  0.1328, -0.0621,  ...,  0.2460, -0.6502, -0.3296]]],
       grad_fn=<NativeLayerNormBackward0>), pooler_output=tensor([[-0.8130, -0.2470, -0.7289,  0.5582,  0.3357, -0.0758,  0.7851,  0.1526,
         -0.5705, -0.9997, -0.3183,  0.7643,  0.9550,  0.5801,  0.9046, -0.6037,
         -0.3113, -0.5445,  0.3740, -0.4197,  0.5471,  0.9996,  0.0560,  0.2710,
          0.3869,  0.9316, -0.7260,  0.8900,  0.9311,  0.5901, -0.5208,  0.0532,
         -0.9711, -0.1791, -0.8414, -0.9663,  0.2318, -0.6239,  0.0885,  0.1203,
         -0.8333,  0.1662,  0.9993,  0.1384,  

# 输出结果中各个字段的解释



**last_hidden_state**： 这是一个张量，代表了模型处理输入后的最后一个隐藏状态。这个隐藏状态通常用于进一步的处理，如分类、序列到序列的任务等。对于BertModel，这个隐藏状态是在模型中最后一个Transformer层之后的输出。




**pooler_output**: 这也是一个张量，代表了模型在最后一个Transformer层之后的输出，经过一个线性层和Tanh激活函数的输出。这个输出通常用于分类任务。


**hidden_states**: 这个字段是一个包含多个隐藏状态的列表，每个隐藏状态对应模型中的一个Transformer层。这些隐藏状态可以用于可视化模型的内部工作方式或进一步分析。


**past_key_values**: 这个字段是模型在序列到序列任务中使用的，用于存储前一个序列的注意力权重和隐藏状态，以便在下一个序列中重用。
    
    
**attentions**: 这个字段是一个包含多个注意力权重张量的列表，每个注意力权重张量对应模型中的一个Transformer层。这些注意力权重可以用于可视化模型如何关注输入序列的不同部分。


**cross_attentions**: 这个字段是模型在序列到序列任务中使用的，用于存储不同序列之间的注意力权重。

### 报错提示
```bash
---------------------------------------------------------------------------
OSError                                   Traceback (most recent call last)
Cell In[1], line 3
      1 from transformers import BertModel, BertTokenizer
----> 3 tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
      4 model = BertModel.from_pretrained('bert-base-uncased')
      6 inputs = tokenizer("Hello, world!", return_tensors="pt")

File d:\Anaconda3\envs\fun_transformer\lib\site-packages\transformers\tokenization_utils_base.py:2192, in PreTrainedTokenizerBase.from_pretrained(cls, pretrained_model_name_or_path, cache_dir, force_download, local_files_only, token, revision, trust_remote_code, *init_inputs, **kwargs)
   2189 # If one passes a GGUF file path to `gguf_file` there is no need for this check as the tokenizer will be
   2190 # loaded directly from the GGUF file.
   2191 if all(full_file_name is None for full_file_name in resolved_vocab_files.values()) and not gguf_file:
-> 2192     raise EnvironmentError(
   2193         f"Can't load tokenizer for '{pretrained_model_name_or_path}'. If you were trying to load it from "
   2194         "'https://huggingface.co/models', make sure you don't have a local directory with the same name. "
   2195         f"Otherwise, make sure '{pretrained_model_name_or_path}' is the correct path to a directory "
   2196         f"containing all relevant files for a {cls.__name__} tokenizer."
   2197     )
   2199 for file_id, file_path in vocab_files.items():
   2200     if file_id not in resolved_vocab_files:

OSError: Can't load tokenizer for 'bert-base-uncased'. If you were trying to load it from 'https://huggingface.co/models', make sure you don't have a local directory with the same name. Otherwise, make sure 'bert-base-uncased' is the correct path to a directory containing all relevant files for a BertTokenizer tokenizer.
```

### 解决方案
检查网络设置，确保你的网络可以访问 Hugging Face 服务器（https://huggingface.co）。如果是国内用户，可能因网络限制无法直接下载模型，需通过以下方法解决：
1. 使用镜像网站 
```python
from transformers import BertModel, BertTokenizer

tokenizer = BertTokenizer.from_pretrained(
    'bert-base-uncased',
    cache_dir='./cache',  # 指定缓存路径
    mirror='https://mirror.sjtu.edu.cn/huggingface'  # 使用上海交大镜像
)
model = BertModel.from_pretrained('bert-base-uncased', cache_dir='./cache')
```

2. 科学上网（全局模式）

3. 如果使用代理（非全局模式），代码层面需要设置端口
```python
import os
os.environ['HTTP_PROXY'] = 'http://你的代理地址:端口'
os.environ['HTTPS_PROXY'] = 'http://你的代理地址:端口'
from transformers import BertModel, BertTokenizer
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
model = BertModel.from_pretrained('bert-base-uncased')
```