# Text Embeddings Inference

>[Hugging Face Text Embeddings Inference (TEI)](https://huggingface.co/docs/text-embeddings-inference/index) 是一个用于部署和服务开源文本嵌入和序列分类模型的工具包。`TEI` 为包括 `FlagEmbedding`、`Ember`、`GTE` 和 `E5` 在内的最受欢迎的模型实现了高性能推理。

要在 langchain 中使用它，请首先安装 `huggingface-hub`。

In [1]:
%pip install --upgrade huggingface-hub

然后使用 TEI 暴露一个嵌入模型。例如，使用 Docker，您可以按以下方式部署 `BAAI/bge-large-en-v1.5` 模型：

```bash
model=BAAI/bge-large-en-v1.5
revision=refs/pr/5
volume=$PWD/data # 与 Docker 容器共享一个卷，以避免每次运行时都下载权重

docker run --gpus all -p 8080:80 -v $volume:/data --pull always ghcr.io/huggingface/text-embeddings-inference:0.6 --model-id $model --revision $revision
```

Docker 的具体使用方式可能会因底层硬件而异。例如，要在 Intel Gaudi/Gaudi2 硬件上部署模型，请参阅 [tei-gaudi 仓库](https://github.com/huggingface/tei-gaudi) 以获取相关的 docker run 命令。

最后，实例化客户端并嵌入您的文本。

In [2]:
from langchain_huggingface.embeddings import HuggingFaceEndpointEmbeddings

In [3]:
embeddings = HuggingFaceEndpointEmbeddings(model="http://localhost:8080")

In [4]:
text = "What is deep learning?"

In [5]:
query_result = embeddings.embed_query(text)
query_result[:3]

[0.018113142, 0.00302585, -0.049911194]

In [6]:
doc_result = embeddings.embed_documents([text])

In [7]:
doc_result[0][:3]

[0.018113142, 0.00302585, -0.049911194]