# 测试 byzerllm.emb 功能

在这个notebook中，我们将测试byzerllm的emb（嵌入）功能。我们将展示如何使用byzerllm来生成文本的嵌入向量。

In [None]:
# 导入所需的库
import byzerllm
import numpy as np

In [None]:
# 初始化ByzerLLM
llm = byzerllm.ByzerLLM()

# 设置默认的嵌入模型
# 注意：请确保您已经部署了相应的嵌入模型，例如 "emb"
llm.setup_default_emb_model_name("emb")

In [None]:
# 测试单个文本的嵌入
text = "Hello, world!"
embedding = llm.emb_query(text)

print(f"Text: {text}")
print(f"Embedding shape: {np.array(embedding).shape}")
print(f"First few values of embedding: {embedding[:5]}")

In [None]:
# 测试多个文本的嵌入
texts = ["Hello, world!", "ByzerLLM is awesome", "Embedding models are useful"]
embeddings = llm.emb_query_batch(texts)

for i, (text, embedding) in enumerate(zip(texts, embeddings)):
    print(f"Text {i+1}: {text}")
    print(f"Embedding shape: {np.array(embedding).shape}")
    print(f"First few values of embedding: {embedding[:5]}")
    print()

In [None]:
# 计算两个嵌入之间的余弦相似度
def cosine_similarity(a, b):
    return np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))

similarity = cosine_similarity(embeddings[0], embeddings[1])
print(f"Cosine similarity between '{texts[0]}' and '{texts[1]}': {similarity}")

这个notebook展示了如何使用byzerllm的emb功能来生成文本的嵌入向量。我们测试了单个文本和多个文本的嵌入，并展示了如何计算嵌入之间的相似度。

请注意，在运行这个notebook之前，确保您已经正确设置和部署了嵌入模型。如果遇到任何问题，请检查您的byzerllm配置和模型部署状态。