# 使用智谱ai模型

结论：

- LLM 可以使用 `openai_like`
- Embedding 在 LlamaIndex 中没有相应的实现，LangChain 有，LlamaIndex 有包装 LangChain Embedding 的实现

In [1]:
%%time
%%capture

!pip install python-dotenv

CPU times: user 8.75 ms, sys: 7.44 ms, total: 16.2 ms
Wall time: 1.79 s


In [2]:
%%time

from dotenv import load_dotenv
import os

load_dotenv()
api_key = os.getenv("ZHIPU_API_KEY")

CPU times: user 5.3 ms, sys: 215 µs, total: 5.52 ms
Wall time: 4.94 ms


In [3]:
%%time

from llama_index.llms.openai_like import OpenAILike
from llama_index.core import Settings

model="GLM-4-Flash"
llm = OpenAILike(
    model=model, 
    api_base="https://open.bigmodel.cn/api/paas/v4/", 
    api_key=api_key,
    is_chat_model=True,
    temperature=0.1,
    request_timeout=60.0
)

CPU times: user 2.85 s, sys: 343 ms, total: 3.19 s
Wall time: 2.81 s


In [4]:
%%time

resp = llm.stream_complete("介绍下什么叫置信区间")

for r in resp:
    print(r.delta, end="")

置信区间（Confidence Interval，简称CI）是统计学中用来估计总体参数范围的一种方法。它是一个区间估计，用于表示对总体参数的一个估计值，并给出该估计值的不确定性程度。

具体来说，置信区间是指在一定的置信水平（通常用百分比表示，如95%）下，对总体参数（如总体均值、总体比例等）的一个估计范围。在这个范围内，我们可以认为总体参数的真实值有很高的概率（即置信水平）落在该区间内。

例如，如果我们想估计一个班级学生的平均身高，我们可以随机抽取一部分学生进行测量，然后根据这些样本数据计算出平均身高。这个平均身高就是一个点估计值。但是，由于样本的随机性，我们无法确定这个点估计值是否准确。因此，我们可以构造一个置信区间，比如95%的置信区间，来表示我们估计的平均身高有95%的概率落在某个范围内。

置信区间的计算通常需要以下步骤：

1. 确定置信水平：通常选择95%或99%作为置信水平。
2. 计算标准误差：标准误差是样本统计量（如样本均值）的标准差，它反映了样本统计量与总体参数之间的差异。
3. 确定置信区间宽度：根据标准误差和置信水平，可以计算出置信区间的宽度。
4. 计算置信区间：将点估计值（如样本均值）加上或减去置信区间宽度的一半，得到置信区间的上下限。

总之，置信区间是一种对总体参数进行估计的方法，它能够给出估计值的不确定性程度，并在一定程度上反映了估计结果的可靠性。CPU times: user 186 ms, sys: 12.3 ms, total: 198 ms
Wall time: 6.32 s


## 设置和使用 Embedding

In [5]:
%%time
%%capture

!pip install langchain-community
!pip install zhipuai

CPU times: user 13.5 ms, sys: 13.3 ms, total: 26.8 ms
Wall time: 3.66 s


In [6]:
%%time

os.environ["ZHIPUAI_API_KEY"]=api_key

CPU times: user 19 µs, sys: 2 µs, total: 21 µs
Wall time: 22.6 µs


In [7]:
%%time

from langchain_community.embeddings import ZhipuAIEmbeddings

embeddings = ZhipuAIEmbeddings(
    model="embedding-3",
    # With the `embedding-3` class
    # of models, you can specify the size
    # of the embeddings you want returned.
    # dimensions=1024
)

embeddings.embed_query("风急天高猿啸哀")[:5]

CPU times: user 239 ms, sys: 11.3 ms, total: 250 ms
Wall time: 412 ms


[0.015960693, 2.503395e-05, -0.00014424324, -0.003540039, -0.02571106]

In [8]:
%%time
%%capture

!pip install llama-index-embeddings-langchain

CPU times: user 7.08 ms, sys: 8.22 ms, total: 15.3 ms
Wall time: 1.86 s


In [9]:
%%time

from llama_index.embeddings.langchain import LangchainEmbedding

embed_model = LangchainEmbedding(embeddings)

embeddings = embed_model.get_text_embedding(
    "风急天高猿啸哀"
)
print(len(embeddings), embeddings[:5])

2048 [0.015960693, 2.503395e-05, -0.00014424324, -0.003540039, -0.02571106]
CPU times: user 17.2 ms, sys: 3.32 ms, total: 20.5 ms
Wall time: 184 ms
