# 使用阿里云百炼通义千问模型

结论：

- LLM 可以使用 `openai_like`
- Embedding 需要使用单独的实现 `embeddings-dashscope`


## 设置和使用 LLM

In [5]:
%%time
%%capture

!pip install python-dotenv

CPU times: user 14.1 ms, sys: 12.3 ms, total: 26.4 ms
Wall time: 3.78 s


In [3]:
%%time

from dotenv import load_dotenv
import os

load_dotenv()
api_key = os.getenv("ALIYUN_API_KEY")

CPU times: user 3.83 ms, sys: 903 µs, total: 4.73 ms
Wall time: 5.91 ms


In [14]:
%%time

from llama_index.llms.openai_like import OpenAILike
from llama_index.core import Settings

model="qwen-turbo"
llm = OpenAILike(
    model=model, 
    api_base="https://dashscope.aliyuncs.com/compatible-mode/v1", 
    api_key=api_key,
    is_chat_model=True,
    temperature=0.1,
    request_timeout=60.0
)

CPU times: user 100 µs, sys: 16 µs, total: 116 µs
Wall time: 119 µs


In [15]:
%%time

resp = llm.stream_complete("介绍下什么叫置信区间")

for r in resp:
    print(r.delta, end="")

置信区间（Confidence Interval，CI）是统计学中用来估计未知参数值的一个重要概念。它提供了一个范围，表示在这个范围内我们有某种确定的置信水平（例如95%或99%）认为真实参数值可能存在的位置。

置信区间通常基于样本数据计算得出，它包含了样本统计量（如样本均值、比例等）和一个估计误差。这个误差通常是根据样本标准差、样本大小以及所使用的分布（如正态分布）来计算的。置信区间的宽度反映了估计的精确度：区间越窄，估计越精确；区间越宽，估计的不确定性越大。

置信区间的计算方法取决于所使用的统计方法和数据的分布情况。常见的计算方法包括：

1. **正态分布假设下的置信区间**：如果样本来自正态分布且方差已知，可以使用Z分数来计算置信区间。
2. **大样本情况下**：即使总体不是正态分布，只要样本足够大（通常大于30），可以使用中心极限定理，假设样本均值的分布接近正态分布，从而使用Z分数或t分数来计算置信区间。
3. **小样本或非正态分布**：在这种情况下，通常使用t分布来计算置信区间，尤其是当样本标准差未知时。

置信区间在科学研究、市场调研、医学研究等领域有着广泛的应用，帮助决策者理解结果的不确定性，并做出更合理的判断。CPU times: user 93.4 ms, sys: 0 ns, total: 93.4 ms
Wall time: 7.13 s


## 设置和使用 Embedding

In [19]:
%%time
%%capture

!pip install llama-index-embeddings-dashscope

CPU times: user 9.27 ms, sys: 7.64 ms, total: 16.9 ms
Wall time: 2.28 s


In [20]:
os.environ["DASHSCOPE_API_KEY"] = api_key

In [21]:
%%time

from llama_index.embeddings.dashscope import (
    DashScopeEmbedding,
    DashScopeTextEmbeddingModels,
    DashScopeTextEmbeddingType,
)

embedder = DashScopeEmbedding(
    model_name=DashScopeTextEmbeddingModels.TEXT_EMBEDDING_V1,
    text_type=DashScopeTextEmbeddingType.TEXT_TYPE_DOCUMENT,
)

text_to_embedding = ["风急天高猿啸哀", "渚清沙白鸟飞回", "无边落木萧萧下", "不尽长江滚滚来"]

result_embeddings = embedder.get_text_embedding_batch(text_to_embedding)

CPU times: user 78.9 ms, sys: 14.5 ms, total: 93.5 ms
Wall time: 270 ms


In [23]:
result_embeddings[0][:5]

[1.5536729097366333,
 -2.237586736679077,
 1.5397623777389526,
 -2.3466579914093018,
 3.8610622882843018]