# Model 的最基本使用

## 设置 LLM

In [1]:
%%time

# 加载llm和embeddings
%run ../utils2.py

from llama_index.core import Settings

# Settings.llm=get_llm("gpt-3.5-turbo")
Settings.llm=get_llm()

CPU times: user 2.94 s, sys: 580 ms, total: 3.52 s
Wall time: 4.63 s


## 对话 - complete

In [13]:
%%time

completion = Settings.llm.complete("你谁啊")
print(completion)

我是通义千问，由阿里云开发的人工智能助手。我被设计用来回答各种问题、提供信息和与用户进行对话。有什么我可以帮助你的吗？
CPU times: user 5.96 ms, sys: 240 µs, total: 6.2 ms
Wall time: 988 ms


## tokenizer - 默认使用的OpenAI cl100k_base 可能不匹配开源模型

In [3]:
%%time

Settings.tokenizer

CPU times: user 229 ms, sys: 16.1 ms, total: 245 ms
Wall time: 245 ms


functools.partial(<bound method Encoding.encode of <Encoding 'cl100k_base'>>, allowed_special='all')

## 流式对话 - stream_complete

### 简单使用

In [8]:
%%time

completions = Settings.llm.stream_complete("什么是文氏图？")
for completion in completions:
    print(completion.delta, end="")

文氏图（Venn Diagram），也称为韦恩图，是由约翰·维纳于1880年发明的一种逻辑图表。它通过圆形或椭圆形的重叠区域来表示集合、类或概念之间的关系和相互间的交集。

在文氏图中：
- **圆圈**代表不同的集合或类别。
- **重叠的部分**表示两个或多个集合之间的共同元素或属性。
- **非重叠的部分**则表示每个单独集合独有的元素或属性。

文氏图通常用于数学、逻辑学、统计学等领域，帮助人们直观地理解集合间的包含关系、并集、交集和补集等概念。它在教育中也广泛使用，作为教授逻辑、分类和比较不同概念的有效工具。CPU times: user 106 ms, sys: 4 ms, total: 110 ms
Wall time: 5.56 s


In [10]:
import inspect

print(inspect.isgenerator(completions))

True


### 集成到ui库的使用

In [7]:
%%time

streaming_response = Settings.llm.stream_complete("介绍下集合论？")

# 没有 response_gen ，无法和queryEgine方式统一行为
# streaming_response.response_gen



CPU times: user 283 µs, sys: 48 µs, total: 331 µs
Wall time: 317 µs


<generator object llm_completion_callback.<locals>.wrap.<locals>.wrapped_llm_predict.<locals>.wrapped_gen at 0x7f929b1d5310>

## 使用 chat

In [11]:
%%time

from llama_index.core.llms import ChatMessage, MessageRole

resp = Settings.llm.chat([
        ChatMessage(
            role=MessageRole.SYSTEM,
            content=(
                "你是专业的数学家，在数学问题方面能给出即专业又通俗易懂而且还有条理的回答。"
            ),
        ),
        ChatMessage(role=MessageRole.USER, content="解释下大数定理"),
    ])

print(resp)

assistant: 大数定理是概率论中的一个基本原理，它描述了在大量重复实验中，平均结果如何趋向于理论上的期望值。这个概念对于理解随机事件的长期行为和预测具有重要意义。

### 伯努利大数定律（弱大数定律）

伯努利大数定律是大数定理的一种形式，适用于独立、同分布的随机变量序列。具体来说：

假设有一系列独立且同分布的随机变量 \(X_1, X_2, \ldots, X_n\)，每个随机变量都有相同的期望值（均值）\(\mu\) 和相同的标准差（方差）。如果我们将这些随机变量相加并除以样本数量 \(n\)，即计算平均数 \(\bar{X} = \frac{1}{n}\sum_{i=1}^{n} X_i\)，那么随着 \(n\) 的增加，这个平均值会趋向于 \(\mu\)。

数学表达式为：
\[
\lim_{n \to \infty} P\left(|\bar{X} - \mu| < \epsilon\right) = 1
\]
其中 \(\epsilon > 0\) 是任意小的正数。这意味着随着样本量 \(n\) 的增加，平均值 \(\bar{X}\) 越来越接近期望值 \(\mu\)。

### 切比雪夫大数定律（强大数定律）

切比雪夫大数定律是伯努利大数定律的加强版。它不仅描述了概率上的收敛性，还给出了一个更严格的条件下的收敛结果：

如果 \(X_1, X_2, \ldots, X_n\) 是独立同分布的随机变量，并且它们的期望值和方差都存在（即 \(E[X_i] = \mu\) 和 \(Var(X_i) = \sigma^2 < \infty\)），那么对于任意正数 \(\epsilon > 0\)，有：
\[
\lim_{n \to \infty} P(|\bar{X} - \mu| < \epsilon) = 1
\]
这意味着随着样本量 \(n\) 的增加，平均值 \(\bar{X}\) 不仅概率上趋向于期望值 \(\mu\)，而且几乎必然地（即概率为1）会接近 \(\mu\)。

### 应用

大数定理在许多领域都有广泛的应用，包括但不限于：

- **金融**：预测股票价格的长期平均行为。
- **保险业**：估计理赔金额的总体趋势和风险评估。
- **统计学**：样本均值如何代表总体均值。
- **经济学**：分析经济指标的长期趋势。


## 参考

- [Component Guides - Using LLMs](https://docs.llamaindex.ai/en/stable/module_guides/models/llms/)
- [API Reference - Openai like](https://docs.llamaindex.ai/en/stable/api_reference/llms/openai_like/)
- [Component Guides - Using LLMs as standalone modules](https://docs.llamaindex.ai/en/stable/module_guides/models/llms/usage_standalone/)