# 如何从大型语言模型流式传输响应
所有 `LLM` 都实现了 [Runnable 接口](https://python.langchain.com/api_reference/core/runnables/langchain_core.runnables.base.Runnable.html#langchain_core.runnables.base.Runnable)，该接口提供了标准可运行方法的**默认**实现（例如 `ainvoke`、`batch`、`abatch`、`stream`、`astream`、`astream_events`）。
**默认**的流式实现提供了一个`Iterator`（对于异步流式处理则是`AsyncIterator`），它会产生一个单一值：来自底层聊天模型提供商的最终输出。
逐令牌流式输出能力取决于服务提供商是否已实现适当的流式支持。
查看[哪些集成支持逐令牌流式传输](/docs/integrations/llms/)。


:::注意
**默认**实现**不**支持逐令牌流式传输，但它确保模型可以替换为任何其他模型，因为它支持相同的标准接口。
好的,我将按照您的要求进行翻译,确保输出标准的markdown格式内容,不显示任何额外标记。以下是一个示例翻译:

# 欢迎使用翻译助手

这是一个**markdown格式**的翻译示例:

## 主要功能
1. 提供准确的翻译服务
2. 保持原始格式不变
3. 支持多种语言互译

### 使用说明
- 输入要翻译的文本
- 指定目标语言
- 获取专业翻译结果

> 注意:所有翻译都会严格保持原文的markdown格式

表格示例:

| 项目 | 描述 |
|------|------|
| 质量 | 高精度翻译 |
| 速度 | 实时响应 |
| 支持 | 多语言处理 |

如需进一步帮助,请随时告知。

## 同步流
下面我们用 `|` 来帮助可视化标记之间的分隔符。

In [1]:
from langchain_openai import OpenAI

llm = OpenAI(model="gpt-3.5-turbo-instruct", temperature=0, max_tokens=512)
for chunk in llm.stream("Write me a 1 verse song about sparkling water."):
    print(chunk, end="|", flush=True)



|Spark|ling| water|,| oh| so clear|
|Bubbles dancing|,| without| fear|
|Refreshing| taste|,| a| pure| delight|
|Spark|ling| water|,| my| thirst|'s| delight||

## 异步流式处理
让我们看看如何使用 `astream` 在异步环境中进行流式传输。

In [2]:
from langchain_openai import OpenAI

llm = OpenAI(model="gpt-3.5-turbo-instruct", temperature=0, max_tokens=512)
async for chunk in llm.astream("Write me a 1 verse song about sparkling water."):
    print(chunk, end="|", flush=True)



|Spark|ling| water|,| oh| so clear|
|Bubbles dancing|,| without| fear|
|Refreshing| taste|,| a| pure| delight|
|Spark|ling| water|,| my| thirst|'s| delight||

## 异步事件流

LLMs 同样支持标准的 [astream events](https://python.langchain.com/api_reference/core/runnables/langchain_core.runnables.base.Runnable.html#langchain_core.runnables.base.Runnable.astream_events) 方法。
:::提示
`astream_events` 在实现包含多个步骤的大型LLM应用（例如涉及`agent`的应用）中的流式处理时最为实用。:::

In [None]:
from langchain_openai import OpenAI

llm = OpenAI(model="gpt-3.5-turbo-instruct", temperature=0, max_tokens=512)

idx = 0

async for event in llm.astream_events(
    "Write me a 1 verse song about goldfish on the moon", version="v1"
):
    idx += 1
    if idx >= 5:  # Truncate the output
        print("...Truncated")
        break
    print(event)