# API 使用

模型的API包括：

- stream: 流式处理单个输入并返回响应的流式数据，即回答是部分返回，返回对象为`AIMessageChunk`
- invoke: 处理单个输入调用
- batch：批处理多个输入列表

上述均为同步调用，异步调用函数在前面加一个`a`，即`stream`的异步函数为`astream`。
除此之外，还有：

- astream_log: 异步返回的中间步骤及最终结果
- astream_events: 流式传输中发生的事件

In [None]:
from langchain_openai import ChatOpenAI

model = ChatOpenAI(
    model='deepseek-r1:14b',
    base_url='http://192.168.1.188:11434/v1',
    api_key='your_api_key'
)

chunks = []
for chunk in model.stream('天空为什么是蓝色的'):
    chunks.append(chunk)
    print(chunk.content, end='|', flush=True)

<think>|
|嗯|，|我|最近|一直在|想|一个问题|：“|天空|为什么|是|蓝色|的|？”|这个问题|听起来|好像|很简单|，|但是|有时候|简单|的问题|背后|其实|隐藏|着|很多|复杂的|科学|知识|。|我记得|小时候|学|过的|，|说|是因为|大气|层|的作用|，|但|具体|是怎么|回事|呢|？|我觉得|有必要|详细|了解一下|。

|首先|，|我知道|太阳|光|是由|多种|颜色|组成的|，|也就是|我们|常说|的|七|彩|光|或者|彩虹|的颜色|：|红|、|橙|、|黄|、|绿|、|蓝|、|靛|、|紫|。|每|种|颜色|对应|不同的|波|长|和|能量|。|红色|光|波|长|较长|，|紫色|光|波|短|。|那么|，|这些|不同|颜色|的|光|在|进入|地球|大气|层|时|会发生|什么呢|？

|大气|层|是由|各种|气体|组成的|，|比如|氮|气|、|氧气|还有|臭|氧|等等|。|其中|氮|气|分子|的数量|最多|，|大约|占|了|7|8|%|。|我觉得|氮|气|在这种|现象|中|可能|扮演|着|重要|角色|。

|我记得|以前|听说过|散|射|的现象|，|尤其是在|物理学|课|上|。|光线|在|传播|过程中|遇到|小|颗粒|时|会发生|散|射|，|不同|颜色|的|光|因为|波|长|的不同|，|散|射|的程度|也会|不同|。|短|波|长|的|光|更容易|被|散|射|，|比如|紫色|和|蓝色|，|而|红色|和|橙|色|这样的|长|波|长|光|则|不容易|被|散|射|。

|那么|，|为什么|我们|看到|的|天空|是|蓝色|而不是|紫色|呢|？|如果|蓝色|比|紫色|更容易|被|散|射|，|那|理论上|天空|的颜色|应该|偏向|于|蓝色|或|紫色|吧|。|但是|实际上|，|天空|却是|蓝|颜色|的|，|这|可能|是因为|人|眼|对|蓝色|的|敏感|度|更高|，|或者说|大气|中|某些|因素|影响|了|散|射|后的|颜色|。

|另外|，|我还|听说过|瑞|利|散|射|这个|概念|，|可能|和|这个问题|有关|。|查|了一下|资料|，|瑞|利|散|射|是指|光|在|传播|过程中|遇到|比|光|波|长|小|很多|的|粒子|，|导致|光线|向|不同|方向|散|开|的现象|。|根据|瑞|利|散|射|定律|，|散|射|的程度|与|光|波|长|的|四|次|方|成|反|比

In [5]:
from langchain_openai import ChatOpenAI

model = ChatOpenAI(
    model='deepseek-r1:14b',
    base_url='http://192.168.1.188:11434/v1',
    api_key='your_api_key'
)

async def async_stream(question: str):
    chunks = []
    # chunk类型为AIMessageChunk
    async for chunk in model.astream(question):
        chunks.append(chunk)
        print(chunk.content, end='|', flush=True)

await async_stream('海水是什么颜色？')

<think>|
|嗯|，|用户|问|的是|“|海水|是什么|颜色|？”|这个问题|看起来|挺|简单的|，|但|我觉得|可能|需要|更|深入|地|思考|一下|。|毕竟|，|我知道|海水|的颜色|不是|单一|的|，|可能|跟|很多|因素|有关|。

|首先|，|我|想到|蓝色|是|大家|最|常|提到|的|海水|颜色|。|比如|在|旅游|照片|里|，|海水|常常|呈现出|深|浅|不|一|的|蓝色|调|，|从|浅|蓝|到|深|蓝|不|等|。|这|让我|猜测|，|海水|之所以|呈现|蓝色|，|可能|与|光线|的|折射|和|散|射|有关|。|记得|以前|学|过|光|的|散|射|，|大气|中的|分子|会|将|阳光|分散|成|各种|颜色|，|而|海洋|作为|水|体|，|可能|也有|类似的|效应|。

|然后|，|我想|到了|其他|可能|的颜色|。|有时候|在|旅游|照片|中|看到|海水|呈现出|绿色|或|黄色|，|特别是在|浅|海|区域|。|这|可能|与|海底|的|植被|有关|，|比如|海|藻|或者其他|水中|植物|，|它们|可能会|改变|海水|的颜色|。|我还|听说过|红|潮|现象|，|那|通常是|由于|某些|藻|类|大量|繁殖|导致|的|红色|海水|。

|再|深入|一点|，|水|深|也可能|影响|海水|的颜色|。|越|深|的|水|体|，|光线|穿透|的距离|就越|长|，|而|不同|波|长|的|光|在|水|中的|衰|减|速度|不同|（|通常|紫色|和|蓝色|的|光|波|较长|），|所以|较|深|的|海|水分|可能|显得|更深|色|，|甚至|接近|黑色|，|尤其是在|没有|阳光|直|射|的情况下|。

|此外|，|杂质|、|浮|游|生物|和其他|海洋|生物|也可能|影响|海水|的颜色|。|例如|，|当|有很多|浮|游|植物|（|如|浮|游|藻|类|）|时|，|水|体|可能会|变得更|绿|或|更|红|，|反之|则|可能|较|清澈|呈现|蓝色|。

|还有|天气|因素|，|比如|晴|天|和|多|云|的|天气|，|阳光|强度|不同|，|散|射|的情况|也|不同|，|这|会影响|海|面|的颜色|显现|效果|。|有时候|在|早晨|或|傍晚|，|光线|角度|变化|，|海水|看起来|也可能|有不同的|颜色|层次|。

|总结|一下|，|海水|颜色|主要|由|以下几个|因素|决定|：|光|的|

模型的输出和`stream`是可以匹配的。如下例所示，其返回的数据每一步都转换为`JSON`格式。

In [8]:
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import JsonOutputParser

model = ChatOpenAI(
    model='deepseek-r1:14b',
    base_url='http://192.168.1.188:11434/v1',
    api_key='your_api_key'
)

chain = model | JsonOutputParser()

async def async_chat():
    async for text in chain.astream(
        "以JSON格式输出德国、法国、日本和西班牙的人口列表"
        '使用一个"countries"外部键的字典，其中包括国家列表。'
        "每个国家都应该包含键`name`和`population`"
    ):
        print(text, flush=True)

names = await async_chat()
print(f'names: {names}')

{}
{'countries': []}
{'countries': [{}]}
{'countries': [{'name': ''}]}
{'countries': [{'name': 'Germany'}]}
{'countries': [{'name': 'Germany', 'population': 8}]}
{'countries': [{'name': 'Germany', 'population': 83}]}
{'countries': [{'name': 'Germany', 'population': 830}]}
{'countries': [{'name': 'Germany', 'population': 8307}]}
{'countries': [{'name': 'Germany', 'population': 83074}]}
{'countries': [{'name': 'Germany', 'population': 830745}]}
{'countries': [{'name': 'Germany', 'population': 8307459}]}
{'countries': [{'name': 'Germany', 'population': 83074598}]}
{'countries': [{'name': 'Germany', 'population': 83074598}, {}]}
{'countries': [{'name': 'Germany', 'population': 83074598}, {'name': ''}]}
{'countries': [{'name': 'Germany', 'population': 83074598}, {'name': 'France'}]}
{'countries': [{'name': 'Germany', 'population': 83074598}, {'name': 'France', 'population': 6}]}
{'countries': [{'name': 'Germany', 'population': 83074598}, {'name': 'France', 'population': 66}]}
{'countries': 

结果返回`JSON`格式后，如果要对`JSON`对应的字段进行提取，如提取`name`字段，返回国家列表，可以进行如下操作。

In [17]:
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import JsonOutputParser

model = ChatOpenAI(
    model='deepseek-r1:14b',
    base_url='http://192.168.1.188:11434/v1',
    api_key='your_api_key'
)

def extract_name(inputs):
    if not isinstance(inputs, dict):
        return ""
    if "countries" not in inputs:
        return ""
    countries = inputs['countries']
    if not isinstance(countries, list):
        return ""
    names = [country.get('name') for country in countries if isinstance(country, dict)]
    return names

chain = model | JsonOutputParser() | extract_name

async def async_chat():
    async for text in chain.astream(
        "以JSON格式输出德国、法国、日本和西班牙的人口列表"
        '使用一个"countries"外部键的字典，其中包括国家列表。'
        "每个国家都应该包含键`name`和`population`"
    ):
        # print(text, end='|',flush=True)
        return text

names = await async_chat()
print(f'names: {names}')

names: ['Germany', 'France', 'Japan', 'Spain']


## 事件流

一般用于`debug`程序或者定位调用链时使用。常见的`chat`的`event`包括：

- on_chat_model_start
- on_chat_model_stream
- on_chat_model_end

In [23]:
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import JsonOutputParser

model = ChatOpenAI(
    model='deepseek-r1:14b',
    base_url='http://192.168.1.188:11434/v1',
    api_key='your_api_key'
)

async def get_events():
    async for event in model.astream_events('你是谁？', version='v2'):
        print(event, end='\n', flush=True)

await get_events()

{'event': 'on_chat_model_start', 'data': {'input': '你是谁？'}, 'name': 'ChatOpenAI', 'tags': [], 'run_id': 'cc0efbc8-ed77-4866-8b51-f8bafea0cb70', 'metadata': {'ls_provider': 'openai', 'ls_model_name': 'deepseek-r1:14b', 'ls_model_type': 'chat', 'ls_temperature': None}, 'parent_ids': []}
{'event': 'on_chat_model_stream', 'run_id': 'cc0efbc8-ed77-4866-8b51-f8bafea0cb70', 'name': 'ChatOpenAI', 'tags': [], 'metadata': {'ls_provider': 'openai', 'ls_model_name': 'deepseek-r1:14b', 'ls_model_type': 'chat', 'ls_temperature': None}, 'data': {'chunk': AIMessageChunk(content='<think>', additional_kwargs={}, response_metadata={}, id='run-cc0efbc8-ed77-4866-8b51-f8bafea0cb70')}, 'parent_ids': []}
{'event': 'on_chat_model_stream', 'run_id': 'cc0efbc8-ed77-4866-8b51-f8bafea0cb70', 'name': 'ChatOpenAI', 'tags': [], 'metadata': {'ls_provider': 'openai', 'ls_model_name': 'deepseek-r1:14b', 'ls_model_type': 'chat', 'ls_temperature': None}, 'data': {'chunk': AIMessageChunk(content='\n\n', additional_kwargs=

## 调试和跟踪

在详情模式（verbose）中，上述重要信息将会打印出来。而调试模式（debug）所有日志都会打印。而`LangSmith`跟踪所有信息，但是不能本地执行，且是收费应用（目前有一定的免费额度）。

`LangSmith`的设置(可配置在`.env`文件中)如下：

```shell
LANGSMITH_TRACING=true
LANGSMITH_ENDPOINT="https://api.smith.langchain.com"
LANGSMITH_API_KEY="your_api_key"
LANGSMITH_PROJECT="your_project_name"
```


In [None]:
from langchain_openai import ChatOpenAI
from langchain.agents import AgentExecutor, create_tool_calling_agent
from langchain_community.tools.tavily_search import TavilySearchResults
from langchain_core.prompts import ChatPromptTemplate
from langchain.globals import set_verbose
from dotenv import load_dotenv


load_dotenv()
# 使用智谱开放平台免费 glm-4-flash 模型（https://open.bigmodel.cn）
model = ChatOpenAI(model='glm-4-flash')
# 搜索工具，需注册方可使用，也可以使用  
tools = [TavilySearchResults(max_results=1)]
prompt = ChatPromptTemplate.from_messages(
    [
        ('system', '你是一个小助手'),
        ('placeholder', "{chat_history}"),
        ('human', '{input}'),
        ('placeholder', "{agent_scratchpad}")
    ]
)
agent = create_tool_calling_agent(model, tools, prompt)
# 设置打印详情，如果要打印debug信息，使用 set_debug(True)
set_verbose(True)
agent_executor = AgentExecutor(agent=agent, tools=tools)
agent_executor.invoke({'input':'《热辣滚烫》的导演是谁，今年几岁了？'})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `tavily_search_results_json` with `{'query': '热辣滚烫 导演'}`


[0m[36;1m[1;3m[{'title': '热辣滚烫_百度百科', 'url': 'https://baike.baidu.com/item/%E7%83%AD%E8%BE%A3%E6%BB%9A%E7%83%AB/61943936', 'content': '《热辣滚烫》是由贾玲执导，孙集斌编剧，贾玲、雷佳音领衔主演，张小斐、赵海燕、张琪、许君聪、卜钰、朱天福、刘宏禄主演，杨紫、沙溢、魏翔、李雪琴、沈春阳、沈涛、马丽、乔', 'score': 0.8259413}][0m[32;1m[1;3m
Invoking: `tavily_search_results_json` with `{'query': '贾玲今年几岁了'}`


[0m[36;1m[1;3m[{'title': '贾玲- 维基百科，自由的百科全书', 'url': 'https://zh.wikipedia.org/zh-hans/%E8%B4%BE%E7%8E%B2', 'content': '贾玲 编辑 ; 中华人民共和国 · 汉族 · (1982-04-29) 1982年4月29日（42岁）. 中华人民共和国湖北省襄阳地区宜城县.', 'score': 0.80698997}][0m[32;1m[1;3m《热辣滚烫》的导演是贾玲，今年42岁。[0m

[1m> Finished chain.[0m


{'input': '《热辣滚烫》的导演是谁，今年几岁了？', 'output': '《热辣滚烫》的导演是贾玲，今年42岁。'}

从上面的输出可以看出：

- 这个调用了两次搜索
- 大模型在这里只是将返回的内容做了总结