# 3. LangChain基础

In [1]:
import warnings
warnings.filterwarnings("ignore", category=DeprecationWarning)

## 3.4. LangChain的回调

### 3.4.2. 认识异步回调

In [2]:
import asyncio
from typing import Any, Dict, List
from langchain.callbacks.base import AsyncCallbackHandler, BaseCallbackHandler
from langchain_core.messages import HumanMessage
from langchain_core.outputs import LLMResult
from langchain_openai import ChatOpenAI
from langchain_community.chat_models import ChatOllama

class MyCustomSyncHandler(BaseCallbackHandler):
    def on_llm_new_token(self, token: str, **kwargs) -> None:
        print(f"正在 thread_pool_executor 中调用同步处理程序: token: {token}")

class MyCustomAsyncHandler(AsyncCallbackHandler):
    """可用于处理来自LangChain的回调异步回调处理程序。"""
    async def on_llm_start(
        self, serialized: Dict[str, Any], prompts: List[str], **kwargs: Any) -> None:
        """在链开始时运行。"""
        print("zzzz....")
        await asyncio.sleep(0.3)
        class_name = serialized["name"]
        print("LLM正在启动")

    async def on_llm_end(self, response: LLMResult, **kwargs: Any) -> None:
        """在链结束时运行。"""
        print("zzzz....")
        await asyncio.sleep(0.3)
        print("LLM结束")


# 为了启用流式传输，在ChatModel()构造函数中传入streaming=True
# 此外，还传入了一个包含自定义处理程序的列表

"""
openai_api_key = "EMPTY"
openai_api_base = "http://localhost:11434/v1"

chat = ChatOpenAI(
    openai_api_key = openai_api_key, 
    openai_api_base = openai_api_base,
    temperature=0, 
    streaming=True,
    callbacks=[MyCustomSyncHandler(), MyCustomAsyncHandler()],)
"""

chat = ChatOllama(
    model="gpt-oss:20b",
    temperature=0, 
    streaming=True,
    callbacks=[MyCustomSyncHandler(), MyCustomAsyncHandler()],)

await chat.agenerate([[HumanMessage(content="告诉我北京的特产，回答不要超过32个字")]])

zzzz....
LLM正在启动
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: token: 
正在 thread_pool_executor 中调用同步处理程序: to

LLMResult(generations=[[ChatGeneration(text='烤鸭、炸酱面、豆汁、驴打滚、卤煮、糖葫芦。', generation_info={'model': 'gpt-oss:20b', 'created_at': '2025-12-31T08:52:17.135373423Z', 'message': {'role': 'assistant', 'content': ''}, 'done': True, 'done_reason': 'stop', 'total_duration': 1961936666, 'load_duration': 123305565, 'prompt_eval_count': 379, 'prompt_eval_duration': 9932778, 'eval_count': 29, 'eval_duration': 140713750}, message=AIMessage(content='烤鸭、炸酱面、豆汁、驴打滚、卤煮、糖葫芦。', response_metadata={'model': 'gpt-oss:20b', 'created_at': '2025-12-31T08:52:17.135373423Z', 'message': {'role': 'assistant', 'content': ''}, 'done': True, 'done_reason': 'stop', 'total_duration': 1961936666, 'load_duration': 123305565, 'prompt_eval_count': 379, 'prompt_eval_duration': 9932778, 'eval_count': 29, 'eval_duration': 140713750}, id='run-933bd4de-2b2c-49cc-aa44-3058a5b3f4c9-0'))]], llm_output={}, run=[RunInfo(run_id=UUID('933bd4de-2b2c-49cc-aa44-3058a5b3f4c9'))])

### 3.4.4. 自定义回调

In [3]:
from langchain_core.callbacks import BaseCallbackHandler
from langchain_core.messages import HumanMessage
from langchain_openai import ChatOpenAI
from langchain_community.chat_models import ChatOllama

class MyCustomHandler(BaseCallbackHandler):
    def on_llm_new_token(self, token: str, **kwargs) -> None:
        print(f"自定义回调处理器, token: {token}")

"""
openai_api_key = "EMPTY"
openai_api_base = "http://localhost:11434/v1"
chat = ChatOpenAI(max_tokens=25, streaming=True,openai_api_key = openai_api_key,openai_api_base = openai_api_base, callbacks=[MyCustomHandler()])
"""

chat = ChatOllama(model="gpt-oss:20b", max_tokens=25, streaming=True, callbacks=[MyCustomHandler()])
chat([HumanMessage(content="中国首都是？")])

  warn_deprecated(


自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 
自定义回调处理器, token: 中国
自定义回调处理器, token: 的
自定义回调处理器, token: 首
自定义回调处理器, token: 都
自定义回调处理器, token: 就是
自定义回调处理器, token: **
自定义回调处理器, token: 北京
自定义回调处理器, token: **
自定义回调处理器, token: 。
自定义回调处理器, token: 


AIMessage(content='中国的首都就是**北京**。', response_metadata={'model': 'gpt-oss:20b', 'created_at': '2025-12-31T08:52:27.741146539Z', 'message': {'role': 'assistant', 'content': ''}, 'done': True, 'done_reason': 'stop', 'total_duration': 486122284, 'load_duration': 120562873, 'prompt_eval_count': 116, 'prompt_eval_duration': 9564759, 'eval_count': 10, 'eval_duration': 43851537}, id='run-f8c23878-a1ce-4844-bf22-360677da7493-0')

### 3.4.5. 使用回调记录日志

In [4]:
from langchain.callbacks import FileCallbackHandler
from langchain.chains import LLMChain
from langchain_core.prompts import PromptTemplate
from langchain_openai import OpenAI
from langchain_community.chat_models import ChatOllama
from loguru import logger

logfile = "output.log"
logger.add(logfile, colorize=True, enqueue=True)
handler = FileCallbackHandler(logfile)

"""
openai_api_key = "EMPTY"
openai_api_base = "http://localhost:11434/v1"
llm = OpenAI(openai_api_key = openai_api_key, openai_api_base = openai_api_base,)
"""
llm = ChatOllama(model="gpt-oss:20b")
prompt = PromptTemplate.from_template("1 + {number} = ")

# 这个链将同时向标准输出打印（因为 verbose=True）并写入 'output.log'
# 如果 verbose=False，FileCallbackHandler 仍会写入 'output.log'
chain = LLMChain(llm=llm, prompt=prompt, callbacks=[handler], verbose=True)
answer = chain.run(number=1)
logger.info(answer)

  warn_deprecated(




[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m1 + 1 = [0m


[32m2025-12-31 00:52:45.839[0m | [1mINFO    [0m | [36m__main__[0m:[36m<module>[0m:[36m24[0m - [1m2[0m



[1m> Finished chain.[0m


### 3.4.6. 处理多个回调

In [5]:
from typing import Any, Dict, List, Union
from langchain.agents import AgentType, initialize_agent, load_tools
from langchain.callbacks.base import BaseCallbackHandler
from langchain_core.agents import AgentAction
from langchain_community.llms import Ollama

# 定义自定义回调处理器
class MyCustomHandlerOne(BaseCallbackHandler):
    def on_llm_start(
        self, serialized: Dict[str, Any], prompts: List[str], **kwargs: Any) -> Any:
        print(f"on_llm_start {serialized['name']}")

    def on_llm_new_token(self, token: str, **kwargs: Any) -> Any:
        print(f"on_new_token {token}")

    def on_llm_error(
        self, error: Union[Exception, KeyboardInterrupt], **kwargs: Any ) -> Any:
        """Run when LLM errors."""

    def on_chain_start(
        self, serialized: Dict[str, Any], inputs: Dict[str, Any], **kwargs: Any) -> Any:
        print(f"on_chain_start {serialized['name']}")

    def on_tool_start(
        self, serialized: Dict[str, Any], input_str: str, **kwargs: Any) -> Any:
        print(f"on_tool_start {serialized['name']}")

    def on_agent_action(self, action: AgentAction, **kwargs: Any) -> Any:
        print(f"on_agent_action {action}")

class MyCustomHandlerTwo(BaseCallbackHandler):
    def on_llm_start(
        self, serialized: Dict[str, Any], prompts: List[str], **kwargs: Any
    ) -> Any:
        print(f"on_llm_start (I'm the second handler!!) {serialized['name']}")

# 实例化处理器
handler1 = MyCustomHandlerOne()
handler2 = MyCustomHandlerTwo()

# 设置代理。只有“llm”会为handler2发出回调
llm = Ollama(model="deepseek-r1:1.5b", callbacks=[handler2])
tools = load_tools(["llm-math"], llm=llm)
agent = initialize_agent(tools, llm, agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION)

# handler1的回调将由参与Agent执行的每个对象（llm、llmchain、tool、agent executor）发出
agent.run("为什么影子之间会有吸力?", callbacks=[handler1])

  warn_deprecated(


on_chain_start AgentExecutor
on_chain_start LLMChain
on_llm_start Ollama
on_llm_start (I'm the second handler!!) Ollama
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token 
on_new_token

'** 影子之间有吸力是因为光沿直线传播，遮挡后形成的阴影在不同位置因为光线路径的不同而逐渐靠近或分开，这与光的直线传播和障碍物的影响有关。'