## 加载环境变量

In [28]:
import os
from dotenv import load_dotenv

# 加载 .env 文件中的环境变量
load_dotenv(override=True)  # 使用 override=True 确保加载最新的 .env 数据

True

## LangChain 可执行组件的基本调用方式(Runnable 核心方法)

In [43]:
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(
    model=os.environ.get("OPENAPI_MODEL"),
    base_url=os.environ.get("OPENAPI_API_BASE"),
    api_key=os.environ.get("OPENAPI_API_KEY"),
    temperature=0,
)

question = "LangChain是什么？"

### invoke(): 同步执行一个 Runnable

In [44]:
llm.invoke(question)

AIMessage(content='LangChain 是一个用于构建基于大语言模型（LLM）应用的开发框架，旨在帮助开发者更高效地利用语言模型的能力，结合外部数据和工具，创建功能丰富的应用程序。以下是关于 LangChain 的详细介绍：\n\n---\n\n### **1. 核心功能**\n- **连接语言模型与其他组件**：  \n  将LLM（如GPT、Claude等）与外部数据源、API、数据库等集成，扩展模型的能力。\n- **模块化设计**：  \n  提供可组合的模块（如模型调用、记忆管理、工具使用等），简化开发流程。\n- **支持多种应用场景**：  \n  如问答系统、聊天机器人、文本生成、数据分析等。\n\n---\n\n### **2. 关键组件**\n- **Models**：支持多种LLM提供商（OpenAI、Anthropic、Hugging Face等）。\n- **Prompts**：优化提示词（Prompt）设计，支持模板化、动态提示。\n- **Chains**：将多个步骤组合成工作流（例如：调用模型→处理输出→调用API）。\n- **Agents**：让模型自主选择工具（如搜索、计算、代码执行）完成任务。\n- **Memory**：管理对话历史或上下文，实现多轮交互。\n- **Indexes**：集成外部数据（文档、数据库），支持检索增强生成（RAG）。\n\n---\n\n### **3. 典型应用场景**\n- **检索增强生成（RAG）**：  \n  从自定义数据源（如PDF、数据库）中提取信息，生成更精准的回答。\n- **自主Agent**：  \n  模型通过调用工具（如搜索引擎、Python解释器）完成复杂任务。\n- **对话系统**：  \n  构建有记忆能力的聊天机器人，支持个性化交互。\n- **自动化流程**：  \n  如自动生成报告、数据分析、代码辅助等。\n\n---\n\n### **4. 代码示例（Python）**\n```python\nfrom langchain_openai import ChatOpenAI\nfrom langchain_core.prompts import ChatPromptTemplate\n\n# 初始化模型\nllm = ChatOpenA

### stream(): 流式生成响应，通常用于实时显示文本。

In [7]:
for chunk in llm.stream(question):
    print(chunk.content, end="|", flush=True)

Lang|Chain| |是一个|用于|构建|基于|大型|语言|模型|（|LL|M|）|的|应用程序|的开|源|框架|。|它|由| Harrison| Chase| |于| |202|2| |年|推出|，|旨在|简化|语言|模型|在实际|应用|中的|集成|和|扩展|。|以下是| Lang|Chain| |的核心|概念|和|功能|：

|---

|###| **|1|.| |核心|功能|**
|-| **|模块|化|设计|**|：|提供|标准化|接口|，|方便|连接|不同|组件|（|如|语言|模型|、|数据|源|、|工具|等|）。
|-| **|链|式|调用|（|Ch|ains|）|**|：|将|多个|步骤|组合|成|工作|流|（|例如|：|调用|模型| →| |处理|输出| →| |调用|外部| API|）。
|-| **|上下文|管理|**|：|支持|长期|记忆|（|如|聊天|历史|）|和|短期|上下文|（|当前|会话|）。
|-| **|工具|集成|**|：|允许|模型|与|外部|工具|（|搜索|、|计算|、|数据库|等|）|交互|，|增强|实用性|。

|---

|###| **|2|.| |主要|组件|**
|-| **|Models|**|：|支持|多种| LL|M|（|如| OpenAI|、|An|throp|ic|、|H|ug|ging| Face| |等|）|和|嵌入|模型|。
|-| **|Prom|pts|**|：|管理|提示|模板|，|支持|动态|内容|注入|。
|-| **|Memory|**|：|存储|对话|历史|或|应用|状态|（|如| `|Convers|ation|Buffer|Memory|`|）。
|-| **|Index|es|**|：|连接|外部|数据|（|文档|、|数据库|），|支持|检索|增强|生成|（|R|AG|）。
|-| **|Ag|ents|**|：|让|模型|自主|选择|工具|完成任务|（|类似|自主|决策|的| AI| |代理|）。

|---

|###| **|3|.| |典型|应用|场景|**
|-| **|问答|系统|**|：|基于|文档|的|智能|问答|（|R|AG|）。
|-| **|聊天|机器人|**|：|支持|多|轮|对话|和|上下文|记忆|。
|-| **|数据|增强|应用|**|：|结合

### batch(): 批量处理多个输入，常用于提高并行处理效率。

In [5]:
llm.batch(["LangChain作者是谁？", "LangChain的竞品有哪些？"])

[AIMessage(content='LangChain 是由 **Harrison Chase** 创建的。他于 2022 年 10 月首次开源发布了 LangChain 项目，旨在帮助开发者更高效地构建基于大型语言模型（LLM）的应用程序。LangChain 提供了模块化工具和组件，支持链式调用、记忆管理、代理（agents）等功能，成为 AI 开发领域的重要工具之一。\n\nHarrison Chase 此前在机器学习与自然语言处理领域有丰富经验，LangChain 的迅速流行也与他及团队对开发者生态的重视密切相关。目前，LangChain 已发展为一个活跃的开源社区，并有商业公司提供支持。', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 134, 'prompt_tokens': 8, 'total_tokens': 142, 'completion_tokens_details': {'accepted_prediction_tokens': None, 'audio_tokens': None, 'reasoning_tokens': 0, 'rejected_prediction_tokens': None}, 'prompt_tokens_details': {'audio_tokens': None, 'cached_tokens': 0}}, 'model_name': 'deepseek-v3-250324', 'system_fingerprint': None, 'id': '0217564594548840fa6ef8c2347680bd87fd8d357bb16f17f6304', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--49d1ff36-8749-4e0c-b0a5-7f873835fa4c-0', usage_metadata={'input_tokens': 8, 'output_tokens': 134, 'total_tokens': 142, 'input_toke

### astream_events(): 异步流式传输事件，用于接收更丰富的中间步骤信息，比如工具调用或链的中间状态。

In [6]:
async for event in llm.astream_events(question, version="v2"):
    print(f"event={event['event']} | name={event['name']} | data={event['data']}")

event=on_chat_model_start | name=ChatOpenAI | data={'input': 'langchain是什么？'}
event=on_chat_model_stream | name=ChatOpenAI | data={'chunk': AIMessageChunk(content='Lang', additional_kwargs={}, response_metadata={}, id='run--d1ca40cd-2cfb-462f-b0d1-eebfeefb0c87')}
event=on_chat_model_stream | name=ChatOpenAI | data={'chunk': AIMessageChunk(content='Chain', additional_kwargs={}, response_metadata={}, id='run--d1ca40cd-2cfb-462f-b0d1-eebfeefb0c87')}
event=on_chat_model_stream | name=ChatOpenAI | data={'chunk': AIMessageChunk(content=' ', additional_kwargs={}, response_metadata={}, id='run--d1ca40cd-2cfb-462f-b0d1-eebfeefb0c87')}
event=on_chat_model_stream | name=ChatOpenAI | data={'chunk': AIMessageChunk(content='是一个', additional_kwargs={}, response_metadata={}, id='run--d1ca40cd-2cfb-462f-b0d1-eebfeefb0c87')}
event=on_chat_model_stream | name=ChatOpenAI | data={'chunk': AIMessageChunk(content='用于', additional_kwargs={}, response_metadata={}, id='run--d1ca40cd-2cfb-462f-b0d1-eebfeefb0c87'

### with_structured_output()
影响LLM的输出，以结构化的数据来输出而不是字符串
- 将 LLM 的输出强制转换为结构化格式（如 JSON）。它返回一个带有输出解析器（Output Parser）的新 Runnable。

#### 定义数据格式

In [45]:
from pydantic import BaseModel, Field
from typing import Optional
from typing_extensions import Annotated, TypedDict


# 定义 Pydantic 模型
class Joke(BaseModel):
    setup: str = Field(description="The setup of the joke")
    punchline: str = Field(description="The punchline of the joke")
    rating: Optional[int] = Field(
        default=None, description="The rating of the joke from 1 to 10", ge=1, le=10
    )


# 定义字典结构
class Joke2(TypedDict):
    setup: Annotated[str, "The setup of the joke"]
    punchline: Annotated[str, "The punchline of the joke"]
    rating: Annotated[Optional[int], None, "The rating of the joke from 1 to 10"]

#### 将LLM输出转换 Pydantic 模型

In [46]:
# 绑定输出格式
structured_llm = llm.with_structured_output(Joke)

# structured_llm_with_prompt = llm.with_structured_output(Joke, method="json_mode")
# system_message = structured_llm_with_prompt.invoke("")
# print(system_message)

joke_instance = structured_llm.invoke("给我讲一个关于程序员的笑话", {"verbose": True})

print("--- LLM 的原始返回 ---")
# print(joke_instance.content)
print("-----------------------")

# # Print the model instance directly
print(joke_instance)

# # Convert the model to a dictionary
# joke_dict = joke_instance.model_dump()
# print(joke_dict)

# # Convert the model to a JSON string
# joke_json = joke_instance.model_dump_json(indent=4)
# print(joke_json)

ValidationError: 1 validation error for Joke
  Invalid JSON: expected value at line 1 column 1 [type=json_invalid, input_value='好的！这是一个经...比较运算符。）', input_type=str]
    For further information visit https://errors.pydantic.dev/2.11/v/json_invalid

In [47]:
# 使用未指定输出格式LLM调用，做对比
llm.invoke("给我讲一个关于程序员的笑话")

AIMessage(content='好的！这里有一个经典的程序员笑话：\n\n---\n\n**程序员去超市买东西：**  \n店员问："您要袋子吗？"  \n程序员："要。"  \n店员："您要大的还是小的？"  \n程序员："大的。"  \n店员："您要大号的是吧？"  \n程序员："不是，要大号的。"  \n\n（注：程序员以为店员在问"== 还是 != "，结果陷入了编程逻辑的循环😂）\n\n---\n\n另一个版本：  \n**为什么程序员分不清万圣节和圣诞节？**  \n因为 Oct **31**（八进制31）等于 Dec **25**（十进制25）啊！ 🎃→🎄  \n\n希望你喜欢！ 😄', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 141, 'prompt_tokens': 10, 'total_tokens': 151, 'completion_tokens_details': {'accepted_prediction_tokens': None, 'audio_tokens': None, 'reasoning_tokens': 0, 'rejected_prediction_tokens': None}, 'prompt_tokens_details': {'audio_tokens': None, 'cached_tokens': 0}}, 'model_name': 'deepseek-v3-250324', 'system_fingerprint': None, 'id': '02175669498628595974c45c753025815a93ba93a971603461533', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--00c6fafb-e112-4c70-ab38-e06d50ea0289-0', usage_metadata={'input_tokens': 10, 'output_tokens': 141, 'total_tokens': 151, 'input_

In [49]:
# 结构化输出使用流式输出
structured_llm = llm.with_structured_output(Joke2)

for chunk in structured_llm.stream("给我讲一个关于程序员的笑话"):
    print(chunk)