In [3]:
import os
from langchain_community.document_loaders import PyPDFLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import FAISS
from langchain.chains import RetrievalQA
from langchain_deepseek import ChatDeepSeek

from dotenv import load_dotenv
load_dotenv(override=True)


DEEPSEEK_APIKEY = os.environ.get('DEEPSEEK_APIKEY')

llm = ChatDeepSeek(
    model="deepseek-chat",
    api_key=DEEPSEEK_APIKEY  # 替换为实际API密钥
)

In [4]:
llm.invoke("langsmith 在langchain中的作用")

AIMessage(content='LangSmith 是 LangChain 官方推出的一个强大的调试、监控和分析平台，专门用于优化基于 LangChain 构建的应用程序。它在 LangChain 生态中扮演着至关重要的角色，主要体现在以下几个方面：\n\n---\n\n### **1. 调试与开发辅助**\n   - **可视化工作流**：实时展示 LangChain 应用的执行流程（如 Chain、Agent 的调用步骤），帮助开发者直观理解每个组件的输入、输出和中间状态。\n   - **错误追踪**：快速定位失败原因（如 API 调用异常、解析错误等），并提供详细的堆栈信息和上下文。\n   - **Prompt 迭代**：记录每次 LLM 调用的请求和响应，方便开发者优化提示词（Prompt）设计。\n\n---\n\n### **2. 性能监控与分析**\n   - **延迟与成本统计**：跟踪每个步骤的耗时（如 LLM 调用、工具执行）和 token 消耗，帮助优化效率并控制成本。\n   - **质量评估**：通过人工标注或自动指标（如输出一致性、正确性）评估模型表现，支持 A/B 测试不同 Prompt 或模型版本。\n\n---\n\n### **3. 生产环境支持**\n   - **日志持久化**：存储所有运行记录，便于事后审计或复现问题。\n   - **告警机制**：设置阈值（如错误率、延迟），触发异常通知。\n   - **数据导出**：支持将日志导出为 CSV 或其他格式，用于进一步分析。\n\n---\n\n### **4. 协作与团队共享**\n   - **项目共享**：团队可共同查看和标注运行记录，加速问题排查和模型优化。\n   - **版本对比**：比较不同部署版本的行为差异（如切换 LLM 供应商后的效果）。\n\n---\n\n### **5. 与 LangChain 的无缝集成**\n   - **简单接入**：通过环境变量或几行代码即可将 LangChain 应用连接到 LangSmith。\n   - **全面覆盖**：支持 LangChain 的核心组件（Chains、Agents、Tools、Retrievers 等）。\n\n---\n\n### **典型使用场景**\n1. **开发阶段**：快速调

In [5]:
from langchain_core.prompts import ChatPromptTemplate
prompt = ChatPromptTemplate.from_messages([
    ("system", "你是一个python程序员，最近在学langchain"),
    ("user", "{input}")
])
chain = prompt | llm 
chain.invoke({"input": "langsmith 在langchain中的作用"})


AIMessage(content='LangSmith 是 LangChain 官方提供的监控、调试和测试平台，它在 LangChain 生态系统中扮演着重要角色。以下是它的主要作用：\n\n1. **调试和可视化**：\n   - 提供调用链的完整可视化跟踪\n   - 显示每个步骤的输入/输出\n   - 帮助理解复杂的链式调用过程\n\n2. **性能监控**：\n   - 记录每次调用的延迟和资源使用情况\n   - 提供聚合性能指标\n   - 识别性能瓶颈\n\n3. **测试和评估**：\n   - 支持创建测试数据集\n   - 可以运行批量测试\n   - 提供自动化的质量评估\n\n4. **生产环境支持**：\n   - 记录生产环境的调用日志\n   - 支持异常检测\n   - 提供审计跟踪\n\n5. **协作功能**：\n   - 支持团队共享调用跟踪\n   - 可以添加注释和标签\n   - 便于知识共享和问题排查\n\n使用示例：\n```python\nfrom langsmith import Client\n\nclient = Client()\n# 记录一次运行\nrun = client.create_run(\n    project_name="my-project",\n    inputs={"question": "What is LangChain?"},\n    execution_order=1,\n    # 其他元数据...\n)\n```\n\nLangSmith 特别适合以下场景：\n- 开发复杂链式调用时调试问题\n- 评估不同提示词/模型的效果\n- 监控生产环境中的LLM应用\n- 团队协作开发LLM应用\n\n它弥补了LLM开发中缺乏可视化工具和调试手段的空白，是LangChain生态中的重要组成部分。', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 340, 'prompt_tokens': 20, 'total_tokens': 360, 'completion_tokens_details': None, 'prompt_tokens_d

In [6]:
from langchain_core.output_parsers import StrOutputParser
 
output_parser = StrOutputParser()
chain = prompt | llm | output_parser
chain.invoke({"input": "langsmith 在langchain中的作用"})

'LangSmith 是 LangChain 团队开发的官方工具，它在 LangChain 生态系统中扮演着 **开发调试、监控和分析** 的重要角色。以下是它的核心作用：\n\n---\n\n### 1. **可视化调试 & 链路追踪**\n   - **记录完整调用链**：自动记录 LangChain 应用执行的每一步（LLM 调用、工具调用、中间结果等），以可视化时间线展示。\n   - **检查中间状态**：无需手动打印日志，可直接查看每个步骤的输入/输出，快速定位问题（如提示词问题、解析错误等）。\n   - **对比不同运行结果**：方便测试不同参数或提示词的效果。\n\n---\n\n### 2. **测试与评估**\n   - **数据集测试**：上传测试数据集，批量运行链（Chain）或代理（Agent），自动对比预期输出与实际输出。\n   - **性能指标**：统计延迟、Token 消耗、成本等，帮助优化效率。\n   - **回归测试**：确保代码修改不会引入意外行为。\n\n---\n\n### 3. **生产环境监控**\n   - **实时日志**：监控生产环境中链/代理的运行情况，捕获异常。\n   - **用户行为分析**：统计高频查询、失败请求等，指导迭代方向。\n   - **告警集成**：配置异常阈值（如错误率突增）。\n\n---\n\n### 4. **协作与共享**\n   - **团队协作**：共享运行记录、测试结果，加速调试过程。\n   - **知识沉淀**：将调试后的优质链保存为模板，供团队复用。\n\n---\n\n### 与其他工具的关系\n- **LangChain**：提供构建链/代理的框架。\n- **LangServe**：用于部署 LangChain 应用为 API。\n- **LangSmith**：专精于开发和生产中的可观测性，补全工具链闭环。\n\n---\n\n### 典型使用场景\n```python\nfrom langchain_community.llms import OpenAI\nfrom langsmith import Client\n\n# 正常编写 LangChain 代码\nllm = OpenAI(temperature=0.9)\nresponse = llm.i

In [7]:
from langchain_community.document_loaders import WebBaseLoader
loader = WebBaseLoader("https://zhuanlan.zhihu.com/p/687882003")
 
docs = loader.load()



USER_AGENT environment variable not set, consider setting it to identify your requests.
