In [None]:
#导入 dotenv 库的 load_dotenv 函数，用于加载环境变量文件（.env）中的配置
import dotenv
from langchain_openai import ChatOpenAI
import os
dotenv.load_dotenv() #加载当前目录下的 .env 文件
os.environ['OPENAI_API_KEY'] = os.getenv("OPENAI_API_KEY")
os.environ['OPENAI_BASE_URL'] = os.getenv("OPENAI_BASE_URL")
# 创建大模型实例
llm = ChatOpenAI(model="gpt-4.1-mini") # 默认使用 gpt-3.5-turbo
# 直接提供问题，并调用llm
response = llm.invoke("什么是大模型？")
print(response)

In [3]:
from openai import OpenAI
import os
client = OpenAI()

response = client.chat.completions.create(
    model="gpt-4.1-mini",
    messages=[
        {"role": "user", "content": "Hello!"}
    ]
)

print(response.choices[0].message.content)

Hello! How can I assist you today?


In [5]:
from langchain_core.prompts import ChatPromptTemplate
# 需要注意的一点是，这里需要指明具体的role，在这里是system和用户
prompt = ChatPromptTemplate.from_messages([
("system", "你是世界级的技术文档编写者"),
("user", "{input}") # {input}为变量
])
# 我们可以把prompt和具体llm的调用和在一起。
chain = prompt | llm
message = chain.invoke({"input": "大模型中的LangChain是什么?"})
print(message)

content='LangChain 是一种用于构建基于大型语言模型（Large Language Models, LLMs）应用的框架或工具库。它旨在帮助开发者更高效地创建、管理和组合多种语言模型能力，以实现复杂的自然语言处理任务。\n\n具体来说，LangChain 的核心特点和作用包括：\n\n1. **模块化设计**  \n   LangChain 提供了模块化的组件，如链（Chains）、记忆（Memory）、代理（Agents）、工具（Tools）等，方便开发者将语言模型的不同能力组合起来，构建复杂的对话或文本生成流程。\n\n2. **多模型支持**  \n   助力在同一应用中灵活地调用不同的语言模型（如OpenAI的GPT系列、Anthropic、Cohere等），支持多样的后端选择和集成。\n\n3. **记忆管理**  \n   通过内置的记忆组件，LangChain 可以实现对话状态的存储和管理，使模型能够“记住”之前的上下文，提升交互的连贯性和智能度。\n\n4. **整合外部工具和数据**  \n   支持与外部API、数据库和知识库的集成，使得语言模型不仅仅局限于文本生成，还能访问实时数据和执行具体操作。\n\n5. **方便的开发体验**  \n   通过简单的接口和丰富的文档，降低了构建复杂语言模型应用的门槛，促进了快速的原型开发和迭代。\n\n总结来说，LangChain 是一个帮助开发者高效构建复杂、大规模语言模型应用的开源框架，它结合了多模型调用、上下文管理和外部工具集成等核心能力，在大模型生态中扮演着连接基础语言模型与实际应用需求的重要桥梁角色。' additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 397, 'prompt_tokens': 29, 'total_tokens': 426, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_

In [6]:

from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser,JsonOutputParser

# 创建提示模板
prompt = ChatPromptTemplate.from_messages([
("system", "你是世界级的技术文档编写者。"),
("user", "{input}")
])
# 使用输出解析器
# output_parser = StrOutputParser()
output_parser = JsonOutputParser()
# 将其添加到上一个链中
# chain = prompt | llm
chain = prompt | llm | output_parser
# 调用它并提出同样的问题。答案是一个字符串，而不是ChatMessage
# chain.invoke({"input": "LangChain是什么?"})
chain.invoke({"input": "LangChain是什么? 用JSON格式回复，问题用question，回答用answer"})

{'question': 'LangChain是什么?',
 'answer': 'LangChain是一个用于构建基于语言模型的应用程序的框架。它提供了工具和组件，帮助开发者将大型语言模型（如GPT）与外部数据源、链式操作和自定义逻辑集成，从而构建复杂的、可扩展的自然语言处理应用。LangChain支持多种数据连接、记忆管理和代理机制，广泛应用于聊天机器人、问答系统、文本生成等领域。'}

In [7]:
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser,JsonOutputParser

# 创建提示模板
prompt = ChatPromptTemplate.from_messages([
("system", "你是世界级的技术文档编写者。输出格式要求：{format_instructions}"),
("user", "{input}")
])
# output_parser = StrOutputParser()
output_parser = JsonOutputParser()
# 将其添加到上一个链中
# chain = prompt | llm
chain = prompt | llm | output_parser
# 调用它并提出同样的问题。答案是一个字符串，而不是ChatMessage
# chain.invoke({"input": "LangChain是什么?"})
chain.invoke({"input": "LangChain是什么?","format_instructions":output_parser.get_format_instructions()})
# 使用输出解析器

{'name': 'LangChain',
 'description': 'LangChain是一个用于构建基于语言模型的应用程序的框架。它提供了工具和组件，帮助开发者更方便地将大型语言模型（如GPT-4）集成到各种应用中，支持对话管理、信息检索、链式调用等功能。',
 'key_features': ['简化与大型语言模型的交互',
  '支持链式调用（链式任务执行）',
  '集成多种数据源和工具',
  '支持上下文管理和记忆功能',
  '方便构建复杂的自然语言处理应用'],
 'use_cases': ['智能问答系统', '自动化文档生成', '对话机器人', '数据分析与报告生成', '辅助编程和代码生成'],
 'official_website': 'https://python.langchain.com/'}

In [3]:
# 导入和使用 WebBaseLoader
from langchain_community.document_loaders import WebBaseLoader
import bs4


# 设置超时时间
loader = WebBaseLoader(
    web_path="https://yiqiml.xyz/topic/7",
    # 可以添加请求头和超时设置
    header_template={
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36'
    }
)
# 设置超时时间（秒）
loader.requests_kwargs = {'timeout': 10}
docs = loader.load()
print(f"加载的文档数量: {len(docs)}")
if docs:
    print(f"第一个文档的内容长度: {len(docs[0].page_content)}")


# 对于嵌入模型，这里通过 API调用RAG(检索增强生成)
from langchain_openai import OpenAIEmbeddings
# embeddings = OpenAIEmbeddings(model="text-embedding-ada-002")

embeddings = OpenAIEmbeddings(
    model="text-embedding-3-small",
    api_key="sk-aoW73w2p4eqRWaYaBb4aD05dDa8f497c87E182A7De4fC86e",
    base_url="https://api.apiyi.com/v1"  # 确保有 /v1
)
from langchain_community.vectorstores import FAISS
from langchain_text_splitters import RecursiveCharacterTextSplitter

# 使用分割器分割文档
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
documents = text_splitter.split_documents(docs)
print(f"分割后的文档数量: {len(documents)}")

# 只有在有文档时才创建向量存储
if documents:
    vector = FAISS.from_documents(documents, embeddings)
    print("向量存储创建成功!")
else:
    print("错误: 没有文档可以创建向量存储")

from langchain_core.prompts import PromptTemplate
from langchain_openai import ChatOpenAI
retriever = vector.as_retriever()
retriever.search_kwargs = {"k": 3}
docs = retriever.invoke("故事讲了什么内容")
# for i,doc in enumerate(docs):
# print(f"⭐第{i+1}条规定：")
# print(doc)
# 6.定义提示词模版
prompt_template = """
你是一个问答机器人。
你的任务是根据下述给定的已知信息回答用户问题。
确保你的回复完全依据下述已知信息。不要编造答案。
如果下述已知信息不足以回答用户的问题，请直接回复"我无法回答您的问题"。
已知信息:
{info}
用户问：
{question}
请用中文回答用户问题。
"""
# 7.得到提示词模版对象
template = PromptTemplate.from_template(prompt_template)
# 8.得到提示词对象
prompt = template.format(info=docs, question='故事主角是谁？')
## 9. 调用LLM
llm = ChatOpenAI(
    model="gpt-4o-mini",
    api_key="sk-aoW73w2p4eqRWaYaBb4aD05dDa8f497c87E182A7De4fC86e",
    base_url="https://api.apiyi.com/v1",
    timeout=60
)

response = llm.invoke(prompt)
print(response.content)


加载的文档数量: 1
第一个文档的内容长度: 2901
分割后的文档数量: 7
向量存储创建成功!
故事的主角是老婆和她的宝宝。


In [7]:
# 8.得到提示词对象
prompt = template.format(info=docs, question='故事内容')
response = llm.invoke(prompt)
print(response.content)

故事内容描述了一位母亲在喂奶的同时，和宝宝之间发生的一些有趣和亲密的互动。故事中的母亲非常关注她的宝宝，几乎将全部心思都放在宝宝身上，几乎没有夫妻生活。但在宝宝熟睡后，她仍然温柔地照顾丈夫，给他按摩以表示关心。这个故事展示了母亲对孩子的爱和对家庭的投入。


In [1]:
from langchain_core.documents import Document

docs = [
    Document(page_content="中华人民共和国民法典是新中国第一部以法典命名的法律。"),
    Document(page_content="民法典于2021年1月1日起施行。"),
]
from langchain_openai import OpenAIEmbeddings

embeddings = OpenAIEmbeddings(
    model="text-embedding-3-small",
    api_key="sk-aoW73w2p4eqRWaYaBb4aD05dDa8f497c87E182A7De4fC86e",
    base_url="https://api.apiyi.com/v1"  # 确保有 /v1
)
from langchain_community.vectorstores import FAISS

vectorstore = FAISS.from_documents(docs, embeddings)
retriever = vectorstore.as_retriever(search_kwargs={"k": 3})
from langchain_core.tools.retriever import create_retriever_tool

retriever_tool = create_retriever_tool(
    retriever,
    "CivilCodeRetriever",
    "搜索有关中华人民共和国民法典的信息。关于中华人民共和国民法典的任何问题，您必须使用此工具!",
)

tools = [retriever_tool]

ImportError: cannot import name 'create_openai_tools_agent' from 'langchain.agents' (C:\Users\ralph\.conda\envs\LangChan-Tutorial\Lib\site-packages\langchain\agents\__init__.py)

In [1]:
import langchainhub
from langchain.agents import create_openai_tools_agent, AgentExecutor
from langchain_openai import ChatOpenAI
from langchain_core.tools import Tool
import os

# 跳过代理
os.environ['NO_PROXY'] = '*'
os.environ['HTTP_PROXY'] = ''
os.environ['HTTPS_PROXY'] = ''

# 从 hub 拉取 prompt (如果网络有问题可能会失败)
try:
    prompt = langchainhub.pull("hwchase17/openai-tools-agent")
except:
    # 如果拉取失败，手动创建 prompt
    from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
    prompt = ChatPromptTemplate.from_messages([
        ("system", "你是一个有帮助的助手，可以使用工具来回答问题。"),
        ("human", "{input}"),
        MessagesPlaceholder(variable_name="agent_scratchpad"),
    ])

# 创建 LLM
llm = ChatOpenAI(
    model="gpt-4o-mini",
    api_key="sk-aoW73w2p4eqRWaYaBb4aD05dDa8f497c87E182A7De4fC86e",
    base_url="https://api.apiyi.com/v1",
    timeout=60
)

# 创建工具（假设 retriever 已定义）
def search_civil_code(query: str) -> str:
    """搜索民法典内容"""
    docs = retriever.invoke(query)
    return "\n\n".join([doc.page_content for doc in docs])

retriever_tool = Tool(
    name="CivilCodeRetriever",
    description="搜索有关中华人民共和国民法典的信息",
    func=search_civil_code
)

tools = [retriever_tool]

# 创建 agent（使用新版本的函数名）
agent = create_openai_tools_agent(llm, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)

# 提问
result = agent_executor.invoke({"input": "民法典中关于婚姻的规定是什么？"})
print(f"\n回答: {result['output']}")


ImportError: cannot import name 'create_openai_tools_agent' from 'langchain.agents' (C:\Users\ralph\.conda\envs\LangChan-Tutorial\Lib\site-packages\langchain\agents\__init__.py)

In [7]:
import langchain
print(langchain.__version__)

1.2.0
