# 1、获取大模型

In [None]:
import dotenv
from langchain_google_genai import ChatGoogleGenerativeAI  # chatgpt为openai
import os

# 加载.env文件中的环境变量
dotenv.load_dotenv()

# 配置Gemini的API密钥（需要在.env文件中配置GEMINI_API_KEY）
os.environ['GOOGLE_API_KEY'] = os.getenv("GEMINI_API_KEY")

# 创建Gemini大模型实例（常用模型：gemini-1.5-flash / gemini-1.5-pro）
llm = ChatGoogleGenerativeAI(
    model="gemini-3-flash-preview", 
    temperature=0.7,  # 可选：控制回答的随机性，0-1之间
    verbose=True      # 可选：打印详细日志
)

# 调用模型并获取回答
response = llm.invoke("什么是大模型?")

# 打印结果（response.content 可以直接获取纯文本回答）
print("模型回答：")
print(response.content)

Both GOOGLE_API_KEY and GEMINI_API_KEY are set. Using GOOGLE_API_KEY.


模型回答：
[{'type': 'text', 'text': '“大模型”（Large Models），全称是**大规模预训练模型**。在人工智能领域，它通常指代那些拥有巨大参数量、在海量数据上训练出来的深度学习模型。\n\n为了让你更直观地理解，我们可以从以下几个维度来拆解：\n\n### 1. “大”在哪里？\n大模型的“大”主要体现在三个方面：\n*   **参数规模大：** 参数就像是模型大脑中的“神经元连接点”。普通的小模型可能只有几万或几百万个参数，而现在的大模型（如 GPT-4）参数量通常达到**千亿甚至万亿**级别。\n*   **训练数据大：** 它们学习了几乎整个人类互联网上的文本（书籍、代码、论文、新闻、对话等）。它读过的书比任何人类一生能读完的都要多。\n*   **计算量大：** 训练这样一个模型需要数千颗高性能显卡（如 NVIDIA H100）连续运行数月，耗资动辄数千万甚至上亿美元。\n\n### 2. 它为什么这么厉害？（核心原理）\n目前主流的大模型大多基于 **Transformer** 架构。它的核心逻辑其实很简单：**预测下一个词（Next Token Prediction）**。\n\n当你给它一段话时，它会根据之前学过的海量知识，概率性地推断出后面紧跟着哪个字或词最合理。因为它的参数和数据量足够大，这种“预测”展现出了惊人的理解、逻辑推理和创作能力。\n\n### 3. 大模型能干什么？\n大模型不再像以前的 AI 只能完成单一任务（比如只会翻译或只会识脸），它是**通用型 AI**：\n*   **文字创作：** 写诗、写代码、写周报、写小说。\n*   **逻辑推理：** 做数学题、分析复杂的法律合同、制定旅行计划。\n*   **多模态交互：** 不仅仅是文字，现在的大模型还能看懂图片（如 GPT-4V）、生成图片（如 Midjourney）、甚至生成视频（如 Sora）。\n*   **知识问答：** 作为一个百科全书式的助手，回答你关于科学、历史、生活等各方面的问题。\n\n### 4. 为什么现在才火？（“能力涌现”）\n这是大模型最神奇的地方。科学家发现，当模型的规模突破一个临界点（比如 100 亿参数）时，它会突然学会一些在小规模时完全不会的技能，这种现象叫作**“能力涌现”（Emergent Abili

# 2、使用提示词模版

In [10]:
from langchain_core.prompts import ChatPromptTemplate

# 需要注意的一点事，这里需要指明具体的role, 在这里是system和用户
prompt = ChatPromptTemplate.from_messages([
    ("system", "你是一个世界级的技术文档编写者."),
    ("user", "{input}")
])


# 我们可以把prompt和具体的llm调用合在一起
chain = prompt | llm
message = chain.invoke({"input": "What is 2+2?"})
print(message)

content=[{'type': 'text', 'text': 'In basic arithmetic, the sum of 2 and 2 is **4**.', 'extras': {'signature': 'Es0ICsoIAXLI2nx+BPkUK8boaFOnNgUXSSjGkKAhIvF9zHpKGMetbEESF5Mdh26ukKvoIz5St2hO+DWVy7KEb4ZLTkmNzVVYoiyhWKi8jWJRoSp/jTNNQXwTH497/0qQ6kxEmJNrYGvJEC4k18strhqQfLB6g772MotbZ7u01CwMIcJLXhz9RBpnGs4JInMvM/esteyHW0Gqudcyk/CJgiBVWSUz9pkW146W9JtKlslhnBUr0zyVFD8AYSo9pSb/42IJwPFkaTZVpwHk2ao/Wfd1QyDbdEZf4p861dBf20URVA88oGde4CnHDF76LhfLk70kxHvTafBcXWzM0+e6sWaSR8q713KUB4jKVJ46K2RZOHfVzpa34EkZFXX62qTBRNaXi+5uW5t7+L6JE+4bjFAxVpJBcXwUqny3OmtMSdvGhpNUlzx9JdaNMNRBvqdr2zeFLmjhFKqeZf3y0iBKp0FMBuGWpbBJ7x0kIUBsCvlnCMimfFBMQ3PRIc8cltbZM6AoKWWQ9EuUYswBvWof/B8L9GALBIluiFNY/qxcQbdEpfab8T4bX9ALN5bdNpcX76QwxKcmpT5w9bodFPJXGZ+s2JiMnxSHnzGNPts2vYkfwR8lKMZx0/zVtDQMO/xgFCbdDARmESeE//wYlcf+qhYiKnWbF8O2whIwLq44lq1oA0P0roqiK6/CC24Rs38EOh9neBGGTHMHSyQftdHDybryaVPkn/QNF04+2mVACJk+I1rm8Ae85ZGaUF9czZIAuOPobGWGjdOLHhIdA9X9AccPg0oS5QtNU8OebUu6wQgYR4M3l6ExW9tAgcnzDk9HNuIvKm2Zz1/69Dj5oiho7Q0tgCdW1/e8MySIxPiQg+NCu6Id0DSWae0P

# 3、使用输出解析器

In [13]:
from langchain_google_genai import ChatGoogleGenerativeAI  # chatgpt为openai
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser,JsonOutputParser

#使用输出解析器
# output_parser = StrOutputParser()
output_parser = JsonOutputParser()

#将其添加到上一个链中
# chain = prompt | Ilm
chain = prompt | llm | output_parser

#调用它并提出同样的问题。答案是一个字符串,而不是ChatMessagee
#chain.invoke({"input": "LangChain是什么?"})
chain.invoke({"input":"LangChain是什么?用JSON格式回复,问题用用question,回答用answer, 带唯一的request_id"})

{'question': 'LangChain是什么?',
 'answer': 'LangChain 是一个开源的编排框架，旨在简化基于大语言模型（LLM）的应用程序开发。它通过提供标准化的接口、组件和工具（如链、代理、内存和索引），允许开发者将 LLM 与外部数据源、计算资源及 API 高效集成，从而构建功能复杂的 AI 应用，如聊天机器人、自动化工作流和知识库检索系统。',
 'request_id': 'lc-550e8400-e29b-41d4-a716-446655440000'}

# 4、使用向量存储

In [None]:
#导入和使用WebBaseLoader
from langchain_community.document_loaders import WebBaseLoader
import bs4
loader = WebBaseLoader(
    web_path= "https://www.gov.cn/zhengce/content/202601/content_7054049.htm",
    bs_kwargs=dict(parse_only=bs4.SoupStrainer(id= "UCAP-CONTENT"))
)
docs = loader.load()
# print(docs)

#对于嵌入模型,这里通过API调用
from langchain_google_genai import GoogleGenerativeAIEmbeddings
embeddings = GoogleGenerativeAIEmbeddings(
    model="gemini-embedding-001",  # Gemini官方嵌入模型
    task_type="retrieval_document"  # 可选：指定嵌入用途，默认是retrieval_document
)

from langchain_community.vectorstores import FAISS
from langchain_text_splitters import RecursiveCharacterTextSplitter


#使用分割器分割文档
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500,chunk_overlap=50)
documents = text_splitter.split_documents(docs)
print("============="+str(len(documents)))

#向量存储embeddings会将documents中的每个文本片段转换为向量,并将这些向量存储在FAISS（默认存储内存）
vector = FAISS.from_documents(documents, embeddings)

Both GOOGLE_API_KEY and GEMINI_API_KEY are set. Using GOOGLE_API_KEY.




# 5、RAG(检索增强生成)

In [None]:
from langchain_core.prompts import PromptTemplate

retriever = vector.as_retriever()
retriever.search_kwargs={"k":3}
docs=retriever.invoke("设立商事调解组织的条件是什么?")
# for i,doc in enumerate(docs):
#     print(f"第{i+1}条规定:")
#     print(doc)


#6.定义提示词模版
prompt_template = """
你是一个问答机器人。
你的任务是根据下述给定的已知信息回答用户问题。
确保你的回复完全依据下述已知信息。不要编造答案。
如果下述已知信息不足以回答用户的问题,请直接回复"我无去回答您的问题"。
已知信息:
{info}

用户问：
{question}

请用中文回答用户问题
"""


#7.得到提示词模版对象
template = PromptTemplate.from_template(prompt_template)

#8.得到提示词对象
prompt=template.format(info=docs,question='设立商事调解组织的条件是什么?')

##9.调用LLM
response = llm.invoke(prompt)
print(response.content)



第1条规定:
page_content='政部门的指导、监督。第六条　国家培育有国际影响力的商事调解组织，提升商事调解组织的国际竞争力。司法行政部门会同有关部门加强对商事调解的宣传，推广运用调解方式解决商事争议。鼓励有条件的地区和部门结合本地区、本领域实际情况，在人才、信息、技术、资金等方面对商事调解行业发展给予支持。第七条　国家完善商事调解与诉讼、仲裁、公证等制度的衔接机制，畅通商事争议解决途径。第八条　设立商事调解组织，应当符合下列条件：（一）发起人为非营利法人；（二）有规范的名称，名称中含有“商事调解”字样；（三）有自己的住所和章程；（四）有30万元以上的资产；（五）有5名以上商事调解员和适当数量的专职工作人员。第九条　设立商事调解组织，应当向所在地设区的市级人民政府司法行政部门提出申请，提交设立申请书及相关材料。申请人应当对申请材料的真实性负责。受理申请的部门应当自受理之日起20个工作日内予以审查，并将初步审查意见和全部申请材料报送省、自治区、直辖市人民政府司法行政部门。省、自治区、直辖市人民政府司法行政部门应当自收到报送材料之日起20个工作日内予以审查，作出是否准予设立的决定。20个工作日内不能作出决定的，经本部门负' metadata={'source': 'https://www.gov.cn/zhengce/content/202601/content_7054049.htm'}
第2条规定:
page_content='送材料之日起20个工作日内予以审查，作出是否准予设立的决定。20个工作日内不能作出决定的，经本部门负责人批准，可以延长10个工作日，并应当将延长期限的理由告知申请人。准予设立的，向申请人颁发执业证书；不准予设立的，向申请人书面说明理由。第十条　商事调解组织变更名称、住所、章程等事项的，应当依法办理执业证书的变更手续。商事调解组织有下列情形之一的，应当依法办理执业证书的注销手续：（一）不能保持本条例规定的设立条件，经限期整改仍不符合条件；（二）终止商事调解业务活动；（三）法律、行政法规规定应当注销的其他情形。第十一条　省、自治区、直辖市人民政府司法行政部门应当编制本行政区域内的商事调解组织名册，并向社会公布。第十二条　商事调解组织聘任的商事调解员应当公道正派，具备良好的专业素质。商事调解员应当符合下列条件之一：（一）通过国家统一法律职

# 6、使用Agent

In [40]:
"""
快速参考：LangChain 1.2.6 Agent 代码
直接复制到你的 Jupyter Notebook Cell 中
"""

# ============================================================
# 方案：使用 langchain_classic（推荐）
# ============================================================

from langchain.tools.retriever import create_retriever_tool
from langchain_classic.agents import create_react_agent, AgentExecutor
from langchain_core.prompts import PromptTemplate

# 1. 创建检索器工具
retriever_tool = create_retriever_tool(
    retriever,
    "CivilCodeRetriever",
    "搜索有关中华人民共和国商事调解条例的信息。关于中华人民共和国商事调解条例的任何问题,您必须使用此工具!"
)

tools = [retriever_tool]

# 2. 定义 ReAct 提示词模板
react_prompt_template = """回答以下问题，尽你所能。你可以使用以下工具:

{tools}

使用以下格式:

Question: 你需要回答的输入问题
Thought: 你应该总是思考该做什么
Action: 要采取的行动，应该是 [{tool_names}] 中的一个
Action Input: 行动的输入
Observation: 行动的结果
... (这个 Thought/Action/Action Input/Observation 可以重复 N 次)
Thought: 我现在知道最终答案了
Final Answer: 对原始输入问题的最终答案

开始!

Question: {input}
Thought: {agent_scratchpad}"""

prompt = PromptTemplate.from_template(react_prompt_template)

# 3. 创建 Agent
agent = create_react_agent(llm=llm, tools=tools, prompt=prompt)

# 4. 创建 Agent Executor
agent_executor = AgentExecutor(
    agent=agent,
    tools=tools,
    verbose=True,
    handle_parsing_errors=True,
    max_iterations=5
)

# 5. 运行代理
result = agent_executor.invoke({"input": "设立商事调解组织的条件是什么"})
print(result['output'])




[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mAction: CivilCodeRetriever
Action Input: 设立商事调解组织的条件[0m[36;1m[1;3m政部门的指导、监督。第六条　国家培育有国际影响力的商事调解组织，提升商事调解组织的国际竞争力。司法行政部门会同有关部门加强对商事调解的宣传，推广运用调解方式解决商事争议。鼓励有条件的地区和部门结合本地区、本领域实际情况，在人才、信息、技术、资金等方面对商事调解行业发展给予支持。第七条　国家完善商事调解与诉讼、仲裁、公证等制度的衔接机制，畅通商事争议解决途径。第八条　设立商事调解组织，应当符合下列条件：（一）发起人为非营利法人；（二）有规范的名称，名称中含有“商事调解”字样；（三）有自己的住所和章程；（四）有30万元以上的资产；（五）有5名以上商事调解员和适当数量的专职工作人员。第九条　设立商事调解组织，应当向所在地设区的市级人民政府司法行政部门提出申请，提交设立申请书及相关材料。申请人应当对申请材料的真实性负责。受理申请的部门应当自受理之日起20个工作日内予以审查，并将初步审查意见和全部申请材料报送省、自治区、直辖市人民政府司法行政部门。省、自治区、直辖市人民政府司法行政部门应当自收到报送材料之日起20个工作日内予以审查，作出是否准予设立的决定。20个工作日内不能作出决定的，经本部门负

送材料之日起20个工作日内予以审查，作出是否准予设立的决定。20个工作日内不能作出决定的，经本部门负责人批准，可以延长10个工作日，并应当将延长期限的理由告知申请人。准予设立的，向申请人颁发执业证书；不准予设立的，向申请人书面说明理由。第十条　商事调解组织变更名称、住所、章程等事项的，应当依法办理执业证书的变更手续。商事调解组织有下列情形之一的，应当依法办理执业证书的注销手续：（一）不能保持本条例规定的设立条件，经限期整改仍不符合条件；（二）终止商事调解业务活动；（三）法律、行政法规规定应当注销的其他情形。第十一条　省、自治区、直辖市人民政府司法行政部门应当编制本行政区域内的商事调解组织名册，并向社会公布。第十二条　商事调解组织聘任的商事调解员应当公道正派，具备良好的专业素质。商事调解员应当符合下列条件之一：（一）通过国家统一