# 智能体相关源码结构

**Agent**
- AgentType
    - ZERO_SHOT_REACT_DESCRIPTION（**ReAct**的一般实现）
    - REACT_DOCSTORE（ReAct，支持RAG）
    - SELF_ASK_WITH_SEARCH（使用**search 工具**不断反思获得答案）
    - CONVERSATIONAL_REACT_DESCRIPTION（**ReAct**，支持对话）
    - CHAT_ZERO_SHOT_REACT_DESCRIPTION（同上）
    - CHAT_CONVERSATIONAL_REACT_DESCRIPTION（同上）
    - STRUCTURED_CHAT_ZERO_SHOT_REACT_DESCRIPTION（**ReAct**，为对话模型优化，支持多输入）
    - OPENAI_FUNCTIONS（支持**OpenAI Function Calling**）
    - OPENAI_MULTI_FUNCTIONS（支持**OpenAI Function Calling**，支持多函数调度）

**主要结构**
- AgentAction
    - AgentActionMessageLog

- AgentStep
- AgentFinish

**智能体类结构**
- BaseSingleActionAgent
    - RunnableAgent
    - LLMSingleActionAgent（__遗留__，__修改为__：create_***_agent）
    - XMLAgent（__遗留__，__修改为__：create_xml_agent）
    - Agent
        - ChatAgent（__遗留__，__修改为__：create_react_agent）
        - ConversationalAgent（__遗留__，__修改为__：create_react_agent）
        - ConversationalChatAgent（__遗留__，__修改为__：create_json_chat_agent）
        - StructuredChatAgent（__遗留__，__修改为__：create_structured_chat_agent）
        - ZeroShotAgent（__遗留__，__修改为__：create_react_agent）
        - ReActDocstoreAgent（__遗留__）
            - ReActTextWorldAgent（__遗留__）
        - SelfAskWithSearchAgent（__遗留__，__修改为__：create_self_ask_with_search）
    - OpenAIFunctionsAgent（__遗留__，__修改为__：create_openai_functions_agent）

- BaseMultiActionAgent
    - RunnableMultiActionAgent
    - OpenAIMultiFunctionsAgent（__遗留__，__修改为__：create_openai_tools_agent）

- Runnable
    - RunnableSerializable
        - Chain
            - AgentExecutor（__NEW__）
                - MRKLChain（__遗留__）
                - ReActChain（__遗留__）
                - SelfAskWithSearchChain（__遗留__）
        - OpenAIAssistantRunnable

- DocstoreExplorer（__遗留__）

**Prompt**
- Runnable
    - RunnableSerializable
        - BasePromptTemplate `[Dict, PromptValue]`
            - BaseChatPromptTemplate
                - ChatPromptTemplate
                    - AgentScratchPadChatPromptTemplate

**OutputParser**
- Runnable
    - RunnableSerializable
        - BaseOutputParser
            - AgentOutputParser
            - MultiActionAgentOutputParser

# Function Calling 和 智能体的关系

在概念上，OpenAI tools 和 OpenAI function calling 并不属于 Agent 范畴。

Agent通常指的是可以自主做出决策和采取行动的系统。而 function calling 更像是一种技术手段,用于触发外部函数的执行。
<br>
但是, 在大部分 Agent 实现中, function calling 机制被用来实现 Agent 的行为，用来触发外部工具和服务。
所以它是往往启用 Agent 行为的一个组成部分。
总的来说,function calling本身只是一种技术功能。

而 OpenAI tools 是 OpenAI function calling 的替代机制，其主要区别在于:

- tools 支持同时调用多个函数, 而 function calling 只能调用单个函数。
- tools 允许函数之间交互和组合使用, function calling 中的函数是相互独立的。
- tools 提供了更多控制流程的选项, 如条件语句、循环等。
- tools 是 OpenAI 最新推出的函数调用机制, 而 function calling 是早期的格式,现在被视为legacy。


使用智能体框架比直接使用 tools 或 function calling 有以下几个主要优势:

- 封装性更好,使用更简单。智能体框架提供了现成的接口和抽象,开发者不需要处理底层的 tools 或 function calling细节。
- 支持更复杂的逻辑。智能体框架内置了决策、推理、计划等更高级的能力,不仅是简单的函数触发。
- 可解释性和可靠性更好。智能体的行为过程可以通过日志展示,输出更可解释。并且可以配置规则避免无意义的循环。
- 支持工具和服务的统一集成。工具可以用标准化方式集成到智能体框架中,而不需要不同的接入方式。
- 可扩展性更好,自定义能力更强。智能体框架提供了扩展接口,可以插入自定义的组件。

总体上,相比直接的 tools 或 function calling,智能体框架提供了更高层次的封装与抽象,使用更简单,功能也更全面和强大。
<br>这是使用智能体框架的主要优势所在。

# Tool源码结构

**Tool**
- Runnable
    - RunnableSerializable
        - BaseTool `[Union[str, Dict], Any]`
            - Tool
            - ExceptionTool
        
            **输入:**
            - StructuredTool
            - HumanInputRun
        
            **git:**
            - GitHubAction
            - GitLabAction
        
            **json:**
            - JsonListKeysTool
            - JsonGetValueTool
        
            **记忆:**
            - Memorize
        
            **天气查询:**
            - OpenWeatherMapQueryRun
        
            **sleep函数:**
            - SleepTool
        
            **shell:**
            - ShellTool
        
            **sql:**
            - QuerySQLDataBaseTool
            - InfoSQLDatabaseTool
            - QuerySQLCheckerTool
        
            **搜索引擎:**
            - TavilySearchResults
            - TavilyAnswer
        
            **QA向量检索:**
            - VectorStoreQATool
            - VectorStoreQAWithSourcesTool
        
            **wiki:**
            - WikipediaQueryRun
        
            **文件:**
            - CopyFileTool
            - DeleteFileTool
            - FileSearchTool
            - ListDirectoryTool
            - MoveFileTool
            - ReadFileTool
            - WriteFileTool


# 智能体和工具箱

## pbi智能体
- create_pbi_agent
- create_pbi_chat_agent

## sql生成智能体
- create_spark_sql_agent
- create_sql_agent

## 结构化输出智能体
- create_xml_agent
- create_json_agent
- create_json_chat_agent
- create_structured_chat_agent

## 向量检索智能体
- create_vectorstore_agent
- create_vectorstore_router_agent

## ReAct智能体
- create_react_agent

## 自搜索智能体
- create_self_ask_with_search_agent

## 遗留方法
- load_agent（__遗留__）
- load_agent_from_config（__遗留__）
- initialize_agent（__遗留__，__修改为__：create_***_agent）


# 文件管理

## FileManagementToolkit

```
from langchain.agent_toolkits import FileManagementToolkit
```

包含的Tool清单：

- CopyFileTool
- DeleteFileTool
- FileSearchTool
- MoveFileTool
- ReadFileTool
- WriteFileTool
- ListDirectoryTool

# JSON查询

## 创建Agent：create_json_agent

让智能体一边与JSON数据交互一边思考，将JSON查询结果作为答案返回。
```
from langchain.agents import create_json_agent
```

## JsonToolkit

```
from langchain_community.agent_toolkits import JsonToolkit
```

包含的Tool清单：

- JsonListKeysTool
- JsonGetValueTool

## 实践

In [428]:
import yaml
from langchain.agents import create_json_agent
from langchain_community.agent_toolkits import JsonToolkit
from langchain_community.tools.json.tool import JsonSpec
from langchain_openai import OpenAI

In [429]:
with open("data/openapi.yaml") as f:
    data = yaml.load(f, Loader=yaml.FullLoader)
json_spec = JsonSpec(dict_=data, max_value_length=4000)
json_toolkit = JsonToolkit(spec=json_spec)

json_agent_executor = create_json_agent(
    llm=OpenAI(temperature=0), toolkit=json_toolkit, verbose=True
)

In [443]:
json_agent_executor.invoke(
    "告诉我这个API的版本"
)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mAction: json_spec_list_keys
Action Input: data[0m
Observation: [36;1m[1;3m['openapi', 'info', 'servers', 'paths', 'components'][0m
Thought:[32;1m[1;3m I should look at the keys that exist in data["info"] to see what I have access to
Action: json_spec_list_keys
Action Input: data["info"][0m
Observation: [36;1m[1;3m['title', 'description', 'version'][0m
Thought:[32;1m[1;3m I should look at the value of data["info"]["version"] to see the API version
Action: json_spec_get_value
Action Input: data["info"]["version"][0m
Observation: [33;1m[1;3mv1[0m
Thought:[32;1m[1;3m I now know the final answer
Final Answer: v1[0m

[1m> Finished chain.[0m


{'input': '告诉我这个API的版本', 'output': 'v1'}

# OpenAI智能体

## 创建Agent方法

- create_openapi_agent
- create_openai_functions_agent
- create_openai_tools_agent

## 环境准备

In [412]:
from langchain_community.tools.tavily_search import TavilySearchResults
from langchain_openai import ChatOpenAI
from langchain import hub
from langchain.agents import AgentExecutor, create_openai_tools_agent, create_openai_functions_agent

In [413]:
tools = [TavilySearchResults(max_results=1)]
prompt = hub.pull("hwchase17/openai-tools-agent")
llm = ChatOpenAI(model="gpt-3.5-turbo-1106", temperature=0)

## 使用create_openai_functions_agent创建Agent

create_openai_functions_agent是openai早期实现的接口，仅支持一次函数调用：

In [415]:
functions_agent = create_openai_functions_agent(llm, tools, prompt)
functions_agent_executor = AgentExecutor(agent=functions_agent, tools=tools, verbose=True)
functions_agent_executor.invoke({
    "input": "Erick和Harrison都为langchain项目做了不少贡献，他们与langchain项目有什么关系吗?请用中文回答。"
})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `tavily_search_results_json` with `{'query': 'Erick和Harrison与langchain项目的关系'}`


[0m[36;1m[1;3m[{'url': 'https://zhuanlan.zhihu.com/p/645358531', 'content': '关于软件复杂性和复杂性下的流行性之争是永恒的话题。没有人愿意成为批评 LangChain 这样的免费开源软件的混蛋，但我愿意承担这个责任。明确地说，我并不反对 Harrison Chase 或 LangChain  简单来说，LangChain 是一个 Python 和 JavaScript 库，由 Harrison Chase 开发，用于连接 OpenAI 的 GPT API（后续已扩展到更多模型）以生成人工智能文本。  Chase 或 LangChain 的其他维护者（他们鼓励反馈）。  体现了「它很复杂，所以它一定更好」这一经常困扰后期代码库的哲学，可是 LangChain 甚至还不到一年。简单来说，LangChain 是一个 Python 和 JavaScript 库，由 Harrison Chase 开发，用于连接 OpenAI 的 GPT API（后续已扩展到更多模型）以生成人工智能文本。 更具体地说，它是论文《ReAct: Synergizing Reasoning and Acting in Language Models》的实现：该论文展示了一种提示技术，允许模型「推理」（通过思维链）和「行动」（通过能够使用预定义工具集中的工具，例如能够搜索互联网）。 论文链接： arxiv.org/pdf/2210.0362 事实证明，这种组合能够大幅提高输出文本的质量，并使大型语言模型具备正确解决问题的能力。'}][0m[32;1m[1;3mErick和Harrison与langchain项目的关系是，Harrison Chase是LangChain项目的开发者，LangChain是一个Python和JavaScript库，用于连接OpenAI的GPT API以生成人工智能文本。因此，Erick和

{'input': 'Erick和Harrison都为langchain项目做了不少贡献，他们与langchain项目有什么关系吗?请用中文回答。',
 'output': 'Erick和Harrison与langchain项目的关系是，Harrison Chase是LangChain项目的开发者，LangChain是一个Python和JavaScript库，用于连接OpenAI的GPT API以生成人工智能文本。因此，Erick和Harrison都与LangChain项目有密切的开发和贡献关系。'}

## 使用create_openai_tools_agent创建Agent

使用create_openai_functions_agent时，“Erick和Harrison都为...”会被拆解为两个问题：

In [416]:
tools_agent = create_openai_tools_agent(llm, tools, prompt)
tools_agent_executor = AgentExecutor(agent=tools_agent, tools=tools, verbose=True)
tools_agent_executor.invoke({
    "input": "Erick和Harrison都为langchain项目做了不少贡献，他们与langchain项目有什么关系吗?请用中文回答。"
})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `tavily_search_results_json` with `{'query': 'Erick langchain project'}`


[0m[36;1m[1;3m[{'url': 'https://www.linkedin.com/pulse/llm-framework-how-langchain-redefine-application-2024-singh-ph-d--ikgmc', 'content': 'New to LinkedIn? Join now LLM Framework: How LangChain will Redefine Application Development in 2024  Embrace the power of LangChain and be part of this AI revolution.  In this ever-increasing need for Artificial Intelligence in all business forms, LangChain emerges as a game-changer,  This blog explores the multifaceted applications of LangChain and its groundbreaking impact on industries worldwide.LangChain is indeed a robust framework that is redefining AI application development. It allows developers to build context-aware reasoning applications with its flexible abstractions and AI-first ...'}][0m[32;1m[1;3m
Invoking: `tavily_search_results_json` with `{'query': 'Harrison langchain project'}`

{'input': 'Erick和Harrison都为langchain项目做了不少贡献，他们与langchain项目有什么关系吗?请用中文回答。',
 'output': 'Erick和Harrison都与LangChain项目有关。Erick在LangChain项目中探讨了LangChain的应用和影响，而Harrison则解释了LangChain是一个用于构建上下文感知推理应用的开源框架。因此，他们都与LangChain项目有密切关系。'}

## 加入对话历史

In [417]:
from langchain_core.messages import AIMessage, HumanMessage
tools_agent_executor.invoke(
    {
        "input": "吴京的老婆主持过什么综艺节目?",
        "chat_history": [
            HumanMessage(content="吴京的老婆是谁？"),
            AIMessage(content="吴京的妻子是节目主持人谢楠。"),
        ],
    }
)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `tavily_search_results_json` with `{'query': '谢楠主持过的综艺节目'}`


[0m[36;1m[1;3m[{'url': 'https://ent.qianlong.com/2024/0207/8200732.shtml', 'content': '2024央视龙年春晚节目单 2024央视龙年春晚节目单 2月6日晚,2024央视龙年春晚北京主会场主持阵容正式官宣发布任鲁豫C位 2024央视龙年春晚湖南长沙分会场主持人发布:何炅、张舒越 2024央视龙年春晚新疆喀什分会场主持人马跃  附2024央视龙年春晚完整节目单 顾问:张艺谋、张一一 总导演:于蕾 主持人:任鲁豫、撒贝宁、尼格买提、龙洋、马凡舒(北京主会场) 张舒悦、何炅(湖南长沙分会场) 杨帆、刘心悦(辽宁沈阳分会场) 朱迅、徐杰(陕西西安分会场)  附2024央视龙年春晚完整节目单 顾问:张艺谋、张一一 总导演:于蕾 主持人:任鲁豫、撒贝宁、尼格买提、龙洋、马凡舒(北京主会场) 张舒悦、何炅(湖南长沙分会场) 杨帆、刘心悦(辽宁沈阳分会场) 朱迅、徐杰(陕西西安分会场)  综艺频道主持人杨帆与在2023中央广播电视总台主持人大赛中表现不俗获得银奖的辽宁卫视当家花旦刘心悦主持沈阳分会场,2018年和2020年已两次主持春晚分会场(贵州黔东南、河南郑州)的马跃和新疆卫视主持人维妮娜主持新疆喀什分会场,朱迅则与陕西2月6日,甲辰龙年2024中央广播电视总台春节联欢晚会进入最后3天的冲刺倒计时,随着龙年春晚四次带妆彩排的完成,通过现场观众、明星嘉宾、艺人助理 ...'}][0m[32;1m[1;3m根据搜索结果，谢楠曾主持过央视的春晚节目。您可以在以下链接中找到更多信息：[谢楠主持的综艺节目](https://ent.qianlong.com/2024/0207/8200732.shtml)[0m

[1m> Finished chain.[0m


{'input': '吴京的老婆主持过什么综艺节目?',
 'chat_history': [HumanMessage(content='吴京的老婆是谁？'),
  AIMessage(content='吴京的妻子是节目主持人谢楠。')],
 'output': '根据搜索结果，谢楠曾主持过央视的春晚节目。您可以在以下链接中找到更多信息：[谢楠主持的综艺节目](https://ent.qianlong.com/2024/0207/8200732.shtml)'}