# <center>LangChain AI Agents

# 一、AI Agents 基本概念

&emsp;&emsp;什么是 AI Agent（人工智能代理）？

&emsp;&emsp;一个很简单的例子：我们想要在 Canva 创建一个设计，但不知道如何操作。于是我们向 ChatGPT 求助，并解释我们想要做的事情。ChatGPT 将为我们提供以下步骤：
1. 如何注册 Canva
2. 如何创建空设计
3. 如何在设计中添加元素
4. 如何编辑这些元素等

&emsp;&emsp;当看到这些建议，所有这些步骤都需要你自己操作。ChatGPT 只能提供指导和建议，它无法直接在 Canva 上根据我们的描述直接生成设计。

&emsp;&emsp;但是如果 ChatGPT 有权访问 Canva 插件，那么当我们 向 ChatGPT 提出需求的时候，它就会在 Canva 中实际给我们构造出实际的设计。所以，从技术上讲：**带有任何插件的 GPT-4 都是一个 AI 代理。** 它们有什么区别呢？带插件的 GPT-4 有 2 个标准 ChatGPT 所缺少的东西：
- 工具包（toolkit）
- 决定何时使用以及使用哪种工具的能力

&emsp;&emsp;因此，在具备AI代理角色的基础上，我们就不需要问 ChatGPT“如何做 xxx”，而是告诉 ChatGPT“使用我给您的工具，做 xxx”。GPT-4 作为人工智能代理，将“为你做这件事”。

&emsp;&emsp;在上述两个前置条件下，我们能够很容易想到，工具包（Toolkit）无非就是准备各种的API、外部函数等，相对容易理解。难以想到的是：如何让大模型具备自己去思考该何时调用工具，如何调用工具等能力。这就需要了解 ReAct.

&emsp;&emsp;ReAct 代表“推理与行动”。这是一种提示，其中大语言模型在包含 3 个步骤的循环中工作：
- Thought(思想)：决定做什么。
- Action（行动）：实际执行某项任务
- Observation（观察）：分析第 2 步行动的结果

&emsp;&emsp;那有什么办法能够进入到这种思考模式呢？最简单的一类办法就是借助思维链（也被称为思考链，Chain of Thought，CoT）提示法来解决这个问题。在提示词尾部追加一句“Let’s think step by step”，即可大幅提高模型推理能力。

> Zero-shot-CoT参考文献：[《Large Language Models are Zero-Shot Reasoners》](https://arxiv.org/pdf/2205.11916v2.pdf)

<div align=center><img src="https://snowball101.oss-cn-beijing.aliyuncs.com/img/202402041542200.png" width=100%></div>

&emsp;&emsp;这是在大模型发展初期相关的一些研究，当时对于OpenAI的`text-davinci-003`这个Completions模型做了非常多的测试，发现通过这样一种方法，能让它解决Zero-Shot的复杂逻辑问题，而目前随着大模型基于这些研究在训练时针对性的策略，即使不加`Let’s think step by step`，模型也会具备一定的CoT能力。

> ReAct: Synergizing Reasoning and Acting in Language Models论文地址：https://arxiv.org/pdf/2210.03629.pdf 

&emsp;&emsp;但是我们要明确的是：CoT只是进入到思考过程，不论分析出任何需要执行的操作，它都不会实际的去进行执行。但ReAct，将结合推理+行动两步行为模式。如下图展示的是一个关于苹果遥控器的问答逻辑处理过程。这个过程分为四个不同的尝试回答同一个问题，每个尝试都有它自己的思考和行动方式，以及最终的结果。

> Apple Remote 是苹果公司为运行iOS和tvOS设备开发的红外线遥控器

&emsp;&emsp;Question = '除了Apple Remote，还有什么设备或者方法可以控制最初是为苹果遥控器设计的程序？'
- 1a：直接给出错误答案：iPod
- 1b：仅限推理，让我们一步步来思考。苹果遥控器最初是为了与苹果电视交互而设计的。苹果电视可以被iPhone, iPad, 和iPod Touch控制。所以答案是iPhone, iPad, 和iPod Touch。
- 1c：只行动，搜索[苹果遥控器] --> 搜索[Front Row]）--> 搜索[Front Row (软件)] --> 结束[是的]，最终什么答案都没有提供
- 1d：推理+行动
    - 思考1：我需要搜索苹果遥控器，并找到它最初设计用来交互的程序。
    - 思考2：苹果遥控器最初是为了控制Front Row媒体中心程序而设计的。我现在需要继续搜索，找出什么其他设备可以控制它。
    - 思考3：没有找到Front Row。我需要搜索Front Row（软件）。
    - 思考4：Front Row（软件）是由苹果遥控器或键盘功能键控制的。所以答案是键盘功能键。
    - 答案：键盘功能键

<div align=center><img src="https://snowball101.oss-cn-beijing.aliyuncs.com/img/202402021105277.png" width=100%></div>

&emsp;&emsp;简单理解为：让模型使用CoT的思路一点点推理，推理的过程中如果需要外部知识的介入，那么模型就会先调用外部工具来获取外部知识，然后将外部知识补充进上下文中继续推理，如此往复，直到推理出最终的结果。

&emsp;&emsp;了解了其基本原理后，我们接下来可以借助LangChain来快速构建AI Agents。

# 二、LangChain实现AI Agents

&emsp;&emsp;在LangChain的抽象概念下，对于一个chain，一系列操作都是硬编码（在代码中）的。但是，在 Agents 中，操作不是硬编码的，整个过程是让大语言模型决定采取哪些行动以及采取什么顺序。

> langChain Docs ：https://python.langchain.com/v0.1/docs/modules/agents/

<div align=center><img src="https://muyu001.oss-cn-beijing.aliyuncs.com/img/image-20240709095917175.png" width=100%></div>

- **Tools**

&emsp;&emsp;AI Agents 的工作流需要预先提供一系列工具，然后才可以根据工具的描述和当前要执行的任务自由决定使用哪个工具。langchain_community.tools 包中有大量可以提供给 AI 代理的工具，如下：


<div align=center><img src="https://muyu001.oss-cn-beijing.aliyuncs.com/img/image-20240709100617591.png" width=100%></div>

> LangChain Docs:https://python.langchain.com/v0.1/docs/integrations/tools/

&emsp;&emsp;我们来详细的看一下LangChain 实现 AI Agents 的细节。

## 2.1 使用Langchain 集成的 Tools

&emsp;&emsp;LangChain中加载工具的模式如下：

```python
from langchain.agents import load_tools

tool_names = tool_1ur',tool_2st',tool_3of', 'to_4ls']
tools = load_tools(tool_names)
```

&emsp;&emsp;对于LangChain中已经集成的工具，可以直接进入指定的页面进行加载，比如：

In [1]:
# ! pip install --upgrade arxiv wikipedia duckduckgo-search numexpr

In [1]:
from langchain.agents import load_tools

tool_names = ['arxiv', 'wikipedia']

&emsp;&emsp;初始化工具库

In [2]:
tools = load_tools(tool_names)

tools

[ArxivQueryRun(),
 WikipediaQueryRun(api_wrapper=WikipediaAPIWrapper(wiki_client=<module 'wikipedia' from 'C:\\Users\\snowb\\anaconda3\\Lib\\site-packages\\wikipedia\\__init__.py'>, top_k_results=3, lang='en', load_all_available_meta=False, doc_content_chars_max=4000))]

## 2.2 构建自定义Tools

&emsp;&emsp;LangChain中的自定义工具由用户定义，用于执行LangChain工具包中原生工具未提供的特定任务或操作。允许用户扩展 LangChain 的功能并根据自己的特定需求进行定制。其中，构建自定义Tools在生产系统中更为常见，定义工具可以解决本机工具未涵盖的特定用例或要求，比如执行复杂计算、与外部 API 交互、独特地操作数据或与其他系统集成的工具。更加灵活和更贴合实际业务。

&emsp;&emsp;要在LangChain中定义自定义工具，可以使用 **Tool.from_function()** 方法或**子类化 BaseTool 类** 两种方式。其中：
- Tool.from_function() 方法可以通过简单的函数快速创建工具。
- 对 BaseTool 类进行子类化可以更好地控制工具的行为并定义自定义实例变量或传播回调。定义后，可以使用 initialize_agent() 方法将自定义工具添加到LangChain代理中。

&emsp;&emsp;不论通过哪种方式构建Tools，当有了工具库后，Agents 就可以执行链中的自定义工具和本机工具来执行复杂的工作流程或任务。工具由几个组件组成：
- name (str)，在提供给Agents的一组工具中必须是唯一的
- description (str)，可选但推荐，因为代理使用它来确定工具的使用
- return_direct （布尔值），默认为 False
- args_schema (Pydantic BaseModel)，是可选的，但推荐使用，可用于提供更多信息（例如，少数样本示例）或预期参数的验证。

&emsp;&emsp;在创建工具之前，先设置环境：

In [1]:
from langchain import LLMMathChain
from langchain.agents import AgentType, initialize_agent
from langchain_community.chat_models import ChatZhipuAI
from langchain.tools import BaseTool, StructuredTool, Tool, tool, DuckDuckGoSearchRun

from pydantic import BaseModel, Field

llm = ChatZhipuAI(model='glm-4')

&emsp;&emsp;一个最简单的工具基本上就是字符串输入、字符串输出。传入一个查询（文本字符串），然后得到一个结果（文本字符串）。

- **Tool.from_function()**

In [2]:
search = DuckDuckGoSearchRun()  # https://python.langchain.com/v0.1/docs/integrations/tools/ddg/

search_tool = Tool.from_function(
    func=search.run,
    name="Search",
    description="useful for when you need to search the internet for information"
)

llm_math_chain = LLMMathChain.from_llm(llm=llm, verbose=True)   # https://python.langchain.com/v0.1/docs/modules/chains/
 
math_tool = Tool.from_function(
    func=llm_math_chain.run,
    name="Calculator",
    description="Useful for when you are asked to perform math calculations"
)

&emsp;&emsp;将所有工具添加到工具列表中。

In [3]:
tools = [search_tool, math_tool]

In [4]:
tools

[Tool(name='Search', description='useful for when you need to search the internet for information', func=<bound method BaseTool.run of DuckDuckGoSearchRun()>),
 Tool(name='Calculator', description='Useful for when you are asked to perform math calculations', func=<bound method Chain.run of LLMMathChain(verbose=True, llm_chain=LLMChain(prompt=PromptTemplate(input_variables=['question'], template='Translate a math problem into a expression that can be executed using Python\'s numexpr library. Use the output of running this code to answer the question.\n\nQuestion: ${{Question with math problem.}}\n```text\n${{single line mathematical expression that solves the problem}}\n```\n...numexpr.evaluate(text)...\n```output\n${{Output of running the code}}\n```\nAnswer: ${{Answer}}\n\nBegin.\n\nQuestion: What is 37593 * 67?\n```text\n37593 * 67\n```\n...numexpr.evaluate("37593 * 67")...\n```output\n2518731\n```\nAnswer: 2518731\n\nQuestion: 37593^(1/5)\n```text\n37593**(1/5)\n```\n...numexpr.eval

&emsp;&emsp;初始化 AI Agent。我们需要明确如下几个参数：
1. Tools（工具）
2. Model（模型）
3. Agent Type（代理类型， 比如 function calling、ReAct等） 官方Docs：https://python.langchain.com/v0.1/docs/modules/agents/agent_types/
4. Prompt：提示词，针对每一种Agent类型，官方提供了不同的提示词。
5. 可以设置 verbose=True 来查看 ReAct 链的每一步。

&emsp;&emsp;对于 ReAct 代理，我们可以直接从 langchain hub上获取到适合 ReAct 代理所使用机制的提示。

In [5]:
from langchain import hub
prompt = hub.pull("hwchase17/react")  # https://smith.langchain.com/hub/hwchase17/react?ref=blog.langchain.dev

In [6]:
prompt

PromptTemplate(input_variables=['agent_scratchpad', 'input', 'tool_names', 'tools'], metadata={'lc_hub_owner': 'hwchase17', 'lc_hub_repo': 'react', 'lc_hub_commit_hash': 'd15fe3c426f1c4b3f37c9198853e4a86e20c425ca7f4752ec0c9b0e97ca7ea4d'}, template='Answer the following questions as best you can. You have access to the following tools:\n\n{tools}\n\nUse the following format:\n\nQuestion: the input question you must answer\nThought: you should always think about what to do\nAction: the action to take, should be one of [{tool_names}]\nAction Input: the input to the action\nObservation: the result of the action\n... (this Thought/Action/Action Input/Observation can repeat N times)\nThought: I now know the final answer\nFinal Answer: the final answer to the original input question\n\nBegin!\n\nQuestion: {input}\nThought:{agent_scratchpad}')

In [7]:
from langchain.agents import create_react_agent
from langchain.agents import AgentExecutor

In [8]:
agent = create_react_agent(llm, tools, prompt)

In [9]:
agent_executor=AgentExecutor(agent=agent, tools=tools, verbose=True)

&emsp;&emsp;现在，AI ReAct 代理已准备好被调用。可以进行尝试：

In [10]:
agent_executor.invoke({"input":"NBA洛杉矶快船队2024年度的胜负记录，把赢的场次和输的场次相加再乘3。注意：请用中文。"})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m这个问题需要获取洛杉矶快船队在2024年的胜负记录，然后进行数学计算。我需要搜索相关信息。 

Thought: 我需要使用搜索引擎来查找洛杉矶快船队在2024年的胜负记录。
Action: Search
Action Input: '洛杉矶快船队2024年胜负记录'
Observation[0m[36;1m[1;3m优直播网讯：洛杉矶快船队是一支位于美国加利福尼亚州洛杉矶的职业篮球队，于1970年成立并加入美国职业篮球联赛（nba），现为西部联盟太平洋赛区参赛队伍。在2023-2024赛季nba常规赛中，快船队取得了51胜31负的战绩，在西部排名第4。然而在季后赛首轮系列赛中，快船队以2-6的比分输给达拉斯独行 ... 洛杉矶快船在2023-24赛季遭遇了又一个失败的赛季。首轮不敌达拉斯独行侠，这让管理层有些按耐不住了。以伦纳德和保罗乔治为首的二人组，一直未能带领球队进入总决赛，这让管理层开始对他们是否应该继续再合.... 快船2024年休赛季可2续约2交易，抢克莱 ... NBA中国官方网站. ©2023年著作权 NBA 中国所有权。京ICP备06066266号-6 京公网安备 11010702002526号. china.nba.cn上除去使用条款中所特别提及的部分之外，其它任何内容都不得以任何形式被复制、再传播，或篡改。. 进入china.nba.cn后，即表示阁下同意遵守china.nba.cn的隐私政策和使用条款。 球探体育提供2023-2024赛季NBA洛杉矶湖人vs洛杉矶快船数据统计，包含赛事比分、球队阵容、得分篮板等技术统计数据和赛事文字直播。 球探体育提供2023-2024赛季NBA洛杉矶湖人vs洛杉矶快船统计数据，包含各公司的初始欧指、即时欧指、返还率、即时凯利胜负指数 ... 北京时间2024年1月9日，洛杉矶快船背靠背对战太阳，138-111获胜，你怎么看？ ... 今年夏天，有一个大胡子把天赋带到了洛杉矶，他的到来改变了我，他鬼魅的传球总能找到我，让我轻松得分，当我看见饼向雪片一样像我砸来时，坦白说，我没有做好准备，经常 ...[0m[32;1m[1;3m根据搜索结果，洛杉矶快船队在2024年的胜负记录为5

ValueError: unknown format from LLM: In Python's numexpr library, you use strings to represent mathematical expressions that you want to evaluate. For the provided observation which involves addition, we can translate the math problem directly into a string that numexpr can execute.

Question: What is the result of '51.0 + 31.0'?
```text
"51.0 + 31.0"
```
...numexpr.evaluate("51.0 + 31.0")...
```output

&emsp;&emsp;上述报错在于：在处理语言模型回复时，语言模型的输出格式与 LLMMathChain 预期的不匹配，导致无法正确解析这个输出并引发了 ValueError。经过多次尝试，发现GLM4均不能正常的返回正确结果，而如果替换成GPT 模型，是能够非常稳定的获取输出。如下：

In [11]:
from langchain_openai import ChatOpenAI
from langchain.agents import create_react_agent
from langchain.agents import AgentExecutor

openai_llm = ChatOpenAI(model='gpt-4', temperature=0)
agent = create_react_agent(openai_llm, tools, prompt)
openai_agent_executor=AgentExecutor(agent=agent, tools=tools, verbose=True)
openai_agent_executor.invoke({"input":"NBA洛杉矶快船队2024年度的胜负记录，把赢的场次和输的场次相加再乘3。注意：请用中文。"})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m我需要找到NBA洛杉矶快船队2024年度的胜负记录，然后把赢的场次和输的场次相加，最后再乘以3。首先，我需要搜索2024年度的胜负记录。
Action: Search
Action Input: "NBA洛杉矶快船队2024年度胜负记录"[0m[36;1m[1;3m2024-07-11 10:20 . 发布于： 天津市. 近期，火箭球星詹姆斯·哈登加盟洛杉矶快船，此举引发了nba的广泛瞩目。 这份总价高达近7千万美元、期限两年的合约，显著增强了快船的整体实力，其中，哈登的卓越表现将极大地提升球队的进攻效率。 ... 洛杉矶快船队于本 ... 球探体育提供2023-2024赛季NBA洛杉矶快船vs洛杉矶湖人数据统计，包含赛事比分、球队阵容、得分篮板等技术统计数据和赛事文字直播。 球探体育提供2023-2024赛季NBA洛杉矶快船vs洛杉矶湖人统计数据，包含各公司的初始欧指、即时欧指、返还率、即时凯利胜负指数 ... NBA中国官方网站. ©2023年著作权 NBA 中国所有权。京ICP备06066266号-6 京公网安备 11010702002526号. china.nba.cn上除去使用条款中所特别提及的部分之外，其它任何内容都不得以任何形式被复制、再传播，或篡改。. 进入china.nba.cn后，即表示阁下同意遵守china.nba.cn的隐私政策和使用条款。 优直播网讯：洛杉矶快船队是一支位于美国加利福尼亚州洛杉矶的职业篮球队，于1970年成立并加入美国职业篮球联赛（nba），现为西部联盟太平洋赛区参赛队伍。在2023-2024赛季nba常规赛中，快船队取得了51胜31负的战绩，在西部排名第4。然而在季后赛首轮系列赛中，快船队以2-6的比分输给达拉斯独行 ... 祖巴克 补篮： 不中. 00:00. 勒布朗-詹姆斯 抢到篮板球 (进攻篮板:0 防守篮板:12) 130-125. 00:00. 加时1结束. 00:00. 全场结束. 球探体育提供2023-2024赛季NBA洛杉矶湖人vs洛杉矶快船数据统计，包含赛事比分、球队阵容、得分篮板等技术统计数据和赛事文字直播。.[0m[32;1m[1;3m我找到了洛杉矶快船队2024年度的

{'input': 'NBA洛杉矶快船队2024年度的胜负记录，把赢的场次和输的场次相加再乘3。注意：请用中文。', 'output': '246'}

<div align=center><img src="https://muyu001.oss-cn-beijing.aliyuncs.com/img/image-20240709105718171.png" width=100%></div>

&emsp;&emsp;如上所示的问题：当GLM-4模型无法正确的调用LangChain预置的`LLMMathChain`函数，而GPT模型确定稳定的输出结果，能够感觉到AI Agents 作为自主执行一系列复杂操作的角色，其中间任一环节出现问题都会导致整个流程的处理失败，其非常考验大模型的原生能力。

&emsp;&emsp;除此之外，针对于使用特定的模型（比如GLM-4），另一种生产环境更常用的方式就是对BaseTool 类进行子类化，从而对工具的行为进行更多控制，并希望定义自定义实例变量或传播回调。

- **子类化 BaseTool 类**

&emsp;&emsp;通过子类化，可以定义其他方法、覆盖现有方法以及添加特定于您的工具的自定义实例变量，执行附加操作或根据某些条件修改工具的行为。

> LangChain Docs：https://python.langchain.com/v0.1/docs/modules/tools/custom_tools/#subclassing-the-basetool-class

&emsp;&emsp;LangChain 中的 `@tool` 装饰器通过一个简单的函数创建了一个自定义工具，使用 @tool 装饰器快速创建工具，无需高级自定义或定义自定义实例变量。 @tool 装饰器与 Tool 数据类的不同之处在于提供了一种更轻量级且基于函数的方法来创建 Tool。它允许直接在装饰函数中定义工具的功能，从而更容易封装特定的任务或操作。

In [80]:
@tool("lowercase_converter", return_direct=True)
def convert_to_lowercase(input: str) -> str:
    """Converts all uppercase characters in the input string to lowercase."""
    return input.lower()

&emsp;&emsp;这个 eval_expr 函数用于安全地计算一个数学表达式的值，其核心利用了 Python 的 ast（Abstract Syntax Tree，抽象语法树）模块。ast 模块可以将字符串形式的表达式转换成树形结构的节点，从而可以在没有执行实际代码的情况下分析和操作这些表达式。

In [81]:
new_tools = [convert_to_lowercase]

new_tools

[StructuredTool(name='lowercase_converter', description='Converts all uppercase characters in the input string to lowercase.', args_schema=<class 'pydantic.v1.main.lowercase_converterSchema'>, return_direct=True, func=<function convert_to_lowercase at 0x000002423076F9C0>)]

In [82]:
from langchain.agents import create_react_agent
from langchain.agents import AgentExecutor

In [83]:
llm = ChatZhipuAI(model='glm-4')

In [84]:
agent = create_react_agent(llm, new_tools, prompt)

In [85]:
agent_executor=AgentExecutor(agent=agent, tools=new_tools, verbose=True)

&emsp;&emsp;现在，AI ReAct 代理已准备好被调用。可以进行尝试：

In [87]:
agent_executor.invoke({"input":"ASDSDSADASFG"})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mThe string appears to be random uppercase characters. The task is to convert all uppercase characters to lowercase. I will use the lowercase_converter tool for this.

Action: lowercase_converter
Action Input: ASDSDSADASFG
Observation[0m[36;1m[1;3masdsdsadasfg
observation[0m
[32;1m[1;3m[0m

[1m> Finished chain.[0m


{'input': 'ASDSDSADASFG', 'output': 'asdsdsadasfg\nobservation'}

# 三、TOT 提示

&emsp;&emsp;思想链 (CoT) 为即时工程实践带来了非常大的影响。CoT 的基本原则非常强大，足以承受四个核心组件的变化：
- Bridge Objects（桥接对象）
- Langauge Template（提示模板）
- Coherence（连贯性）
- Relevance（关联）

<div align=center><img src="https://muyu001.oss-cn-beijing.aliyuncs.com/img/image-20240709125215630.png" width=100%></div>

&emsp;&emsp;所以在随后的一段时间内，在 CoT 的原理的基础上就出现了一系列的优化和变种。还有一些方法可以生成多个结果，然后由投票系统决定最准确和相关的答案。这就是TOT（思想树）。

&emsp;&emsp;ToT 的基本原则是：
- 当 LLM 遇到需要解决的复杂问题时，它在推理时仅限于令牌级别、从左到右的过程。
- 用户查询必须分解为单独的想法，并且这些想法需要以矩阵方法来探索，而不是更线性的基本 CoT 方法。
- ToT 创造了一些选择，而不是仅仅选择一个，并评估其当前状态，并积极向前或回溯以做出更多的全局决策。

&emsp;&emsp;ToT 引入的关键要素是探索可能的解决方案和战略前瞻性的要素，允许 LLM 通过考虑多种不同的推理路径和自我评估选择来执行深思熟虑的决策，以决定下一步的行动方案，并在必要时向前看或回溯以做出全局选择。

<div align=center><img src="https://muyu001.oss-cn-beijing.aliyuncs.com/img/image-20240709125605470.png" width=100%></div>

&emsp;&emsp;ToT 的具体实例涉及回答四个问题：
- 如何将中间过程分解为思维步骤。
- 如何从每个状态产生潜在的想法。
- 如何启发式评估状态。
- 使用什么搜索算法。

&emsp;&emsp;ToT 维护着一棵思维树，思维由连贯的语言序列表示，这个序列就是解决问题的中间步骤。使用这种方法，LM 能够自己对严谨推理过程的中间思维进行评估。LM 将生成及评估思维的能力与搜索算法（如广度优先搜索和深度优先搜索）相结合，在系统性探索思维的时候可以向前验证和回溯。

&emsp;&emsp;ToT 框架的主要概念概括成了一段简短的提示词，指导 LLM 在一次提示中对中间思维做出评估。ToT 提示词的例子如下：
```json
假设三位不同的专家来回答这个问题。
所有专家都写下他们思考这个问题的第一个步骤，然后与大家分享。
然后，所有专家都写下他们思考的下一个步骤并分享。
以此类推，直到所有专家写完他们思考的所有步骤。
只要大家发现有专家的步骤出错了，就让这位专家离开。
请问...
```

> LangChain TOT Docs：https://api.python.langchain.com/en/latest/tot/langchain_experimental.tot.base.ToTChain.html

In [20]:
sudoku_puzzle = "3,*,*,2|1,*,3,*|*,1,*,3|4,*,*,1"
sudoku_solution = "3,4,1,2|1,2,3,4|2,1,4,3|4,3,2,1"
problem_description = f"""
{sudoku_puzzle}

- This is a 4x4 Sudoku puzzle.
- The * represents a cell to be filled.
- The | character separates rows.
- At each step, replace one or more * with digits 1-4.
- There must be no duplicate digits in any row, column or 2x2 subgrid.
- Keep the known digits from previous valid thoughts in place.
- Each thought can be a partial or the final solution.
""".strip()
print(problem_description)

3,*,*,2|1,*,3,*|*,1,*,3|4,*,*,1

- This is a 4x4 Sudoku puzzle.
- The * represents a cell to be filled.
- The | character separates rows.
- At each step, replace one or more * with digits 1-4.
- There must be no duplicate digits in any row, column or 2x2 subgrid.
- Keep the known digits from previous valid thoughts in place.
- Each thought can be a partial or the final solution.


In [22]:
sudoku_puzzle = "3,*,*,2|1,*,3,*|*,1,*,3|4,*,*,1"
sudoku_solution = "3,4,1,2|1,2,3,4|2,1,4,3|4,3,2,1"
problem_description_cn = f"""
{sudoku_puzzle}

- 这是一个4x4的数独谜题。
- “*”代表需要填写的单元格。
- “|”字符用来分隔行。
- 每一步，用数字1-4替换一个或多个“*”。
- 任何行、列或2x2子网格中不能有重复的数字。
- 保持前一个有效思考中的已知数字不变。
- 每个思考可以是部分解决方案或最终解决方案。
""".strip()

In [23]:
print(problem_description_cn)

3,*,*,2|1,*,3,*|*,1,*,3|4,*,*,1

- 这是一个4x4的数独谜题。
- “*”代表需要填写的单元格。
- “|”字符用来分隔行。
- 每一步，用数字1-4替换一个或多个“*”。
- 任何行、列或2x2子网格中不能有重复的数字。
- 保持前一个有效思考中的已知数字不变。
- 每个思考可以是部分解决方案或最终解决方案。


&emsp;&emsp;定义基于规则的检查器:

&emsp;&emsp;每个想法都会由thought checker 进行评估，并被赋予一个有效性类型：
- valid（有效的）
- invalid or （无效或）
- partial. （部分的）

&emsp;&emsp;简单的检查器可以是基于规则的。例如，在数独谜题的情况下，检查者可以检查谜题是否有效、无效或部分

In [46]:
# pip install langchain_experimental

In [24]:
import re
from typing import Tuple

from langchain_experimental.tot.checker import ToTChecker
from langchain_experimental.tot.thought import ThoughtValidity


class MyChecker(ToTChecker):
    def evaluate(
        self, problem_description: str, thoughts: Tuple[str, ...] = ()
    ) -> ThoughtValidity:
        last_thought = thoughts[-1]
        clean_solution = last_thought.replace(" ", "").replace('"', "")
        regex_solution = clean_solution.replace("*", ".").replace("|", "\\|")
        if sudoku_solution in clean_solution:
            return ThoughtValidity.VALID_FINAL
        elif re.search(regex_solution, sudoku_solution):
            return ThoughtValidity.VALID_INTERMEDIATE
        else:
            return ThoughtValidity.INVALID

In [25]:
checker = MyChecker()

assert (
    checker.evaluate("", ("3,*,*,2|1,*,3,*|*,1,*,3|4,*,*,1",))
    == ThoughtValidity.VALID_INTERMEDIATE
)
assert (
    checker.evaluate("", ("3,4,1,2|1,2,3,4|2,1,4,3|4,3,2,1",))
    == ThoughtValidity.VALID_FINAL
)
assert (
    checker.evaluate("", ("3,4,1,2|1,2,3,4|2,1,4,3|4,3,*,1",))
    == ThoughtValidity.VALID_INTERMEDIATE
)
assert (
    checker.evaluate("", ("3,4,1,2|1,2,3,4|2,1,4,3|4,*,3,1",))
    == ThoughtValidity.INVALID
)

&emsp;&emsp;Tree of Thought Chain 初始化并运行 ToT 链，最大交互数 k 设置为 20，最大子想法数 c 设置为 3。

In [27]:
from langchain_experimental.tot.base import ToTChain

tot_chain = ToTChain(
    llm=openai_llm, checker=MyChecker(), k=20, c=3, verbose=True, verbose_llm=False
)

tot_chain.run(problem_description=problem_description)

  warn_deprecated(




[1m> Entering new ToTChain chain...[0m
Starting the ToT solve procedure.
[33;1m[1;3mThought: 3,*,*,2|1,*,3,4|*,1,*,3|4,*,*,1
[0m



[31;1m[1;3m    Thought: 3,*,4,2|1,*,3,4|*,1,*,3|4,*,*,1
[0m[33;1m[1;3m    Thought: 3,*,*,2|1,2,3,4|*,1,*,3|4,*,*,1
[0m



[33;1m[1;3m        Thought: 3,4,1,2|1,2,3,4|*,1,*,3|4,*,*,1
[0m



[32;1m[1;3m            Thought: 3,4,1,2|1,2,3,4|2,1,4,3|4,3,2,1
[0m
[1m> Finished chain.[0m


'3,4,1,2|1,2,3,4|2,1,4,3|4,3,2,1'