下面给出一个使用搜索和产生式规则思想实现猴子摘香蕉问题的 Python 示例程序。该程序中：

    状态表示：定义了一个状态类，包含猴子所在位置、箱子所在位置、猴子是否站在箱子上、是否已摘到香蕉四个属性。

    动作定义：包括猴子移动、推箱子、攀登箱子、下箱子、摘香蕉等动作，并规定了每个动作的前提条件。

    状态转移函数：根据当前状态和选定动作，产生新的状态。

    搜索算法：使用广度优先搜索（BFS）从初始状态出发寻找一条动作序列，使猴子能摘到香蕉。

以下是完整代码：

代码说明

    状态与动作定义
    定义了 State 类描述状态，并编写了 actions 函数列出当前状态下可以采取的所有合法动作。

    状态转移函数
    result 函数根据选定的动作更新状态，例如：

        Move：猴子移动到目标位置。

        Push：当猴子与箱子在同一位置时，可以推动箱子到其他位置，并且猴子随之移动。

        ClimbUp 和 ClimbDown：用于上下箱子。

        Grasp：当猴子在箱子上且位置在香蕉处时，摘取香蕉。

    搜索策略
    使用广度优先搜索（BFS）遍历状态空间，寻找一条从初始状态到目标状态（已摘到香蕉）的动作序列，并在找到后输出每一步的操作。

你可以运行该程序，观察控制台输出的步骤序列，从而验证解决猴子摘香蕉问题的过程。这种实现方法就是一种基于产生式规则的知识表示与问题求解方式。

好的，我们详细拆解 `bfs` 的执行过程，并用更具体的例子来分析每一步的变化。  

---

## **🔍 1. 代码解析**
### **📌 代码回顾**
```python
def bfs(initial_state):
    """
    使用广度优先搜索（BFS）寻找一条动作序列使猴子摘到香蕉。
    返回动作序列（列表），若无解则返回 None。
    """
    from collections import deque  # 引入双端队列（deque）用于 BFS 队列操作

    frontier = deque()  # 创建 BFS 队列
    frontier.append((initial_state, []))  # 加入起始状态，空动作序列
    explored = set()  # 记录访问过的状态，防止重复搜索

    while frontier:
        state, path = frontier.popleft()  # 取出队列最前面的状态（先进先出）
        
        if is_goal(state):  # 如果当前状态达成目标，返回路径
            return path

        explored.add(state)  # 标记当前状态为已访问

        for act in actions(state):  # 获取当前状态下所有可执行的动作
            new_state = result(state, act)  # 执行动作，获取新状态
            if new_state not in explored:  # 只有没访问过的状态才继续探索
                frontier.append((new_state, path + [act]))  # 记录新的路径
        
    return None  # 如果找不到目标状态，返回 None
```

---

## **🔄 2. BFS 运行流程示例**
### **📍 设定问题场景**
房间布局如下：
```
A    B    C
(🐒) (🍌) (📦)
```
- `A`：猴子当前位置
- `B`：香蕉悬挂的位置
- `C`：箱子的位置（猴子需要把箱子移动到 `B` 下才能够到香蕉）

猴子的目标：
✅ **通过一系列动作拿到香蕉**。  

---

### **📌 状态定义**
我们用 `(猴子位置, 箱子位置, 香蕉位置, 是否站在箱子上)` 来表示当前状态：
```python
initial_state = ("A", "C", "B", False)
```
**状态解释**：
- `"A"`：猴子起始位置在 `A`
- `"C"`：箱子起始位置在 `C`
- `"B"`：香蕉悬挂在 `B`
- `False`：猴子当前没有站在箱子上

---

### **📌 可能的动作**
猴子可以执行以下动作：
1. `走到X`：猴子走到 `X`（`X` 可能是 `A`、`B` 或 `C`）
2. `推箱子到X`：如果猴子和箱子在同一位置，他可以推箱子到 `X`
3. `爬上箱子`：如果猴子和箱子在同一位置，他可以爬上去
4. `摘香蕉`：如果猴子站在箱子上，并且箱子在 `B` 下面，他就能拿到香蕉

---

### **📌 运行 BFS**
#### **▶️ 初始状态**
```
frontier = deque([(("A", "C", "B", False), [])])  # 队列中只有起始状态
explored = set()
```

#### **🔄 第 1 轮 BFS**
1. **取出状态 `(A, C, B, False)`**：
   ```python
   state = ("A", "C", "B", False)
   path = []
   ```
2. **检查目标状态**：
   ```python
   is_goal(("A", "C", "B", False))  # False，未摘到香蕉
   ```
3. **获取可执行动作 `actions(state)`**：
   ```python
   ["走到C", "走到B"]
   ```
4. **执行这些动作，得到新的状态**：
   - `走到C` → `("C", "C", "B", False)`
   - `走到B` → `("B", "C", "B", False)`

5. **加入 `frontier`（搜索队列）**：
   ```
   frontier = deque([
       (("C", "C", "B", False), ["走到C"]),
       (("B", "C", "B", False), ["走到B"])
   ])
   ```
6. **标记 `explored`**：
   ```python
   explored = {("A", "C", "B", False)}
   ```

---

#### **🔄 第 2 轮 BFS**
1. **取出 `("C", "C", "B", False)`**：
   ```python
   state = ("C", "C", "B", False)
   path = ["走到C"]
   ```
2. **获取可执行的动作 `actions(state)`**：
   ```python
   ["推箱子到B"]
   ```
3. **执行动作**：
   - `推箱子到B` → `("B", "B", "B", False)`

4. **加入 `frontier`**：
   ```
   frontier = deque([
       (("B", "C", "B", False), ["走到B"]),
       (("B", "B", "B", False), ["走到C", "推箱子到B"])
   ])
   ```
5. **标记 `explored`**：
   ```python
   explored = {("A", "C", "B", False), ("C", "C", "B", False)}
   ```

---

#### **🔄 第 3 轮 BFS**
1. **取出 `("B", "B", "B", False)`**：
   ```python
   state = ("B", "B", "B", False)
   path = ["走到C", "推箱子到B"]
   ```
2. **获取可执行的动作 `actions(state)`**：
   ```python
   ["爬上箱子"]
   ```
3. **执行动作**：
   - `爬上箱子` → `("B", "B", "B", True)`

4. **加入 `frontier`**：
   ```
   frontier = deque([
       (("B", "C", "B", False), ["走到B"]),
       (("B", "B", "B", True), ["走到C", "推箱子到B", "爬上箱子"])
   ])
   ```

---

#### **🔄 第 4 轮 BFS**
1. **取出 `("B", "B", "B", True)`**：
   ```python
   state = ("B", "B", "B", True)
   path = ["走到C", "推箱子到B", "爬上箱子"]
   ```
2. **检查目标状态**：
   ```python
   is_goal(("B", "B", "B", True))  # True，猴子站在箱子上，香蕉在头顶
   ```
3. **返回动作序列**：
   ```python
   return ["走到C", "推箱子到B", "爬上箱子", "摘香蕉"]
   ```

---

### **🎯 最终输出**
```python
["走到C", "推箱子到B", "爬上箱子", "摘香蕉"]
```
猴子成功摘到香蕉 🎉🎉🎉！

---

## **📝 关键点总结**
✅ **BFS 适用于最短路径搜索**（层层推进，找到第一个解就是最优解）  
✅ **`deque.popleft()` 保持先进先出（FIFO）**，提高性能  
✅ **`explored` 避免重复搜索，提高效率**  
✅ **如果能找到目标状态，返回最短路径**  

这个 **BFS 算法** 适用于 **迷宫求解、滑块拼图、八数码问题** 等路径搜索问题，你可以尝试改进它来解决更多问题！ 🚀

In [1]:
# -*- coding: utf-8 -*-
"""
猴子摘香蕉问题——使用产生式系统思想求解

问题描述：
  一个房间里天花板上挂着香蕉，房间内有一只猴子和一个可移动的箱子。
  猴子必须推箱子到香蕉下方，再攀上箱子才能摘到香蕉。
  
初始状态：
  猴子位置为 'A'
  箱子位置为 'C'
  香蕉位置固定在 'B'
  猴子不在箱子上，且尚未摘到香蕉

目标状态：
  猴子摘到香蕉
"""

class State:
    def __init__(self, monkey, box, on_box, has_banana):
        self.monkey = monkey      # 猴子位置
        self.box = box            # 箱子位置
        self.on_box = on_box      # 猴子是否站在箱子上（True/False）
        self.has_banana = has_banana  # 是否已摘到香蕉（True/False）
    
    def __eq__(self, other):
        return (self.monkey == other.monkey and 
                self.box == other.box and
                self.on_box == other.on_box and 
                self.has_banana == other.has_banana)
    
    def __hash__(self):
        return hash((self.monkey, self.box, self.on_box, self.has_banana))
    
    def __repr__(self):
        return (f"State(monkey={self.monkey}, box={self.box}, "
                f"on_box={self.on_box}, has_banana={self.has_banana})")

def actions(state):
    """
    根据当前状态返回可采取的动作列表。
    定义的动作及条件：
      1. Move: 猴子不在箱子上时，可移动到任一不同位置。
      2. Push: 当猴子与箱子在同一位置且不在箱子上时，可推动箱子到其它位置，同时猴子跟随箱子移动。
      3. ClimbUp: 当猴子与箱子在同一位置且不在箱子上时，可爬上箱子。
      4. ClimbDown: 当猴子在箱子上时，可下箱子（回到箱子同一位置）。
      5. Grasp: 当猴子在箱子上，且猴子位置正好在香蕉所在位置（固定为 'B'）时，可摘香蕉。
    """
    available_actions = []
    locations = ['A', 'B', 'C']
    # 动作：Move（移动），条件：猴子不在箱子上
    if not state.on_box:
        for loc in locations:
            if loc != state.monkey:
                available_actions.append(("Move", loc))
    # 动作：Push（推箱子），条件：猴子和箱子在同一位置且猴子不在箱子上
    if not state.on_box and state.monkey == state.box:
        for loc in locations:
            if loc != state.box:
                available_actions.append(("Push", loc))
    # 动作：ClimbUp（爬上箱子），条件：猴子和箱子在同一位置且不在箱子上
    if not state.on_box and state.monkey == state.box:
        available_actions.append(("ClimbUp", None))
    # 动作：ClimbDown（下箱子），条件：猴子在箱子上
    if state.on_box:
        available_actions.append(("ClimbDown", None))
    # 动作：Grasp（摘香蕉），条件：猴子在箱子上且猴子位置等于香蕉所在位置（'B'）
    if state.on_box and state.monkey == 'B' and not state.has_banana:
        available_actions.append(("Grasp", None))
    return available_actions

def result(state, action):
    """
    根据动作产生新的状态。动作是一个二元组 (动作名称, 参数)。
    """
    act, param = action
    # 复制当前状态，避免修改原状态
    new_state = State(state.monkey, state.box, state.on_box, state.has_banana)
    
    if act == "Move":
        new_state.monkey = param
    elif act == "Push":
        # 推动箱子：猴子与箱子同时移动到目标位置
        new_state.box = param
        new_state.monkey = param
    elif act == "ClimbUp":
        new_state.on_box = True
    elif act == "ClimbDown":
        new_state.on_box = False
    elif act == "Grasp":
        new_state.has_banana = True
    return new_state

def is_goal(state):
    """判断是否达到目标状态：摘到香蕉。"""
    return state.has_banana

def bfs(initial_state):
    """
    使用广度优先搜索寻找一条动作序列使猴子摘到香蕉。
    返回动作序列（列表），若无解则返回 None。
    """
    from collections import deque
    frontier = deque()
    frontier.append((initial_state, []))
    explored = set()
    
    while frontier:
        state, path = frontier.popleft()
        if is_goal(state):
            return path
        explored.add(state)
        for act in actions(state):
            new_state = result(state, act)
            if new_state not in explored:
                frontier.append((new_state, path + [act]))
    return None

if __name__ == '__main__':
    # 初始状态：猴子在 'A'，箱子在 'C'，猴子不在箱子上，且尚未摘到香蕉（香蕉固定在 'B'）
    initial = State(monkey='A', box='C', on_box=False, has_banana=False)
    plan = bfs(initial)
    if plan:
        print("找到的行动方案：")
        step_num = 1
        for action in plan:
            act_name, param = action
            if param is not None:
                print(f"步骤 {step_num}: {act_name} -> {param}")
            else:
                print(f"步骤 {step_num}: {act_name}")
            step_num += 1
    else:
        print("没有找到可行的行动方案。")


找到的行动方案：
步骤 1: Move -> C
步骤 2: Push -> B
步骤 3: ClimbUp
步骤 4: Grasp
