In [1]:
import os
from dotenv import load_dotenv
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.messages import SystemMessage, HumanMessage

load_dotenv()

llm = ChatOpenAI(
    model="qwen3-max-2026-01-23",
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
    temperature=0,
)


def run_reflection_loop():
    """
    演示多步 AI 反思循环以逐步改进 Python 函数。
    """
    # --- 核心任务 ---
    task_prompt = """
    你的任务是创建一个名为 `calculate_factorial` 的 Python 函数。
    此函数应执行以下操作：
    1. 接受单个整数 `n` 作为输入。
    2. 计算其阶乘 (n!)。
    3. 包含清楚解释函数功能的文档字符串。
    4. 处理边缘情况：0 的阶乘是 1。
    5. 处理无效输入：如果输入是负数，则引发 ValueError。
    """

    # --- 反思循环 ---
    max_iterations = 3
    current_code = ""

    # 我们将构建对话历史以在每一步中提供上下文。
    message_history = [HumanMessage(content=task_prompt)]

    for i in range(max_iterations):
        print("\n" + "=" * 25 + f"反思循环：迭代 {i + 1}" + "=" * 25)

        # --- 1. 生成/完善阶段 ---
        # 在第一次迭代中，它生成。在后续迭代中，它完善。
        if i == 0:
            print("\n>>> 阶段 1：生成初始代码...")
            # 第一条消息只是任务提示词。
            response = llm.invoke(message_history)
            current_code = response.content
        else:
            print("\n>>> 阶段 1：基于先前批评完善代码...")
            # 消息历史现在包含任务、
            # 最后一个代码和最后一个批评。
            # 我们指示模型应用批评。
            message_history.append(HumanMessage(content="请使用提供的批评完善代码。"))
            response = llm.invoke(message_history)
            current_code = response.content

        print("\n--- 生成的代码（v" + str(i + 1) + "） ---\n" + current_code)
        message_history.append(response)  # 将生成的代码添加到历史记录

        # --- 2. 反思阶段 ---
        print("\n>>>阶段2 ：对生成的代码进行反思...")
        # 为反思 Agent 创建特定提示词。
        # 这要求模型充当高级代码审查员。
        reflector_prompt = [
            SystemMessage(
                content="""
                你是一名高级软件工程师和 Python 专家。
                你的角色是执行细致的代码审查。
                根据原始任务要求批判性地评估提供的 Python 代码。
                查找错误、风格问题、缺失的边缘情况和改进领域。
                如果代码完美并满足所有要求，
                用单一短语 'CODE_IS_PERFECT' 响应。
                否则，提供批判的项目符号列表。
            """
            ),
            HumanMessage(
                content=f"原始任务：\n{task_prompt}\n\n要审查的代码：\n{current_code}"
            ),
        ]

        critique_response = llm.invoke(reflector_prompt)
        critique = critique_response.content

        # --- 3. 停止条件 ---
        if "CODE_IS_PERFECT" in critique:
            print("\n--- 批评 ---\n未发现进一步批评。代码令人满意。")
            break

        print("\n--- 批评 ---\n" + critique)

        # 将批评添加到历史记录以用于下一个完善循环。
        message_history.append(HumanMessage(content=f"对先前代码的批评：\n{critique}"))

    print("\n" + "=" * 30 + " 最终结果" + "=" * 30)
    print("\n反思过程后的最终精炼代码：\n")
    print(current_code)


if __name__ == "__main__":
    run_reflection_loop()



>>> 阶段 1：生成初始代码...

--- 生成的代码（v1） ---
```python
def calculate_factorial(n):
    """
    计算给定非负整数 n 的阶乘 (n!)。
    
    阶乘的定义：
    - 0! = 1（根据数学定义）
    - n! = n × (n-1) × (n-2) × ... × 2 × 1（当 n > 0 时）
    
    参数:
        n (int): 要计算阶乘的非负整数
        
    返回:
        int: n 的阶乘值
        
    异常:
        ValueError: 当输入 n 为负数时引发
        TypeError: 当输入 n 不是整数时引发
        
    示例:
        >>> calculate_factorial(0)
        1
        >>> calculate_factorial(5)
        120
        >>> calculate_factorial(-1)
        Traceback (most recent call last):
            ...
        ValueError: 阶乘不能计算负数
    """
    # 检查输入是否为整数
    if not isinstance(n, int):
        raise TypeError("输入必须是整数")
    
    # 处理负数情况
    if n < 0:
        raise ValueError("阶乘不能计算负数")
    
    # 处理边缘情况：0! = 1
    if n == 0:
        return 1
    
    # 计算阶乘
    result = 1
    for i in range(1, n + 1):
        result *= i
    
    return result
```

>>>阶段2 ：对生成的代码进行反思...

--- 批评 ---
未发现进一步批评。代码令人满意。


反思过程后的最终精炼代码：

```python
d