In [1]:
import os
from langchain_openai import ChatOpenAI
from langchain_core.messages import HumanMessage, SystemMessage


llm = ChatOpenAI(
    api_key=os.getenv("API_KEY"),
    base_url=os.getenv("BASE_URL"),
    model="deepseek-chat",
    temperature=0.1,
)

def run_reflection_loop():
    """
    演示多步AI反思循环, 逐步优化Python函数
    """
    # 核心人物
    task_prompt = """
    你的任务是创建一个名为 `calculate_factorial` 的 Python 函数。
    该函数需满足以下要求:
    1. 只接受一个整数参数 n。
    2. 计算其阶乘(n!)。
    3. 包含清晰的 docstring,说明函数功能。
    4. 处理边界情况:0 的阶乘为 1。
    5. 处理无效输入:若输入为负数则抛出 ValueError。
    """
    # 反思循环
    max_iterations = 3
    current_code = ""
    # 构建对话历史， 为每步提供上下文
    message_history = [HumanMessage(content=task_prompt)]

    for i in range(max_iterations):
        print("\n" + "="*25 + f" 反思循环:第 {i + 1} 次迭代 " + "="*25)
        # 生成/优化阶段
        # 首次迭代为生成， 后续为优化
        if i == 0:
            print("\n>>> 阶段 1:生成初始代码...")
            # 首条消息为任务提示
            response = llm.invoke(message_history)
            current_code = response.content
        else:
            print("\n>>> 阶段 1:根据批判优化代码...")
            # 消息历史包含任务、上次代码和批判
            # 指示模型应用批判意见优化代码
            message_history.append(HumanMessage(content="请根据批判意见优化代码。"))
            response = llm.invoke(message_history)
            current_code = response.content
    
        print("\n‐‐‐ 生成代码(第 " + str(i + 1) + " 版) ‐‐‐\n" + current_code)
        message_history.append(response) # 将生成代码加入历史

        # 反思阶段
        print("\n>>> 阶段 2:对生成代码进行反思...")

        # 为批判者 Agent 创建专用提示
        # 要求模型以资深代码审查员身份批判代码
        reflector_prompt = [
            SystemMessage(content="""
            你是一名资深软件工程师,精通 Python。
            你的职责是对提供的 Python 代码进行细致代码审查。
            请根据原始任务要求,严格评估代码。
            检查是否有 bug、风格问题、遗漏边界情况及其他可改进之处。
            若代码完美且满足所有要求,仅回复 'CODE_IS_PERFECT'。
            否则,请以项目符号列表形式给出批判意见。
            """),
            HumanMessage(content=f"原始任务:\n{task_prompt}\n\n待审查代码:\n{current_code}"),
        ]

        critique_response = llm.invoke(reflector_prompt)
        critique = critique_response.content

        # 3.停止条件
        if "CODE_IS_PERFECT" in critique:
            print("\n‐‐‐ 批判 ‐‐‐\n 未发现进一步批判,代码已达要求。")
            break

        print("\n‐‐‐ 批判 ‐‐‐\n" + critique)
        # 将批判意见加入历史,供下轮优化使用
        message_history.append(HumanMessage(content=f"上次代码批判意见:\n{critique}"))

    print("\n" + "="*30 + " 最终结果 " + "="*30)
    print("\n 反思流程优化后的最终代码:\n")
    print(current_code)

if __name__ == "__main__":
    run_reflection_loop()








>>> 阶段 1:生成初始代码...

‐‐‐ 生成代码(第 1 版) ‐‐‐
```python
def calculate_factorial(n: int) -> int:
    """
    计算非负整数 n 的阶乘 (n!)。

    阶乘定义为 n! = n × (n-1) × (n-2) × ... × 1，特别地，0! = 1。

    参数:
    n (int): 要计算阶乘的非负整数。

    返回:
    int: n 的阶乘结果。

    异常:
    ValueError: 如果 n 是负数。

    示例:
    >>> calculate_factorial(5)
    120
    >>> calculate_factorial(0)
    1
    """
    if n < 0:
        raise ValueError("阶乘仅对非负整数定义，输入不能为负数。")
    
    result = 1
    for i in range(2, n + 1):
        result *= i
    return result


# 测试示例
if __name__ == "__main__":
    # 正常情况测试
    print(calculate_factorial(5))  # 输出: 120
    print(calculate_factorial(0))  # 输出: 1
    print(calculate_factorial(1))  # 输出: 1
    
    # 异常情况测试
    try:
        calculate_factorial(-3)
    except ValueError as e:
        print(f"捕获到预期异常: {e}")  # 输出: 捕获到预期异常: 阶乘仅对非负整数定义，输入不能为负数。
```

>>> 阶段 2:对生成代码进行反思...

‐‐‐ 批判 ‐‐‐
- **类型提示不完整**: 函数签名中的类型提示 `-> int` 对于较大的 `n` 值可能不准确，因为 Python 的 `int` 类型可以处理任意大的整数，但阶乘结果增长极快，对于非常大的 `n`，结果可能超