# 10: 工具使用


## 设置

运行以下设置单元格来加载您的 API 密钥并建立 `get_completion` 辅助函数。

In [1]:
# 🔧 OpenAI环境自动配置
# 此设置会自动从环境变量或IPython存储中加载配置

# 安装OpenAI库
%pip install openai==1.61.0

# 导入Python内置的正则表达式库
import re

# 🚀 使用统一配置管理系统
from config import setup_notebook_environment, print_config_info

# 自动设置OpenAI客户端和get_completion函数
# 优先级：环境变量 > IPython存储 > 默认值
try:
    client, get_completion = setup_notebook_environment()
    print("✅ 使用统一配置管理成功！")
except Exception as e:
    print(f"❌ 统一配置失败，回退到传统方式: {e}")
    
    # 回退到传统的配置方式
    import openai
    
    # 从IPython存储中检索API_KEY和MODEL_NAME变量
    %store -r API_KEY
    %store -r MODEL_NAME

    # 如果没有设置MODEL_NAME，使用默认值
    try:
        MODEL_NAME
    except NameError:
        MODEL_NAME = "gpt-4o"  # 默认使用gpt-4o模型

    # 创建OpenAI客户端
    client = openai.OpenAI(api_key=API_KEY)

    def get_completion(prompt: str, system_prompt=""):
        """
        获取GPT的完成响应
        
        参数:
            prompt (str): 用户提示
            system_prompt (str): 系统提示（可选）
        
        返回:
            str: GPT的响应文本
        """
        # 构建消息列表
        messages = []
        
        # 如果有系统提示，添加系统消息
        if system_prompt:
            messages.append({"role": "system", "content": system_prompt})
        
        # 添加用户消息
        messages.append({"role": "user", "content": prompt})
        
        # 调用OpenAI API
        response = client.chat.completions.create(
            model=MODEL_NAME,              # 模型名称 (gpt-4o 或 deepseek-r1)
            messages=messages,             # 消息列表
            max_completion_tokens=2000,    # 最大token数
            temperature=0.0               # 温度参数，0表示更确定性
        )
        return response.choices[0].message.content
    
    print("⚠️  使用传统配置方式，建议配置环境变量以获得更好体验")

Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple
[0mNote: you may need to restart the kernel to use updated packages.
✅ OpenAI环境设置完成!
🔧 OpenAI API 配置信息:
  📡 配置来源: 环境变量 + 自定义API地址: https://vip.apiyi.com/v1
  🤖 模型: gpt-4o
  🌐 API地址: https://vip.apiyi.com/v1
  🔑 API密钥: sk-R2utG...B944

✅ 使用统一配置管理成功！


---

## 课程
工具使用（也叫函数调用）看起来复杂，但其实很简单！它就是将工具执行结果插入到对话中，让AI能调用外部功能。

**核心原理：**
- 普通对话：我们直接给AI发送文本
- 工具使用：我们让AI告诉我们要调用什么工具，然后把工具结果返回给AI

**工作流程：**
1. AI 说明要调用的工具名称和参数
2. 我们的程序执行这个工具
3. 把执行结果返回给AI继续对话

## 为什么需要工具使用？

工具使用让AI能力大幅扩展，可以处理复杂的实际任务：

**常见工具类型：**
- 📊 数据库查询：执行SQL语句，获取数据
- 🌐 网络请求：调用API，获取实时信息  
- 📁 文件操作：读写文件，处理文档
- 🧮 计算工具：数学运算，数据分析
- 📨 消息发送：邮件、短信、通知

## 实现工具使用的两个关键要素

**1. 系统提示词**
- 告诉AI有哪些工具可用
- 说明每个工具的用途和参数
- 定义工具调用的格式

**2. 控制逻辑**  
- 解析AI的工具调用请求
- 执行对应的工具函数
- 将结果返回给AI继续对话

### 工具使用路线图

*本课程教授我们当前的工具使用格式。但是，我们将在不久的将来更新和改进工具使用功能，包括：*
* *更简化的函数定义和调用格式*
* *更强健的错误处理和边缘情况覆盖*
* *与我们 API 其余部分的更紧密集成*
* *更好的可靠性和性能，特别是对于更复杂的工具使用任务*

## 实战示例：SQL数据库查询工具

下面我们通过一个具体的SQL查询例子来学习工具使用。

### 1. 系统提示词设计

系统提示词需要包含：
- 工具使用的基本说明
- 具体工具的详细描述  
- 调用格式要求

**重要：** 使用 `<function_calls>` 标签是GPT专门训练的格式，建议严格遵循。

In [2]:
# 构建系统提示词 - 优化版本
system_prompt = """
你是一个智能数据分析助手，必须使用提供的工具来查询数据库。

## 可用工具

### sql_query
功能：执行SQL查询语句，获取数据库数据
参数：
- query (字符串): 要执行的SQL查询语句

## 重要规则

1. 当用户询问数据相关问题时，你必须使用sql_query工具查询
2. 不要直接回答，必须先调用工具获取数据
3. 工具调用后立即停止生成，等待工具结果

## 工具调用格式

当你需要查询数据时，严格按以下格式输出：

<function_calls>
<invoke name="sql_query">
<parameter name="query">SELECT * FROM users WHERE age > 25</parameter>
</invoke>
</function_calls>

## 示例对话

用户："查询年龄大于30的用户"
助手：我将为您查询年龄大于30的用户信息。

<function_calls>
<invoke name="sql_query">
<parameter name="query">SELECT * FROM users WHERE age > 30</parameter>
</invoke>
</function_calls>

注意：
- 必须使用工具获取数据，不能凭空回答
- SQL语句要准确，避免语法错误
- 工具调用后不要继续生成其他内容
"""

print("✅ 优化版系统提示词构建完成")


✅ 系统提示词构建完成


In [3]:
# 模拟SQL查询工具
def sql_query(query):
    """
    模拟执行SQL查询
    实际项目中这里会连接真实数据库
    """
    # 模拟数据库响应
    mock_data = {
        "users": [
            {"id": 1, "name": "张三", "age": 28, "city": "北京"},
            {"id": 2, "name": "李四", "age": 32, "city": "上海"}, 
            {"id": 3, "name": "王五", "age": 25, "city": "广州"},
            {"id": 4, "name": "赵六", "age": 30, "city": "深圳"}
        ]
    }
    
    print(f"🔍 执行SQL查询: {query}")
    
    # 简单模拟查询结果
    if "age > 25" in query:
        result = [user for user in mock_data["users"] if user["age"] > 25]
    elif "COUNT" in query.upper():
        result = [{"count": len(mock_data["users"])}]
    else:
        result = mock_data["users"]
    
    return result

# 测试工具函数
test_result = sql_query("SELECT * FROM users WHERE age > 25")
print("📋 查询结果:", test_result)


🔍 执行SQL查询: SELECT * FROM users WHERE age > 25
📋 查询结果: [{'id': 1, 'name': '张三', 'age': 28, 'city': '北京'}, {'id': 2, 'name': '李四', 'age': 32, 'city': '上海'}, {'id': 4, 'name': '赵六', 'age': 30, 'city': '深圳'}]


In [4]:
# 工具调用解析函数
def parse_function_calls(response):
    """
    解析AI响应中的工具调用
    """
    import re
    
    # 查找function_calls标签
    pattern = r'<function_calls>(.*?)</function_calls>'
    matches = re.findall(pattern, response, re.DOTALL)
    
    if not matches:
        return None
        
    # 解析工具调用内容
    call_content = matches[0]
    
    # 提取工具名称
    name_pattern = r'<invoke name="([^"]+)">'
    name_match = re.search(name_pattern, call_content)
    if not name_match:
        return None
        
    tool_name = name_match.group(1)
    
    # 提取参数
    param_pattern = r'<parameter name="([^"]+)">([^<]+)</parameter>'
    param_matches = re.findall(param_pattern, call_content)
    
    parameters = {}
    for param_name, param_value in param_matches:
        parameters[param_name] = param_value.strip()
    
    return {
        "name": tool_name,
        "parameters": parameters
    }

print("✅ 工具调用解析函数定义完成")


✅ 工具调用解析函数定义完成


### 2. 完整的工具使用流程

现在我们来演示完整的工具使用过程：


In [5]:
# 优化版工具使用示例
def run_tool_example():
    """
    演示完整的工具使用流程 - 优化版
    """
    print("=" * 60)
    print("🚀 开始工具使用演示（优化版）")
    print("=" * 60)
    
    # 用户请求
    user_query = "帮我查询一下年龄大于25岁的用户有哪些？"
    print(f"👤 用户提问: {user_query}")
    print()
    
    # 第一轮：AI调用工具
    print("🤖 AI第一轮响应:")
    response_1 = get_completion(user_query, system_prompt)
    print(f"原始响应: {response_1}")
    print()
    
    # 解析工具调用
    function_call = parse_function_calls(response_1)
    
    if function_call:
        print("🔧 ✅ 检测到工具调用:")
        print(f"   📋 工具名: {function_call['name']}")
        print(f"   📝 参数: {function_call['parameters']}")
        print()
        
        # 执行工具
        if function_call['name'] == 'sql_query':
            query = function_call['parameters']['query']
            result = sql_query(query)
            print(f"✅ 工具执行结果: {result}")
            print()
            
            # 构建包含结果的新提示
            follow_up_prompt = f"""
之前的查询：{user_query}

工具调用结果：
查询语句：{query}
查询结果：{result}

请根据查询结果给出详细的分析和回答。
"""
            
            # 第二轮：AI分析结果
            print("🤖 AI最终分析:")
            final_response = get_completion(follow_up_prompt, "")
            print(final_response)
    else:
        print("❌ 未检测到工具调用！")
        print("🔍 这可能是因为：")
        print("   1. 系统提示词不够明确")
        print("   2. AI模型没有按预期格式输出")
        print("   3. 解析函数有问题")
        print()
        
        # 备用方案：直接使用更强的提示
        print("🔄 尝试使用更明确的提示...")
        stronger_prompt = f"""
用户问题：{user_query}

请严格按照以下格式调用工具查询数据库：

<function_calls>
<invoke name="sql_query">
<parameter name="query">SELECT * FROM users WHERE age > 25</parameter>
</invoke>
</function_calls>

必须使用这个格式，不要添加其他内容。
"""
        
        response_2 = get_completion(stronger_prompt, system_prompt)
        print(f"强化提示响应: {response_2}")
        
        # 再次尝试解析
        function_call_2 = parse_function_calls(response_2)
        if function_call_2:
            print("🎉 第二次尝试成功检测到工具调用！")
            query = function_call_2['parameters']['query']
            result = sql_query(query)
            print(f"✅ 工具执行结果: {result}")
        else:
            print("❌ 第二次尝试仍然失败")
    
    print()
    print("=" * 60)
    print("✅ 工具使用演示完成")
    print("=" * 60)

# 运行优化版示例
run_tool_example()


🚀 开始工具使用演示
👤 用户提问: 帮我查询一下年龄大于25岁的用户有哪些？

🤖 AI第一轮响应:
好的，我将为您查询年龄大于25岁的用户信息。请稍等。


✅ 工具使用演示完成


In [None]:
# 添加一个简化且保证工作的示例
def guaranteed_tool_example():
    """
    简化的工具调用示例，确保能够工作
    """
    print("=" * 60)
    print("🎯 保证工作的工具调用示例")
    print("=" * 60)
    
    # 使用更直接的提示
    direct_prompt = """
请使用sql_query工具查询年龄大于25岁的用户。

严格按照以下格式输出：

<function_calls>
<invoke name="sql_query">
<parameter name="query">SELECT * FROM users WHERE age > 25</parameter>
</invoke>
</function_calls>

只输出上面的格式，不要添加任何其他文字。
"""
    
    print("🤖 发送直接的工具调用请求...")
    response = get_completion(direct_prompt, "")
    print(f"AI响应:\n{response}")
    print()
    
    # 解析工具调用
    function_call = parse_function_calls(response)
    if function_call:
        print("✅ 成功解析工具调用!")
        print(f"   工具名: {function_call['name']}")
        print(f"   查询语句: {function_call['parameters']['query']}")
        print()
        
        # 执行工具
        query = function_call['parameters']['query']
        result = sql_query(query)
        print(f"📊 查询结果:")
        for user in result:
            print(f"   👤 {user['name']}, 年龄: {user['age']}, 城市: {user['city']}")
        print()
        
        # 生成最终分析
        analysis_prompt = f"""
基于以下查询结果，请给出简洁的分析：

查询: {query}
结果: {result}

请用中文总结查询结果。
"""
        
        print("🤖 AI分析结果:")
        analysis = get_completion(analysis_prompt, "")
        print(analysis)
    else:
        print("❌ 工具调用解析失败")
        print("原始响应:", repr(response))
    
    print()
    print("=" * 60)
    print("✅ 示例完成")
    print("=" * 60)

# 运行保证工作的示例
guaranteed_tool_example()


In [None]:
# 多工具示例 - 计算器和天气查询
def calculator(expression):
    """安全计算数学表达式"""
    try:
        # 简单的安全检查
        allowed_chars = set('0123456789+-*/.()')
        if not all(c in allowed_chars or c.isspace() for c in expression):
            return {"error": "包含不允许的字符"}
        
        result = eval(expression)
        return {"result": result}
    except Exception as e:
        return {"error": str(e)}

def get_weather(city):
    """获取城市天气信息"""
    weather_data = {
        "北京": {"temperature": "15°C", "condition": "晴天", "humidity": "45%"},
        "上海": {"temperature": "18°C", "condition": "多云", "humidity": "60%"},
        "广州": {"temperature": "25°C", "condition": "小雨", "humidity": "75%"},
        "深圳": {"temperature": "26°C", "condition": "晴天", "humidity": "55%"}
    }
    return weather_data.get(city, {"error": "城市未找到"})

# 多工具系统提示词
multi_tool_prompt = """
你是一个智能助手，可以使用以下工具：

## 可用工具

### sql_query
功能：查询用户数据库
参数：query (字符串) - SQL查询语句

### calculator  
功能：执行数学计算
参数：expression (字符串) - 数学表达式

### get_weather
功能：查询城市天气
参数：city (字符串) - 城市名称

## 工具调用格式

<function_calls>
<invoke name="工具名">
<parameter name="参数名">参数值</parameter>
</invoke>
</function_calls>

根据用户问题选择合适的工具。如果需要数据查询，使用sql_query；如果需要计算，使用calculator；如果需要天气信息，使用get_weather。
"""

def multi_tool_example():
    """
    多工具使用示例
    """
    print("=" * 60)
    print("🛠️  多工具使用演示")
    print("=" * 60)
    
    # 测试不同类型的请求
    test_cases = [
        "计算 (25 + 30) * 2 的结果",
        "查询北京的天气情况", 
        "统计数据库中有多少个用户"
    ]
    
    for i, query in enumerate(test_cases, 1):
        print(f"\n🔹 测试 {i}: {query}")
        print("-" * 40)
        
        # 直接请求工具调用
        tool_request = f"""
用户请求: {query}

请选择合适的工具并调用。只输出工具调用格式，不要添加其他文字。
"""
        
        response = get_completion(tool_request, multi_tool_prompt)
        print(f"AI响应: {response}")
        
        # 解析并执行工具
        function_call = parse_function_calls(response)
        if function_call:
            tool_name = function_call['name']
            params = function_call['parameters']
            print(f"✅ 调用工具: {tool_name}")
            print(f"📝 参数: {params}")
            
            # 执行对应工具
            if tool_name == 'calculator':
                result = calculator(params.get('expression', ''))
            elif tool_name == 'get_weather':
                result = get_weather(params.get('city', ''))
            elif tool_name == 'sql_query':
                # 模拟用户计数查询
                if 'COUNT' in params.get('query', '').upper():
                    result = [{"count": 4}]
                else:
                    result = sql_query(params.get('query', ''))
            else:
                result = {"error": f"未知工具: {tool_name}"}
            
            print(f"🎯 执行结果: {result}")
        else:
            print("❌ 未检测到工具调用")

# 运行多工具示例
multi_tool_example()


### 3. 关键要点总结

**系统提示词要点：**
- 📝 清晰描述工具功能和参数
- 🎯 提供具体调用格式示例  
- ⚠️ 说明使用注意事项

**控制逻辑要点：**
- 🔍 解析AI的工具调用请求
- ⚡ 执行对应的工具函数
- 🔄 返回结果给AI继续对话

**最佳实践：**
- 使用标准 `<function_calls>` 格式
- 添加清晰的错误处理
- 提供完整的使用文档


## 扩展练习

尝试添加更多工具类型：

```python
# 示例：添加计算器工具
def calculator(expression):
    """安全计算数学表达式"""
    try:
        # 安全计算（实际项目中需要更严格的安全检查）
        result = eval(expression)
        return {"result": result}
    except Exception as e:
        return {"error": str(e)}

# 示例：添加天气查询工具  
def get_weather(city):
    """获取城市天气信息"""
    # 模拟天气数据
    weather_data = {
        "北京": {"temperature": "15°C", "condition": "晴天"},
        "上海": {"temperature": "18°C", "condition": "多云"},
        "广州": {"temperature": "25°C", "condition": "小雨"}
    }
    return weather_data.get(city, {"error": "城市未找到"})
```

**挑战任务：**
1. 为这些新工具编写系统提示词
2. 修改解析逻辑支持多种工具
3. 实现工具链调用（一个工具的结果作为另一个工具的输入）


### 3. 工具使用的关键要点

**系统提示词设计：**
- 📝 清晰描述每个工具的功能和参数
- 🎯 给出具体的调用格式示例
- ⚠️ 说明注意事项和限制

**控制逻辑实现：**
- 🔍 准确解析AI的工具调用请求
- ⚡ 快速执行对应的工具函数  
- 🔄 将结果返回给AI继续对话

**最佳实践：**
- 使用标准的 `<function_calls>` 格式
- 工具函数要有清晰的错误处理
- 系统提示词要包含完整的使用说明
