# 2.3 大模型提示词工程入门

### **大模型时代的编程==提示词撰写**


提示词工程（Prompt Engineering）是一种系统性优化人工智能交互的关键技术，通过设计、调试和优化提示词（Prompt）来精准引导大语言模型（LLM）输出符合预期的结果。目前大部分应用都是通过提示词完成的。以下是其核心要点：

---

### **一、定义与核心目标**
1. **定义**  
   让大模型听懂人话。提示词工程将模糊的用户需求转化为结构化指令，通过控制输入内容来调节模型行为，减少输出的随机性并激发模型潜在能力。其本质是构建“人机协同”的标准化交互流程，而非简单的提问技巧。

2. **核心目标**

   
• **对齐意图**：将人类需求转化为模型可理解的表达（例如通过角色扮演框架“你是一名资深律师”）。

• **控制输出**：通过明确指令（如格式、长度）减少不确定性（例如要求生成Markdown表格）；  
• **激发能力**：解锁模型的推理、创作等高级能力（如用思维链CoT技术引导复杂问题解决）；  

---

### **二、关键技术要素**
1. **结构化设计**  
   • **模块化构建**：将提示拆解为角色、任务、约束等模块（例如“角色+背景+输出要求”框架）；  
   • **参数调节**：显式控制模型参数（如`temperature`调整输出随机性）；  
   • **多模型协同**：复杂任务中调用多模型接力处理（如先用GPT生成文案，再用Stable Diffusion生成配图）。

2. **优化方法**  
   • **迭代测试**：通过多轮调试优化提示词，类似代码测试流程；  
   • **领域知识嵌入**：在专业场景中注入术语和规范（如法律文件需引用《民法典》条款）；  
   • **上下文管理**：动态截断或保留历史对话以平衡Token消耗。

---

### **三、应用场景**
1. **内容创作**：生成营销文案、学术报告等结构化内容（如电商直播话术设计需包含价格锚点和互动机制）；  
2. **专业提效**：辅助法律合规审查、金融数据分析等需高准确度的任务；  
3. **跨模态生成**：在图像生成中描述风格参数（如“赛博朋克风格，霓虹灯光”）。

---

### **四、发展现状与挑战**
• **职业化趋势**：提示词工程师（Prompt Engineer）成为新兴岗位，需兼具领域知识和模型理解能力；  
• **技术挑战**：需解决模型幻觉、伦理风险（如偏见输出）及长上下文处理能力限制；  
• **工具支持**：火山云方舟等平台已提供提示词开发、评估的全流程管理工具。

通过系统化设计，提示词工程正推动AI从“工具”向“协作伙伴”演进，成为释放大模型潜力的核心方法论。

## 适用于函数调用的提示词

大模型控制无人机飞行，其实就是用大模型生成代码，控制无人机飞行，完成各类任务，最简单的方法就是通过提示词完成无人机相关的sdk函数调用。

### 角色使用
- system角色定义：如数据科学家（仅能调用分析类API）  
- user角色权限：提交原始数据请求，调用函数等


### 函数描述模板



#### **模板1：简单描述**
```text
aw.takeoff() - 起飞无人机。
aw.land() - 无人机着陆。
aw.get_drone_position() - 以与 X,Y,Z 坐标相对应的 3 个浮点数的列表形式返回无人机的当前位置。

```
*特点*：  
• 简单易懂  
• 适用于简单的函数调用  


#### **模板2：带参数描述**
```text
函数名: validate_user_registration  
功能: 验证用户注册信息合法性  
输入参数:  
- username: 字符串（长度4-20字符，仅允许字母数字）  
- password: 字符串（至少包含大写字母、数字和特殊符号）  
- email: 符合RFC 5322标准的邮箱地址  
返回值:  
- {"status": "success/error", "message": "详细描述"}
```
*特点*：  
• 参数添加表达式约束  
• 返回值结构预定义

---

#### **模板3：场景应用模板**
```text

可用函数列表：
1. 函数名: query_customer_orders  
   功能: 查询客户历史订单  
   输入:  
   - customer_id: 整数（必填）  
   - start_date: 日期格式YYYY-MM-DD（默认最近30天）  
   输出:  
   - JSON数组包含订单ID、金额、状态  
2. 函数名: update_order_status  
   功能: 修改订单物流状态  
   输入:  
   - order_id: 整数（必填）  
   - new_status: 枚举值["已发货","退货中","已完成"]  
   输出:  
   - {"affected_rows": 整数}
```
*优化点*：  
• 日期格式标准化（避免歧义）  
• 状态字段枚举限制

---


#### **错误处理模板**
```text
函数名: process_payment  
功能: 信用卡支付处理  
输入:  
- card_number: 字符串（符合Luhn算法校验）  
- amount: 数值（≥0.01美元）  
- currency: 枚举["USD","EUR"]  
错误代码:  
- 1001: 卡号无效  
- 1002: 余额不足  
- 1003: 货币不匹配  
返回:  
- 成功: {"transaction_id": 字符串}  
- 失败: {"error_code": 整数, "suggestion": 解决建议}
```
*优势*：  
• 输入参数算法级校验
• 错误代码与解决方案映射


### 大模型函数调用的发展

**提示词方式（Prompt）**、**函数调用方式（Function Call）** 和 **模型控制协议（MCP）** 对比

---

| **特性**                | **提示词方式（Prompt）**                                                                 | **函数调用方式（Function Call）**                                             | **模型控制协议（MCP）**                                                     |
|-------------------------|----------------------------------------------------------------------------------------|-----------------------------------------------------------------------------|---------------------------------------------------------------------------|
| **核心原理**            | 通过自然语言描述任务，引导模型生成输出。                                                  | 模型生成 JSON 格式的调用请求，外部工具执行具体操作并返回结果。                       | 标准化协议，支持多模型协同、动态任务分配和实时监控。                               |
| **适用场景**            | 简单任务（如文本生成、问答、翻译）。                                                     | 复杂任务（如数据库查询、API 调用、计算任务）。                                   | 多模型协同任务（如文本生成 + 图像生成 + 数据分析）。                           |
| **灵活性**              | 高：可通过自然语言自由描述任务。                                                         | 中：任务范围受限于预定义函数。                                                 | 高：支持动态任务分配和多模型协同。                                             |
| **可控性**              | 低：输出结果可能偏离预期，需多次调试提示词。                                               | 高：通过结构化参数约束输出，减少模型幻觉。                                       | 高：通过配置文件定义模型行为和交互规则。                                       |
| **开发成本**            | 低：无需额外工具，直接通过自然语言交互。                                                   | 高：需预先定义函数并实现逻辑。                                                 | 高：需掌握协议规范并配置工具链。                                               |
| **效率**                | 低：复杂任务需多次交互，Token 消耗大。                                                    | 高：复杂任务可通过外部工具快速完成。                                             | 中：多模型协同需更多计算资源。                                                 |
| **标准化程度**          | 低：提示词设计依赖开发者经验。                                                           | 中：需遵循函数调用规范。                                                       | 高：统一接口和配置文件，降低集成难度。                                           |
| **示例**                | ```你是一名翻译，请将以下英文翻译为中文："Hello, world!"```                              | ```{"function": "get_weather", "parameters": {"location": "Beijing"}}```     | ```models: [{name: gpt-4, role: text_generator}, {name: sd, role: image_generator}]``` |
| **优点**                | 灵活性强，开发成本低。                                                                   | 可控性强，效率高。                                                             | 扩展性强，标准化程度高。                                                     |
| **缺点**                | 可控性差，效率低。                                                                       | 开发成本高，灵活性低。                                                         | 复杂度高，资源消耗大。                                                       |
| **未来优化方向**        | 结合强化学习自动生成高效提示词。                                                         | 支持动态函数注册和实时更新。                                                   | 更多厂商和开发者加入协议生态。                                                 |

---

### **总结**
1. **提示词方式**：适合快速验证和简单任务，但可控性和效率较低。  
2. **函数调用方式**：适合复杂任务，可控性和效率高，但开发成本较高。  
3. **MCP**：适合多模型协同任务，扩展性和标准化程度高，但复杂度和资源消耗较大。

根据具体任务需求选择合适的方式，或结合多种方式实现最佳效果。


## 无人机控制system角色

提示词描述如下：

```text
你是一个帮助我使用RflySim无人机模拟器的助手。  
当我要求你做某事时，你需要提供实现该任务所需的Python代码（仅使用AirSim和相关函数），并解释代码的功能。  
你只能使用我已经定义的函数，不能假设或使用任何你认为可能存在的其他函数。  
你可以使用简单的Python库函数，例如`math`和`numpy`。

回复均按照如下格式：
```python
aw.land()
```
此代码功能为无人起飞

```

## 函数描述

```text
以下是您可以用来命令无人机的一些功能。
aw.takeoff() - 起飞无人机。
aw.land() - 无人机着陆。
```

In [1]:
ARK_API_KEY="6e623313-5266-43b3-a42d-429b113e083e"

In [2]:
import os
from openai import OpenAI

# 请确保您已将 API Key 存储在环境变量 ARK_API_KEY 中
# 初始化Openai客户端
client = OpenAI(
    # 此为默认路径，您可根据业务所在地域进行配置
    base_url="https://ark.cn-beijing.volces.com/api/v3",
    api_key=ARK_API_KEY,
)

In [3]:
chat_history = []

In [4]:
def chat(prompt, chat_history):
    chat_history.append(
            {
                "role": "user",
                "content": prompt,
            }
    )
    completion = client.chat.completions.create(
        model="doubao-1-5-pro-32k-250115",
        messages=chat_history, #chat_history[-10:0]
        temperature=0.1,
    )

    content = completion.choices[0].message.content

    # 加入机器人回复，相当于保存全部的历史记录，多轮对话
    chat_history.append(
            {
                "role": "assistant",
                "content": content,
            }
        )

    return content

In [5]:
SYS_MSG="""
你是一个帮助我使用RflySim无人机模拟器的助手。  
当我要求你做某事时，你需要提供实现该任务所需的Python代码（仅使用RflySim和相关函数），并解释代码的功能。  
你只能使用我已经定义的函数，不能假设或使用任何你认为可能存在的其他函数。  
你可以使用简单的Python库函数，例如`math`和`numpy`。
"""
chat_history.append(
    {
        "role": "system",
        "content": SYS_MSG,
    }
)

In [6]:
knowledge_prompt="""
以下是您可以用来命令无人机的一些功能。

aw.takeoff() - 起飞无人机。
aw.land() - 无人机着陆。

回复均按照如下格式：
```python
i=1#这里输出python代码
```
此代码功能为赋值

你无需考虑aw的import问题，在环境中已经声明

"""

ret = chat(knowledge_prompt, chat_history)
ret

'### 起飞无人机\n```python\naw.takeoff()\n```\n此代码功能为调用`aw`对象的`takeoff`方法，使无人机起飞。\n\n### 无人机着陆\n```python\naw.land()\n```\n此代码功能为调用`aw`对象的`land`方法，使无人机着陆。'

In [7]:
chat_history

[{'role': 'system',
  'content': '\n你是一个帮助我使用RflySim无人机模拟器的助手。  \n当我要求你做某事时，你需要提供实现该任务所需的Python代码（仅使用RflySim和相关函数），并解释代码的功能。  \n你只能使用我已经定义的函数，不能假设或使用任何你认为可能存在的其他函数。  \n你可以使用简单的Python库函数，例如`math`和`numpy`。\n'},
 {'role': 'user',
  'content': '\n以下是您可以用来命令无人机的一些功能。\n\naw.takeoff() - 起飞无人机。\naw.land() - 无人机着陆。\n\n回复均按照如下格式：\n```python\ni=1#这里输出python代码\n```\n此代码功能为赋值\n\n你无需考虑aw的import问题，在环境中已经声明\n\n'},
 {'role': 'assistant',
  'content': '### 起飞无人机\n```python\naw.takeoff()\n```\n此代码功能为调用`aw`对象的`takeoff`方法，使无人机起飞。\n\n### 无人机着陆\n```python\naw.land()\n```\n此代码功能为调用`aw`对象的`land`方法，使无人机着陆。'}]

In [8]:
prompt = "起飞"
ret = chat(prompt, chat_history)
print(ret)

```python
aw.takeoff()
```
此代码功能为调用`aw`对象的`takeoff`方法，从而让无人机执行起飞操作。 


In [9]:
# 解析python代码
import re
def extract_python_code(content):
    """
    Extracts the python code from a response.
    :param content:
    :return:
    """
    code_block_regex = re.compile(r"```(.*?)```", re.DOTALL)
    code_blocks = code_block_regex.findall(content)
    if code_blocks:
        full_code = "\n".join(code_blocks)

        if full_code.startswith("python"):
            full_code = full_code[7:]

        return full_code
    else:
        return None

In [10]:
code = extract_python_code(ret)
print(code)

aw.takeoff()



In [11]:
chat_history

[{'role': 'system',
  'content': '\n你是一个帮助我使用RflySim无人机模拟器的助手。  \n当我要求你做某事时，你需要提供实现该任务所需的Python代码（仅使用RflySim和相关函数），并解释代码的功能。  \n你只能使用我已经定义的函数，不能假设或使用任何你认为可能存在的其他函数。  \n你可以使用简单的Python库函数，例如`math`和`numpy`。\n'},
 {'role': 'user',
  'content': '\n以下是您可以用来命令无人机的一些功能。\n\naw.takeoff() - 起飞无人机。\naw.land() - 无人机着陆。\n\n回复均按照如下格式：\n```python\ni=1#这里输出python代码\n```\n此代码功能为赋值\n\n你无需考虑aw的import问题，在环境中已经声明\n\n'},
 {'role': 'assistant',
  'content': '### 起飞无人机\n```python\naw.takeoff()\n```\n此代码功能为调用`aw`对象的`takeoff`方法，使无人机起飞。\n\n### 无人机着陆\n```python\naw.land()\n```\n此代码功能为调用`aw`对象的`land`方法，使无人机着陆。'},
 {'role': 'user', 'content': '起飞'},
 {'role': 'assistant',
  'content': '```python\naw.takeoff()\n```\n此代码功能为调用`aw`对象的`takeoff`方法，从而让无人机执行起飞操作。 '}]

## 请打开rflysim模拟器

In [12]:
#代码执行
import rflysim_wrapper
aw = rflysim_wrapper.RflySimWrapper()

No Redis labs


In [13]:
exec(code)

In [14]:
prompt = "降落吧，皮卡丘"
ret = chat(prompt, chat_history)
code = extract_python_code(ret)
print(code)
exec(code)

aw.land()

