In [None]:
# 安装OpenAI库 - 用于与GPT AI模型进行交互
%pip install openai==1.61.0

# 导入必要的Python库
import re          # 正则表达式库，用于文本模式匹配和搜索
import openai      # OpenAI官方库，用于调用GPT API
import os          # 系统库，用于读取环境变量

# 优先从环境变量读取API配置，如果没有则从IPython存储中检索
API_KEY = os.getenv('OPENAI_API_KEY')
BASE_URL = os.getenv('OPENAI_BASE_URL', 'https://api.openai.com/v1')
MODEL_NAME = os.getenv('OPENAI_MODEL_NAME', 'gpt-4o')

# 如果环境变量中没有API_KEY，尝试从IPython存储中获取
if not API_KEY:
    try:
        %store -r API_KEY      # 恢复API密钥
        %store -r MODEL_NAME   # 恢复模型名称
    except:
        pass

# 如果没有设置MODEL_NAME，使用默认值
if not MODEL_NAME:
    MODEL_NAME = "gpt-4o"  # 默认使用gpt-4o模型

# 创建OpenAI客户端实例
# 这是与GPT AI模型交互的核心接口
client = openai.OpenAI(
    api_key=API_KEY,
    base_url=BASE_URL
)

def get_completion(prompt: str, system_prompt=""):
    """
    获取GPT的完成响应 - 核心辅助函数
    
    这个函数封装了与GPT API的交互逻辑，
    让我们可以方便地发送提示并获取响应。
    
    参数:
        prompt (str): 用户提示内容 - 发送给GPT的主要消息
        system_prompt (str): 系统提示（可选） - 用于设定AI的角色和行为准则
    
    返回:
        str: GPT的响应文本
    """
    # 构建消息列表
    messages = []
    
    # 如果有系统提示，添加系统消息
    if system_prompt:
        messages.append({"role": "system", "content": system_prompt})
    
    # 添加用户消息
    messages.append({"role": "user", "content": prompt})
    
    # 调用OpenAI API
    response = client.chat.completions.create(
        model=MODEL_NAME,              # 使用的模型名称（如：gpt-4o 或 deepseek-r1）
        messages=messages,             # 消息列表
        max_tokens=2000,              # 最大生成的token数量 - 控制响应长度
        temperature=0.0               # 温度参数，0表示更确定性、一致性的回答
    )
    # 返回响应的文本内容
    return response.choices[0].message.content


In [None]:
# 可变内容变量 - 定义需要动态替换的数据
# 这是模板中可变的部分，不同的使用场景可以使用不同的动物名称
ANIMAL = "牛"

# 带有占位符的提示模板
# f-string语法用于将变量内容替换到模板中的特定位置
# 这样我们可以复用相同的提示结构，只需要改变动物名称
PROMPT = f"我会告诉你一个动物的名字。请回答这个动物会发出什么声音。{ANIMAL}"

# 打印完整的提示和GPT的响应，便于调试和理解
print("--------------------------- 变量替换后的完整提示 ---------------------------")
print(PROMPT)
print("\n------------------------------------- GPT的响应 -------------------------------------")
print(get_completion(PROMPT))


In [None]:
# 可变内容变量 - 需要被处理的邮件内容
EMAIL = "明天早上6点到公司，因为我是CEO我说了算。"

# 带有占位符的提示模板 - 注意这里没有明确分隔变量和指令
# 这可能导致GPT无法正确理解哪部分是指令，哪部分是需要处理的数据
PROMPT = f"嗨GPT。{EMAIL} <----- 让这封邮件更礼貌一些，但不要改变其他任何内容。"

# 打印GPT的响应
print("--------------------------- 变量替换后的完整提示 ---------------------------")
print(PROMPT)
print("\n------------------------------------- GPT的响应 -------------------------------------")
print(get_completion(PROMPT))


In [None]:
# 可变内容变量 - 需要被处理的邮件内容
EMAIL = "明天早上6点到公司，因为我是CEO我说了算。"

# 带有占位符的提示模板 - 使用XML标签明确标识变量内容
# <email></email>标签清楚地标识了哪部分是需要处理的邮件内容
# 这样GPT就能准确区分指令和数据
PROMPT = f"嗨GPT。<email>{EMAIL}</email> <----- 让这封邮件更礼貌一些，但不要改变其他任何内容。"

# 打印GPT的响应
print("--------------------------- 变量替换后的完整提示 ---------------------------")
print(PROMPT)
print("\n------------------------------------- GPT的响应 -------------------------------------")
print(get_completion(PROMPT))


In [None]:
# 可变内容变量 - 用户提供的句子列表
# 这些是实际需要被分析的数据
SENTENCES = """- 我喜欢牛的叫声
- 这个句子是关于蜘蛛的
- 这个句子看起来是关于狗的但实际上是关于猪的"""

# 带有占位符的提示模板 - 问题：没有清楚地分隔指令和数据
# 由于格式相似，Claude可能会将指令中的示例误认为是数据的一部分
PROMPT = f"""下面是一个句子列表。告诉我列表中的第二项。

- 每个都是关于动物的，比如兔子。
{SENTENCES}"""

# 打印Claude的响应
print("--------------------------- 变量替换后的完整提示 ---------------------------")
print(PROMPT)
print("\n------------------------------------- Claude的响应 -------------------------------------")
print(get_completion(PROMPT))


In [None]:
# 可变内容变量 - 用户提供的句子列表
SENTENCES = """- 我喜欢牛的叫声
- 这个句子是关于蜘蛛的
- 这个句子看起来是关于狗的但实际上是关于猪的"""

# 带有占位符的提示模板 - 使用XML标签解决方案
# <sentences></sentences>标签清楚地标识了用户数据的边界
# 这样Claude就不会将指令中的示例与实际数据混淆
PROMPT = f"""下面是一个句子列表。告诉我列表中的第二项。

- 每个都是关于动物的，比如兔子。
<sentences>
{SENTENCES}
</sentences>"""

# 打印Claude的响应
print("--------------------------- 变量替换后的完整提示 ---------------------------")
print(PROMPT)
print("\n------------------------------------- Claude的响应 -------------------------------------")
print(get_completion(PROMPT))


# 第四章：数据与指令分离（结构化提示工程）

- [课程](#课程)
- [练习](#练习)
- [示例演练场](#示例演练场)

## 设置

运行以下设置单元格来加载您的API密钥并建立`get_completion`辅助函数。

In [None]:
# 安装Anthropic库 - 用于与Claude AI模型进行交互
%pip install anthropic

# 导入必要的Python库
import re          # 正则表达式库，用于文本模式匹配和搜索
import anthropic   # Anthropic官方库，用于调用Claude API

# 从IPython存储中检索之前保存的配置变量
# 这些变量应该在之前的章节中已经设置过
%store -r API_KEY      # 恢复API密钥
%store -r MODEL_NAME   # 恢复模型名称

# 创建Anthropic客户端实例
# 这是与Claude AI模型交互的核心接口
client = anthropic.Anthropic(api_key=API_KEY)

def get_completion(prompt: str, system_prompt=""):
    """
    获取Claude的完成响应 - 核心辅助函数
    
    这个函数封装了与Claude API的交互逻辑，
    让我们可以方便地发送提示并获取响应。
    
    参数:
        prompt (str): 用户提示内容 - 发送给Claude的主要消息
        system_prompt (str): 系统提示（可选） - 用于设定AI的角色和行为准则
    
    返回:
        str: Claude的响应文本
    """
    # 创建消息请求 - 调用Claude API
    message = client.messages.create(
        model=MODEL_NAME,              # 使用的模型名称（如：claude-3-5-sonnet-20241022）
        max_tokens=2000,              # 最大生成的token数量 - 控制响应长度
        temperature=0.0,              # 温度参数，0表示更确定性、一致性的回答
        system=system_prompt,         # 系统提示，定义AI的角色和行为模式
        messages=[
          {"role": "user", "content": prompt}  # 用户消息 - 实际的提示内容
        ]
    )
    # 返回响应的文本内容（第一个内容块的文本）
    return message.content[0].text

---

## 课程

通常，我们不想每次都编写完整的提示，而是希望**创建可复用的提示模板，可以在提交给Claude之前通过动态输入数据进行修改**。如果您希望Claude每次都执行相同的任务逻辑，但处理的具体数据内容每次都不同，这种方法会非常有用。

幸运的是，我们可以通过**将提示的固定指令框架与可变的用户输入数据分离，然后在将完整提示发送给Claude之前动态地将用户输入替换到提示模板中**来相当容易地实现这一点。

下面，我们将逐步介绍如何编写可复用的提示模板，以及如何安全地替换和处理用户输入数据。

### 示例

在这第一个示例中，我们要求Claude充当动物叫声生成器。注意，提交给Claude的完整提示只是用输入（在这种情况下是"牛"）替换的提示模板。注意当我们打印完整提示时，单词"牛"通过f-string替换了`ANIMAL`占位符。

**注意：** 在实际应用中，您不必将占位符变量叫做任何特定的名称。我们在这个示例中称它为`ANIMAL`，但同样容易地，我们可以称它为`CREATURE`或`A`（尽管让您的变量名称具体且相关通常是好的，这样您的提示模板即使在没有替换的情况下也容易理解，这样有助于代码的可读性）。只要确保您为变量命名的任何内容都是您用于提示模板f-string的内容。

In [None]:
# 可变内容变量 - 定义需要动态替换的数据
# 这是模板中可变的部分，不同的使用场景可以使用不同的动物名称
ANIMAL = "牛"

# 带有占位符的提示模板
# f-string语法用于将变量内容替换到模板中的特定位置
# 这样我们可以复用相同的提示结构，只需要改变动物名称
PROMPT = f"我会告诉你一个动物的名字。请回答这个动物会发出什么声音。{ANIMAL}"

# 打印完整的提示和Claude的响应，便于调试和理解
print("--------------------------- 变量替换后的完整提示 ---------------------------")
print(PROMPT)
print("\n------------------------------------- Claude的响应 -------------------------------------")
print(get_completion(PROMPT))

为什么我们要像这样分离和替换输入呢？嗯，**提示模板简化了重复性任务**。假设您构建了一个提示结构，邀请第三方用户向提示提交内容（在这种情况下是他们想要生成声音的动物）。这些第三方用户不必编写甚至看到完整的提示。他们所要做的就是填写变量。

我们在这里使用变量和f-strings进行这种替换，但您也可以使用format()方法。

**注意：** 提示模板可以根据需要拥有任意数量的变量！

当引入这样的替换变量时，非常重要的是**确保Claude知道变量从哪里开始和结束**（与指令或任务描述相对）。让我们看一个指令和替换变量之间没有分离的示例。

对我们人类的眼睛来说，在下面的提示模板中变量从哪里开始和结束是非常清楚的。然而，在完全替换的提示中，这种划分变得不清楚。

In [None]:
# 可变内容变量 - 需要被处理的邮件内容
EMAIL = "明天早上6点到公司，因为我是CEO我说了算。"

# 带有占位符的提示模板 - 注意这里没有明确分隔变量和指令
# 这可能导致Claude无法正确理解哪部分是指令，哪部分是需要处理的数据
PROMPT = f"嗨Claude。{EMAIL} <----- 让这封邮件更礼貌一些，但不要改变其他任何内容。"

# 打印Claude的响应
print("--------------------------- 变量替换后的完整提示 ---------------------------")
print(PROMPT)
print("\n------------------------------------- Claude的响应 -------------------------------------")
print(get_completion(PROMPT))

在这里，**Claude认为"嗨Claude"是它应该重写的邮件的一部分**！您可以看出这一点，因为它在重写时以"尊敬的Claude"开头。对人类眼睛来说，这很清楚，特别是在提示模板中邮件的开始和结束位置，但在替换后的提示中就变得不那么清楚了。

我们如何解决这个问题？**将输入包装在XML标签中**！我们在下面做了这个，如您所见，输出中不再有"尊敬的Claude"。

[XML标签](https://docs.anthropic.com/claude/docs/use-xml-tags)是像`<tag></tag>`这样的尖括号标签。它们成对出现，由开始标签（如`<tag>`）和用`/`标记的结束标签（如`</tag>`）组成。XML标签用于包装内容，像这样：`<tag>content</tag>`。

**注意：** 虽然Claude可以识别和使用各种分隔符和定界符，但我们建议您**专门使用XML标签作为Claude的分隔符**，因为Claude经过专门训练，能够识别XML标签作为提示组织机制。除了函数调用之外，**没有Claude经过专门训练的特殊XML标签可以最大化提升您的性能**。我们有意让Claude在这方面非常灵活和可定制。

In [None]:
# 可变内容变量 - 需要被处理的邮件内容
EMAIL = "明天早上6点到公司，因为我是CEO我说了算。"

# 带有占位符的提示模板 - 使用XML标签明确标识变量内容
# <email></email>标签清楚地标识了哪部分是需要处理的邮件内容
# 这样Claude就能准确区分指令和数据
PROMPT = f"嗨Claude。<email>{EMAIL}</email> <----- 让这封邮件更礼貌一些，但不要改变其他任何内容。"

# 打印Claude的响应
print("--------------------------- 变量替换后的完整提示 ---------------------------")
print(PROMPT)
print("\n------------------------------------- Claude的响应 -------------------------------------")
print(get_completion(PROMPT))

让我们看另一个XML标签如何帮助我们的示例。

在下面的提示中，**Claude错误地解释了提示的哪个部分是指令对比输入**。由于格式的原因，它错误地认为`每个都是关于动物的，比如兔子`是列表的一部分，而用户（填写`SENTENCES`变量的人）可能并不希望这样。

In [None]:
# 可变内容变量 - 用户提供的句子列表
# 这些是实际需要被分析的数据
SENTENCES = """- 我喜欢牛的叫声
- 这个句子是关于蜘蛛的
- 这个句子看起来是关于狗的但实际上是关于猪的"""

# 带有占位符的提示模板 - 问题：没有清楚地分隔指令和数据
# 由于格式相似，Claude可能会将指令中的示例误认为是数据的一部分
PROMPT = f"""下面是一个句子列表。告诉我列表中的第二项。

- 每个都是关于动物的，比如兔子。
{SENTENCES}"""

# 打印Claude的响应
print("--------------------------- 变量替换后的完整提示 ---------------------------")
print(PROMPT)
print("\n------------------------------------- Claude的响应 -------------------------------------")
print(get_completion(PROMPT))

要解决这个问题，我们只需要**用XML标签包围用户输入的句子**。这向Claude显示了输入数据的开始和结束位置，尽管在`每个都是关于动物的，比如兔子。`之前有令人误解的连字符。

In [None]:
# 可变内容变量 - 用户提供的句子列表
SENTENCES = """- 我喜欢牛的叫声
- 这个句子是关于蜘蛛的
- 这个句子看起来是关于狗的但实际上是关于猪的"""

# 带有占位符的提示模板 - 使用XML标签解决方案
# <sentences></sentences>标签清楚地标识了用户数据的边界
# 这样Claude就不会将指令中的示例与实际数据混淆
PROMPT = f"""下面是一个句子列表。告诉我列表中的第二项。

- 每个都是关于动物的，比如兔子。
<sentences>
{SENTENCES}
</sentences>"""

# 打印Claude的响应
print("--------------------------- 变量替换后的完整提示 ---------------------------")
print(PROMPT)
print("\n------------------------------------- Claude的响应 -------------------------------------")
print(get_completion(PROMPT))

**注意：** 在"每个都是关于动物的"提示的错误版本中，我们不得不包含连字符来让Claude以我们想要的方式错误响应以用于此示例。这是关于提示工程的重要课程：**细节很重要**！总是值得**检查您的提示中的拼写错误和语法错误**。Claude对模式很敏感（在其早期，在微调之前，它是一个原始的文本预测工具），当您犯错误时它更可能犯错误，当您听起来聪明时它会更聪明，当您听起来愚蠢时它会更愚蠢，等等。

如果您想在不更改上述任何内容的情况下实验课程提示，请滚动到课程notebook的最底部访问[**示例演练场**](#示例演练场)。

---

## 练习
- [练习 4.1 - 俳句主题](#练习-41---俳句主题)
- [练习 4.2 - 带拼写错误的狗问题](#练习-42---带拼写错误的狗问题)
- [练习 4.3 - 狗问题第二部分](#练习-43---狗问题第二部分)

### 练习 4.1 - 俳句主题
修改`PROMPT`使其成为一个模板，该模板将接受一个名为`TOPIC`的变量并输出关于该主题的俳句。这个练习只是为了测试您对f-strings变量模板结构的理解。

In [None]:
# 可变内容变量
TOPIC = "猪"

# 带有占位符的提示模板
# 请在这里填写您的提示模板，使用变量 {TOPIC}
PROMPT = f"请为我写一首关于{TOPIC}的俳句。俳句是日本传统的短诗，包含三行，分别有5、7、5个音节。"

# 获取Claude的响应
response = get_completion(PROMPT)

# 评分练习正确性的函数
def grade_exercise(text):
    return bool(re.search("猪", text.lower()) and (re.search("俳句", text.lower()) or len(text.strip().split('\n')) >= 3))

# 打印Claude的响应
print("--------------------------- 变量替换后的完整提示 ---------------------------")
print(PROMPT)
print("\n------------------------------------- Claude的响应 -------------------------------------")
print(response)
print("\n------------------------------------------ 评分 ------------------------------------------")
print("本练习已正确解决:", grade_exercise(response))

❓ 如果您需要提示，请运行下面的单元格！

In [None]:
print("提示：创建一个提示，要求Claude写一首关于 {TOPIC} 的俳句。确保在提示中包含 'TOPIC' 变量，并提到 '俳句' 这个词。")

### 练习 4.2 - 带拼写错误的狗问题
通过添加XML标签来修复`PROMPT`，使Claude产生正确答案。

尽量不要改变提示的其他任何内容。混乱和错误百出的写作是故意的，这样您可以看到Claude如何对这些错误做出反应。

In [None]:
# 可变内容变量
QUESTION = "狗能是棕色的吗？"

# 带有占位符的提示模板
# 注意：这里的错误拼写和语法是故意的，用来展示Claude如何处理不规范的输入
PROMPT = f"嗨我是我有一个关于狗的问题杂乱文字 <question>{QUESTION}</question> 更多杂乱文字请帮助我非常感谢快速简短回答谢谢"

# 获取Claude的响应
response = get_completion(PROMPT)

# 评分练习正确性的函数
def grade_exercise(text):
    return bool(re.search("棕色", text.lower()) or re.search("brown", text.lower()))

# 打印Claude的响应
print("--------------------------- 变量替换后的完整提示 ---------------------------")
print(PROMPT)
print("\n------------------------------------- Claude的响应 -------------------------------------")
print(response)
print("\n------------------------------------------ 评分 ------------------------------------------")
print("本练习已正确解决:", grade_exercise(response))

❓ 如果您需要提示，请运行下面的单元格！

In [None]:
print("提示：使用XML标签（如 <question></question>）来包围 {QUESTION} 变量，这样Claude就能清楚地识别出哪部分是实际的问题。")

### 练习 4.3 - 狗问题第二部分
修复`PROMPT`但**不要**添加XML标签。相反，只从提示中删除一两个词。

就像上面的练习一样，尽量不要改变提示的其他任何内容。这将向您展示Claude可以解析和理解什么样的语言。

In [None]:
# 可变内容变量
QUESTION = "狗能是棕色的吗？"

# 带有占位符的提示模板
# 修复方法：移除一些可能干扰理解的词语
PROMPT = f"嗨我是我有一个关于狗的问题 {QUESTION} 请帮助我非常感谢快速简短回答谢谢"

# 获取Claude的响应
response = get_completion(PROMPT)

# 评分练习正确性的函数
def grade_exercise(text):
    return bool(re.search("棕色", text.lower()) or re.search("brown", text.lower()))

# 打印Claude的响应
print("--------------------------- 变量替换后的完整提示 ---------------------------")
print(PROMPT)
print("\n------------------------------------- Claude的响应 -------------------------------------")
print(response)
print("\n------------------------------------------ 评分 ------------------------------------------")
print("本练习已正确解决:", grade_exercise(response))

❓ 如果您需要提示，请运行下面的单元格！

In [None]:
print("提示：尝试删除一些可能让Claude混淆的无意义文字，让问题更清晰。特别注意那些可能被误认为是问题一部分的词语。")

### 恭喜！

如果您已经解决了到目前为止的所有练习，您就可以进入下一章了。祝您提示工程愉快！

---

## 示例演练场

这是一个供您自由实验本课程中显示的提示示例的区域，您可以调整提示来看看它如何影响Claude的响应。

In [None]:
# 可变内容变量
ANIMAL = "牛"

# 带有占位符的提示模板
PROMPT = f"我会告诉你一个动物的名字。请回答这个动物会发出什么声音。{ANIMAL}"

# 打印Claude的响应
print("--------------------------- 变量替换后的完整提示 ---------------------------")
print(PROMPT)
print("\n------------------------------------- Claude的响应 -------------------------------------")
print(get_completion(PROMPT))

In [None]:
# 可变内容变量
EMAIL = "明天早上6点到公司，因为我是CEO我说了算。"

# 带有占位符的提示模板
PROMPT = f"嗨Claude。{EMAIL} <----- 让这封邮件更礼貌一些，但不要改变其他任何内容。"

# 打印Claude的响应
print("--------------------------- 变量替换后的完整提示 ---------------------------")
print(PROMPT)
print("\n------------------------------------- Claude的响应 -------------------------------------")
print(get_completion(PROMPT))

In [None]:
# 可变内容变量
EMAIL = "明天早上6点到公司，因为我是CEO我说了算。"

# 带有占位符的提示模板
PROMPT = f"嗨Claude。<email>{EMAIL}</email> <----- 让这封邮件更礼貌一些，但不要改变其他任何内容。"

# 打印Claude的响应
print("--------------------------- 变量替换后的完整提示 ---------------------------")
print(PROMPT)
print("\n------------------------------------- Claude的响应 -------------------------------------")
print(get_completion(PROMPT))

In [None]:
# 可变内容变量
SENTENCES = """- 我喜欢牛的叫声
- 这个句子是关于蜘蛛的
- 这个句子看起来是关于狗的但实际上是关于猪的"""

# 带有占位符的提示模板
PROMPT = f"""下面是一个句子列表。告诉我列表中的第二项。

- 每个都是关于动物的，比如兔子。
{SENTENCES}"""

# 打印Claude的响应
print("--------------------------- 变量替换后的完整提示 ---------------------------")
print(PROMPT)
print("\n------------------------------------- Claude的响应 -------------------------------------")
print(get_completion(PROMPT))

In [None]:
# Variable content
SENTENCES = """- I like how cows sound
- This sentence is about spiders
- This sentence may appear to be about dogs but it's actually about pigs"""

# Prompt template with a placeholder for the variable content
PROMPT = f""" Below is a list of sentences. Tell me the second item on the list.

- Each is about an animal, like rabbits.
<sentences>
{SENTENCES}
</sentences>"""

# Print Claude's response
print("--------------------------- Full prompt with variable substutions ---------------------------")
print(PROMPT)
print("\n------------------------------------- Claude's response -------------------------------------")
print(get_completion(PROMPT))