提示最初是自然语言处理技术人员为特定领域任务设计出来的一种输入形式或模板，在ChatGPT 引发大模型广泛关注之后，提示成为用户与大模型交互输入的代称。
编写提示指令最重要的一点是，清晰、具体。编写者要明确自己的需求，在提示中不应该存在歧义。值得注意的是，很多人在写提示时将清晰具体误解成短小精悍，事实上，提示的质量并不和其长度挂钩。有时候，较长的提示会提供丰富的上下文，帮助大模型去理解自己的需求，增强大模型的语义理解能力。为了能够使大模型能够更好地理解用户的问题或需求，在进行智能客服问答时，我们可以利用提示设计技巧来优化大模型的回答。

# 1.预防提示注入
提示注入（Prompt Rejection）是指用户输入的文本可能包含和预设提示 相冲突的内容，如果不加分隔，这些输入就可能“注入”并操纵语言模型，导致大模型产生毫无关联的输出。简单来说，提示实质是一段用提示模板加查询指令的文本，我们可以用特殊符号将查询与注入分隔，避免混淆。这些特殊符号可以是```，”””，< >，<tag> </tag>等。以下是一段代码示例：

In [4]:
from zhipuai import ZhipuAI

# 请根据大模型要求，自行申请并替换API
client = ZhipuAI(api_key="******")

text='介绍一下华为watchGT4'
prompt=f"""
现在你要扮演一位客服，来回答用户提出的问题。\
你回答的语气要保持谦逊、礼貌。\
你的回答要根据提供的规则来回答，不要回答无关内容，尽量保持简洁。\
如果你无法回答用户提出的问题，你要回复无法回答该问题，请联系人工客服。

规则：
商品名称：华为watchGT4 \
表盘大小：46mm、41mm \
商品规格：\
46mm包含三种：\
1.颜色：云杉绿，表带：立体编织复合表带，价格：2088，是否有货：无 \
2.颜色：山茶棕，表带：经典皮质表带，价格：1788，是否有货：有 \
3.颜色：曜石黑，表带：氟橡胶表带，价格：1588，是否有货：有 \
41mm包含三种：\
1.颜色：幻夜黑，表带：氟橡胶表带，价格：1488，是否有货：有 \
2.颜色：凝霜白，表带：细腻皮质表带，价格：1688，是否有货：有 \
3.颜色：皓月银，表带：间金工艺表带，价格：2688，是否有货：有 \

你要回答用三个反引号括起来的问题：```{text}```
"""

response = client.chat.completions.create(
  model="glm-4-0520",
  messages=[
    {
      "role": "system",
      "content": "你是一个乐于解答各种问题的助手，你的任务是为用户提供专业、准确、有见地的建议。" 
    },
    {
      "role": "user",
      "content": prompt
    }
  ],
  top_p= 0.7,
  temperature= 0.95,
  max_tokens=4095,
  stream=True,
)
answer=str()
for trunk in response:
  answer+=trunk.choices[0].delta.content
print(answer)


华为watchGT4是一款智能手表，提供两种表盘大小供您选择：46mm和41mm。46mm版本有三种款式：云杉绿（立体编织复合表带，价格2088元，暂无货）、山茶棕（经典皮质表带，价格1788元，有货）和曜石黑（氟橡胶表带，价格1588元，有货）。41mm版本同样有三种款式：幻夜黑（氟橡胶表带，价格1488元，有货）、凝霜白（细腻皮质表带，价格1688元，有货）和皓月银（间金工艺表带，价格2688元，有货）。如有需要，欢迎选购。


# 2.结构化输出
结构化输出就是按照某种格式组织（例如JSON、HTML等）输出的内容。大模型的输出一般是连续的文本，然而在一些特殊的任务中，需要大模型输出结构化的文本以便进行下一步的处理。

In [5]:
text='介绍一下华为watchGT4，以json格式输出，其中包含以下键：表盘大小，颜色，表带，价格和是否有货。'
prompt=f"""
现在你要扮演一位客服，来回答用户提出的问题。\
你回答的语气要保持谦逊、礼貌。\
你的回答要根据提供的规则来回答，不要回答无关内容，尽量保持简洁。\
如果你无法回答用户提出的问题，你要回复无法回答该问题，请联系人工客服。

规则：
商品名称：华为watchGT4 \
表盘大小：46mm、41mm \
商品规格：\
46mm包含三种：\
1.颜色：云杉绿，表带：立体编织复合表带，价格：2088，是否有货：无 \
2.颜色：山茶棕，表带：经典皮质表带，价格：1788，是否有货：有 \
3.颜色：曜石黑，表带：氟橡胶表带，价格：1588，是否有货：有 \
41mm包含三种：\
1.颜色：幻夜黑，表带：氟橡胶表带，价格：1488，是否有货：有 \
2.颜色：凝霜白，表带：细腻皮质表带，价格：1688，是否有货：有 \
3.颜色：皓月银，表带：间金工艺表带，价格：2688，是否有货：有 \

你要回答用三个反引号括起来的问题：```{text}```
"""

In [6]:
# chatGLM输出
response = client.chat.completions.create(
    model="glm-4-0520",
    messages=[
        {
            "role": "system",
            "content": "你是一个乐于解答各种问题的助手，你的任务是为用户提供专业、准确、有见地的建议。" 
            },
        {
            "role": "user",
            "content": prompt }],
    top_p= 0.7,
    temperature= 0.95,
    max_tokens=4095,
    stream=True,
)
answer=str()
for trunk in response:
    answer+=trunk.choices[0].delta.content
print(answer)

```json
{
  "46mm": [
    {
      "颜色": "云杉绿",
      "表带": "立体编织复合表带",
      "价格": 2088,
      "是否有货": "无"
    },
    {
      "颜色": "山茶棕",
      "表带": "经典皮质表带",
      "价格": 1788,
      "是否有货": "有"
    },
    {
      "颜色": "曜石黑",
      "表带": "氟橡胶表带",
      "价格": 1588,
      "是否有货": "有"
    }
  ],
  "41mm": [
    {
      "颜色": "幻夜黑",
      "表带": "氟橡胶表带",
      "价格": 1488,
      "是否有货": "有"
    },
    {
      "颜色": "凝霜白",
      "表带": "细腻皮质表带",
      "价格": 1688,
      "是否有货": "有"
    },
    {
      "颜色": "皓月银",
      "表带": "间金工艺表带",
      "价格": 2688,
      "是否有货": "有"
    }
  ]
}
```


# 3.要求模型扮演角色回答问题
通过将大模型置于特定角色的位置上，可以引导大模型从该角色的视角来理解和解决具体问题，并基于特定背景知识提供更准确和相关的答案。我们可以要求大模型扮演成客服角色，检查提供的商品资料是否满足用户的需求。

In [11]:
text='手表支持支付宝支付吗'
prompt=f"""
现在你要扮演一位客服，来回答用户提出的问题。\
你回答的语气要保持谦逊、礼貌。\
你的回答要根据提供的规则来回答，不要回答无关内容，尽量保持简洁。\
如果你无法回答用户提出的问题，你要回复“无法回答该问题，请联系人工客服”。

规则：
商品名称：华为watchGT4 \
具体功能：\
1.融合智能检测技术，计算每日活动小时数、锻炼时长和活动热量，计算每日卡路里缺口。\
2.支持走跑骑游多种专业运动模式，实时监测各项运动数据，提供专业的训练建议。\
3.记录心率、跑步轨迹和睡眠监测。\
4.可以查看微信消息并且可以快速回复，以及微信支付。\
5.支持蓝牙通话。\
6.集成多种应用。\
7.支撑NFC，可以解锁门禁和刷交通卡。\
8.兼容安卓和iOS系统。\
9.超长续航，常规场景可使用8天，最长使用场景可使用14天。

你要回答用三个反引号括起来的问题：```{text}```
"""

In [None]:
# chatGLM输出
response = client.chat.completions.create(
    model="glm-4-plus",
    messages=[
        {
            "role": "system",
            "content": "你是一个乐于解答各种问题的助手，你的任务是为用户提供专业、准确、有见地的建议。" 
            },
        {
            "role": "user",
            "content": prompt }],
    top_p= 0.7,
    temperature= 0.95,
    max_tokens=4095,
    stream=True,
)
answer=str()
for trunk in response:
    answer+=trunk.choices[0].delta.content
print(answer)

```很抱歉，华为watchGT4目前不支持支付宝支付，但它支持微信支付功能。如果您有其他问题，欢迎继续咨询。```


# 4.少样本学习
在有些场景下，我们期望自定义模型的输出格式。为了满足这个需求，我们可以使用少样本“Few-shot”，即在模型执行任务前，提供少量示例告诉模型期望的输出格式。

接下来的示例中，我们要求智能客服在回答用户问题的时候，首先向用户问好，然后根据相应的规则来回答用户的问题，最后提示用户如果无法解决问题可以联系人工客服介入做进一步处理。

In [14]:
text='我买的衣服穿着不合适，但是价签被我撕了，还能退货吗？'
prompt=f"""
现在你要扮演一位客服，来回答用户提出的问题。\
你回答的语气要保持谦逊、礼貌。\
你的回答要根据提供的规则来回答，不要回答无关内容，回答尽量保持简洁。\
如果你无法回答用户提出的问题，你要回复无法回答该问题，请联系人工客服。

规则：
买家提出“七天无理由退货"服务的申请条件：
1、买家在签收商品之日起七天内，对支持七天无理由退货并符合完好标准的商品，可发起七天无理由退货申请。
2、选择无理由退货的买家应当自收到商品之日起七天内向卖家发出退货通知。 七天期间自物流显示签收商品的次日零时开始起算，满168小时为7天。
3、买家退回的商品应当完好。
4、支持七天无理由退货的商品，卖家单方或买卖双方约定不支持七天无理由退货的行为无效。
5、不同品类的商品七天无理由退货适用与否情形：

你的回答可以遵循以下风格：
<用户>：卖家在商品上标了七天无理由退货，但是反悔了怎么办？
<客服>：尊敬的客户你好，根据“七天无理由退货"服务的申请条件的第4条，支持七天无理由退货的商品，卖家单方或买卖双方约定
不支持七天无理由退货的行为无效。你可以继续和商家沟通退货，如果无法解决，可联系人工客服介入。
你要回答用三个反引号括起来的问题:```{text}```
"""

In [15]:
# chatGLM输出
response = client.chat.completions.create(
    model="glm-4-plus",
    messages=[
        {
            "role": "system",
            "content": "你是一个乐于解答各种问题的助手，你的任务是为用户提供专业、准确、有见地的建议。" 
            },
        {
            "role": "user",
            "content": prompt }],
    top_p= 0.7,
    temperature= 0.95,
    max_tokens=4095,
    stream=True,
)
answer=str()
for trunk in response:
    answer+=trunk.choices[0].delta.content
print(answer)

```尊敬的客户你好，根据“七天无理由退货"服务的申请条件，退回的商品应当完好。如果价签被撕，可能会影响商品的完好性。建议你先与卖家沟通说明情况，看是否可以协商解决。如果协商不成，请联系人工客服进一步协助。```


# 5.迭代优化
对大多数人来说，很难一次就编写出完美合适的提示。因此，我们需要先编写出基本的提示，之后根据模型的输出，不断调整提示的内容，进行迭代优化，直至编写出最合适的提示。

接下来，通过示例介绍提示优化迭代的思路。给出一个产品的资料说明，要求大模型基于这些资料生成一份产品描述。步骤如下。

1）首先制定一个初始的提示，这个提示中包含了我们基本的需求。

初始提示

In [17]:
#给定一份椅子的资料页。描述说它属于中世纪灵感系列，产自意大利，并介绍了材料、构造、尺寸、可选配件等参数。假设您想要使用这份说明书帮助营销团队为电商平台撰写营销描述稿
fact_sheet_chair = """
概述
美丽的中世纪风格办公家具系列的一部分，包括文件柜、办公桌、书柜、会议桌等。
多种外壳颜色和底座涂层可选。
可选塑料前后靠背装饰（SWC-100）或10种面料和6种皮革的全面装饰（SWC-110）。
底座涂层选项为：不锈钢、哑光黑色、光泽白色或铬。
椅子可带或不带扶手。
适用于家庭或商业场所。
符合合同使用资格。
结构
五个轮子的塑料涂层铝底座。
气动椅子调节，方便升降。
尺寸
宽度53厘米|20.87英寸
深度51厘米|20.08英寸
高度80厘米|31.50英寸
座椅高度44厘米|17.32英寸
座椅深度41厘米|16.14英寸
选项
软地板或硬地板滚轮选项。
两种座椅泡沫密度可选：中等（1.8磅/立方英尺）或高（2.8磅/立方英尺）。
无扶手或8个位置PU扶手。
材料
外壳底座滑动件
改性尼龙PA6/PA66涂层的铸铝。
外壳厚度：10毫米。
座椅
HD36泡沫
原产国
意大利
"""
prompt = f"""
您的任务是帮助营销团队基于技术说明书创建一个产品的营销描述。
根据```标记的技术说明书中提供的信息，编写一个产品描述。
技术说明: ```{fact_sheet_chair}```
"""


In [18]:
# chatGLM输出
response = client.chat.completions.create(
    model="glm-4-plus",
    messages=[
        {
            "role": "system",
            "content": "你是一个乐于解答各种问题的助手，你的任务是为用户提供专业、准确、有见地的建议。" 
            },
        {
            "role": "user",
            "content": prompt }],
    top_p= 0.7,
    temperature= 0.95,
    max_tokens=4095,
    stream=True,
)
answer=str()
for trunk in response:
    answer+=trunk.choices[0].delta.content
print(answer)

**产品描述：**

**经典与舒适的完美融合——中世纪风格办公家具系列**

为您的工作空间注入一抹经典与现代的完美结合，我们的中世纪风格办公家具系列将优雅与实用性融为一体。无论是文件柜、办公桌、书柜还是会议桌，每一件产品都经过精心设计，旨在提升您的办公体验。

**个性化定制，彰显独特品味**

- **多色选择**：多种外壳颜色和底座涂层选项，满足您对个性化的追求。
- **装饰风格**：可选塑料前后靠背装饰（SWC-100）或10种面料和6种皮革的全面装饰（SWC-110），轻松匹配您的室内装饰风格。
- **底座涂层**：不锈钢、哑光黑色、光泽白色或铬，多种底座涂层选项，彰显不同质感。

**人性化设计，舒适体验**

- **灵活调节**：五个轮子的塑料涂层铝底座，搭配气动椅子调节功能，方便升降，适应不同身高需求。
- **尺寸适中**：宽度53厘米，深度51厘米，高度80厘米，座椅高度44厘米，座椅深度41厘米，科学设计，确保长时间使用的舒适度。
- **滚轮选项**：软地板或硬地板滚轮选项，适应不同地面环境。

**高品质材料，经久耐用**

- **优质材料**：外壳底座滑动件采用改性尼龙PA6/PA66涂层的铸铝，外壳厚度达10毫米，坚固耐用。
- **舒适座椅**：HD36泡沫座椅，提供两种泡沫密度选择（中等1.8磅/立方英尺或高2.8磅/立方英尺），满足不同坐感需求。
- **扶手选择**：无扶手或8个位置PU扶手，灵活适应您的使用习惯。

**广泛适用，符合标准**

无论是家庭办公还是商业场所，我们的办公家具系列都能完美融入，提升空间品味。同时，产品符合合同使用资格，确保高品质与可靠性。

**原产国：意大利**

源自意大利的精湛工艺，每一件产品都凝聚了设计师的匠心独运和对细节的极致追求。

选择我们的中世纪风格办公家具系列，让您的办公空间焕发经典与时尚的魅力！


大模型很好地将产品的说明资料转变成了产品描述文案，但是这份产品描述太长了。当客服将这个产品描述发送给用户时，用户可能根本没有耐心看完这个冗长的文本。因此，进一步，需要在提示中限制产品描述的字数。

优化提示，给出产品描述字数限制。

In [19]:
# 优化后的 Prompt，要求生成描述不多于 50 字
prompt = f"""
您的任务是帮助营销团队基于技术说明书创建一个产品的零售网站描述。
根据```标记的技术说明书中提供的信息，编写一个产品描述。
使用最多80个字。
技术规格：```{fact_sheet_chair}```
"""

In [20]:
# chatGLM输出
response = client.chat.completions.create(
    model="glm-4-plus",
    messages=[
        {
            "role": "system",
            "content": "你是一个乐于解答各种问题的助手，你的任务是为用户提供专业、准确、有见地的建议。" 
            },
        {
            "role": "user",
            "content": prompt }],
    top_p= 0.7,
    temperature= 0.95,
    max_tokens=4095,
    stream=True,
)
answer=str()
for trunk in response:
    answer+=trunk.choices[0].delta.content
print(answer)

"优雅中世纪风格办公椅，多色可选，配塑料或全面装饰。铝底座，气动调节，适应各种地板。意大利制造，符合合同标准。"


这次生成的产品描述比第一次生成的简短了很多，但是我们发现，即使提示中设置了使用最多50个字，生成的内容还是超出了限制。这是因为语言模型计算和判断文本长度时依赖于分词器，而分词器在字符统计方面并不完全准确。目前有多种方法可尝试控制语言模型生成输出的长度，例如指定语句数、词数、汉字数等。虽然语言模型对长度约束的遵循并非100%精确，但通过迭代测试可以找到最佳的长度提示表达式，使生成文本基本符合长度要求。这需要开发者对语言模型的长度判断机制有一定理解，并愿意多次试验来确定最可靠的长度设置方法。
由于减少了产品描述的字数，模型在生成的过程中会尽量使用简洁的语言，同时也会舍弃部分信息。在技术说明书中有很多具体数字参数的说明，但消费者并不关注这些，更想从宏观层面了解该产品，因此需要大模型在生成产品描述时更加侧重对产品的概述，减少具体参数的说明。

优化提示，侧重对产品的概述。

In [21]:
# 优化后的 Prompt，说明面向对象，应具有什么性质且侧重于什么方面
prompt = f"""
您的任务是帮助客服团队基于技术说明书创建一个产品的描述。
根据```标记的技术说明书中提供的信息，编写一个产品描述。
该描述面向卖家，因此应侧重对产品的概述，减少具体参数的说明。
使用最多80个字。
技术规格： ```{fact_sheet_chair}```
"""

In [22]:
# chatGLM输出
response = client.chat.completions.create(
    model="glm-4-plus",
    messages=[
        {
            "role": "system",
            "content": "你是一个乐于解答各种问题的助手，你的任务是为用户提供专业、准确、有见地的建议。" 
            },
        {
            "role": "user",
            "content": prompt }],
    top_p= 0.7,
    temperature= 0.95,
    max_tokens=4095,
    stream=True,
)
answer=str()
for trunk in response:
    answer+=trunk.choices[0].delta.content
print(answer)

中世纪风格办公家具系列，多色可选，配塑料或全面装饰。铝底座带气动调节，适家庭/商业，符合合同标准。意大利制造。


修改大模型输出为表格形式。

In [23]:
# 要求它抽取信息并组织成表格，并指定表格的列、表名和格式
prompt = f"""
您的任务是帮助客服团队基于技术说明书创建一个产品的描述。
根据```标记的技术说明书中提供的信息，编写一个产品描述。
该描述面向卖家，因此应侧重对产品的概述，减少具体参数的说明。
使用最多50个单词。
在描述之后，包括一个表格，提供产品的尺寸。表格应该有两列。第一列包括尺寸的名称。第二列只包括英寸的
测量值。
给表格命名为“产品尺寸”。
将所有内容格式化为可用于网站的HTML格式。将描述放在<div>元素中。
技术规格： ```{fact_sheet_chair}```
"""

In [24]:
# chatGLM输出
response = client.chat.completions.create(
    model="glm-4-plus",
    messages=[
        {
            "role": "system",
            "content": "你是一个乐于解答各种问题的助手，你的任务是为用户提供专业、准确、有见地的建议。" 
            },
        {
            "role": "user",
            "content": prompt }],
    top_p= 0.7,
    temperature= 0.95,
    max_tokens=4095,
    stream=True,
)
answer=str()
for trunk in response:
    answer+=trunk.choices[0].delta.content
print(answer)

```html
<div>
  美丽的中世纪风格办公家具系列，多种颜色和装饰可选。带气动调节和稳固底座，适用于家庭或商业场所，符合合同使用资格。
</div>

<table>
  <caption>产品尺寸</caption>
  <tr>
    <th>尺寸名称</th>
    <th>英寸</th>
  </tr>
  <tr>
    <td>宽度</td>
    <td>20.87</td>
  </tr>
  <tr>
    <td>深度</td>
    <td>20.08</td>
  </tr>
  <tr>
    <td>高度</td>
    <td>31.50</td>
  </tr>
  <tr>
    <td>座椅高度</td>
    <td>17.32</td>
  </tr>
  <tr>
    <td>座椅深度</td>
    <td>16.14</td>
  </tr>
</table>
```


将HTML格式的元素转成具体的表格显示。

In [26]:
from IPython.display import display,HTML
display(HTML(answer))

尺寸名称,英寸
宽度,20.87
深度,20.08
高度,31.5
座椅高度,17.32
座椅深度,16.14


判断用户情绪。在智能客服问答场景中，判断用户的情绪是十分重要的，可以通过提示来判断用户输入文本的情绪。

In [27]:
review = """
我需要一盏漂亮的卧室灯，这款灯具有额外的储物功能，价格也不算太高。\
我很快就收到了它。在运输过程中，我们的灯绳断了，但是公司很乐意寄送了一个新的。\
几天后就收到了。这款灯很容易组装。我发现少了一个零件，于是联系了他们的客服，他们很快就给我寄来了缺
失的零件！\
在我看来，Lumina 是一家非常关心顾客和产品的优秀公司！
"""

prompt = f"""
判断以下用三个反引号分隔的产品评论的情感，如果是积极的就回答:感谢您对我们产品的支持！！，如果是消极的则回答:非常抱歉给您带来不愉快的体验，有任何问题请联系客服解决！！\
评论文本: ```{review}```
"""

In [28]:
# chatGLM输出
response = client.chat.completions.create(
    model="glm-4-plus",
    messages=[
        {
            "role": "system",
            "content": "你是一个乐于解答各种问题的助手，你的任务是为用户提供专业、准确、有见地的建议。" 
            },
        {
            "role": "user",
            "content": prompt }],
    top_p= 0.7,
    temperature= 0.95,
    max_tokens=4095,
    stream=True,
)
answer=str()
for trunk in response:
    answer+=trunk.choices[0].delta.content
print(answer)

感谢您对我们产品的支持！！
