In [None]:
# 当使用 LLM 构建应用程序时，实践层面上很难第一次尝试就成功获得适合最终应用的 Prompt。但这并不重要，只要
# 您有一个好的迭代过程来不断改进您的 Prompt，那么您就能够得到一个适合任务的 Prompt。虽然相比训练机器学习模
# 型，在 Prompt 方面一次成功的几率可能会高一些，但正如上所说， Prompt 是否一次完善并不重要。最重要的是层层
# 迭代为您的应用程序找到有效 Prompt 的过程。
# 因此在本章中，我们将以产品说明书中生成营销文案为例，来展示一些流程框架，并提示您思考如何层层迭代地分析和完善您的 Prompt。
# 在吴恩达（Andrew Ng，原教程作者）的机器学习课程中展示过一张图表，说明了机器学习开发的流程。通常是先有一个想法，然后再
# 用以下流程实现：编写代码，获取数据，训练模型，获得实验结果。然后您可以查看结果，分析误差与错误，找出适用领域，甚至可以更
# 改您对具体问题的具体思路或解决方法。此后再次更改实现，并运行另一个实验等，反复迭代，最终获得有效的机器学习模型。在编写基于
# LLM 的应用程序的 Prompt 时，流程可能非常相似。您产生了关于要完成的任务的想法后，可以尝试编写第一个 Prompt ，注意要满足
# 上一章说过的两个原则：清晰明确，并且给系统足够的时间思考。然后您可以运行并查看结果。如果第一次效果不好，那么迭代的过程就是找
# 出为什么指令不够清晰或为什么没有给算法足够的时间思考，以便改进想法、改进 Prompt 等等，循环多次，直到找到适合您的应用程序的 Prompt。

In [1]:
# 很难有适用于世间万物的所谓“最佳 Prompt ”，更好的方法是找到有效的迭代过程，以便您可以快速地找到一个适合您的应用程序的 Prompt 。
from openai import OpenAI
def get_completion_gpt(prompt, model="gpt-4o-mini", temperature=0): 
    messages = [{"role": "user", "content": prompt}] # 消息队列
    client = OpenAI()
    response = client.chat.completions.create(
        model=model,
        messages=messages,
        temperature=temperature, # 值越低则输出文本随机性越低
    )
    return response.choices[0].message.content

In [2]:
# 任务——从产品说明书生成一份营销产品描述
# 给定一份椅子的资料页。描述说它属于中世纪灵感系列，产自意大利，并介绍了材料、构造、尺寸、可选配件等参数。假设
# 您想要使用这份说明书帮助营销团队为电商平台撰写营销描述稿：
# 示例：产品说明书
fact_sheet_chair = """
概述
    美丽的中世纪风格办公家具系列的一部分，包括文件柜、办公桌、书柜、会议桌等。
    多种外壳颜色和底座涂层可选。
    可选塑料前后靠背装饰（SWC-100）或10种面料和6种皮革的全面装饰（SWC-110）。
    底座涂层选项为：不锈钢、哑光黑色、光泽白色或铬。
    椅子可带或不带扶手。
    适用于家庭或商业场所。
    符合合同使用资格。
结构
    五个轮子的塑料涂层铝底座。
    气动椅子调节，方便升降。
尺寸
    宽度53厘米|20.87英寸
    深度51厘米|20.08英寸
    高度80厘米|31.50英寸
    座椅高度44厘米|17.32英寸
    座椅深度41厘米|16.14英寸
选项
    软地板或硬地板滚轮选项。
    两种座椅泡沫密度可选：中等（1.8磅/立方英尺）或高（2.8磅/立方英尺）。
    无扶手或8个位置PU扶手。
材料
外壳底座滑动件
    改性尼龙PA6/PA66涂层的铸铝。
    外壳厚度：10毫米。
    座椅
    HD36泡沫
原产国
    意大利
"""
#   Prompt ：基于说明书创建营销描述
prompt = f"""
您的任务是帮助营销团队基于技术说明书创建一个产品的营销描述。
根据```标记的技术说明书中提供的信息，编写一个产品描述。
技术说明: ```{fact_sheet_chair}```
"""
response = get_completion_gpt(prompt)
print(response)

**产品描述：中世纪风格办公家具系列**

探索我们精美的中世纪风格办公家具系列，完美融合了经典设计与现代功能。无论是在家庭办公室还是商业环境中，这款家具都能为您的空间增添一丝优雅与专业感。我们的系列包括文件柜、办公桌、书柜和会议桌，满足您多样化的办公需求。

**个性化选择**  
我们提供多种外壳颜色和底座涂层选项，让您可以根据个人喜好和空间风格进行定制。您可以选择不锈钢、哑光黑色、光泽白色或铬的底座涂层，确保每一件家具都与您的环境完美契合。此外，您还可以选择塑料前后靠背装饰（SWC-100）或10种面料和6种皮革的全面装饰（SWC-110），为您的办公空间增添独特的个性。

**舒适与功能**  
这款椅子设计考虑到了舒适性与实用性，配备五个轮子的塑料涂层铝底座，确保灵活移动。气动调节功能使得椅子高度可轻松调节，适合不同身高的用户。您可以选择带扶手或不带扶手的设计，扶手还提供8个位置的PU调节选项，满足您的个性化需求。

**优质材料**  
我们的办公椅采用改性尼龙PA6/PA66涂层的铸铝外壳，厚度达到10毫米，确保耐用性与稳定性。座椅填充采用HD36泡沫，提供中等（1.8磅/立方英尺）或高（2.8磅/立方英尺）两种密度选项，确保长时间坐着也能保持舒适。

**尺寸与适用性**  
椅子的尺寸为宽度53厘米（20.87英寸）、深度51厘米（20.08英寸）、高度80厘米（31.50英寸），座椅高度为44厘米（17.32英寸），座椅深度为41厘米（16.14英寸），适合各种办公环境。无论是软地板还是硬地板，我们都提供相应的滚轮选项，确保您的椅子在任何表面上都能顺畅移动。

**原产国**  
这款办公椅的设计与制造均源自意大利，体现了意大利工艺的精湛与优雅。

选择我们的中世纪风格办公家具系列，为您的工作空间增添一份经典与现代的完美结合。


In [3]:
# 问题一：生成文本太长
# 它似乎很好地完成了要求，即从技术说明书开始编写产品描述，介绍了一个精致的中世纪风格办公椅。但是当我看到这个时，我会觉得这个太长了。
# 所以在上述过程中，我产生想法后写了一个 Prompt ，并得到了结果，但是我对它不是很满意，因为它太长了。所以我澄清我的 Prompt ，要求
# 它限制生成文本长度，要求最多使用50个字。
# 优化后的 Prompt，要求生成描述不多于 50 词
prompt = f"""
您的任务是帮助营销团队基于技术说明书创建一个产品的零售网站描述。
根据```标记的技术说明书中提供的信息，编写一个产品描述。
使用最多50个词。
技术规格：```{fact_sheet_chair}```
"""
response = get_completion_gpt(prompt)
print(response)

探索我们中世纪风格的办公家具系列，完美结合美观与功能。可选多种颜色和装饰，适合家庭或商业环境。配备气动调节和五轮底座，提供卓越舒适与灵活性。意大利制造，品质保证。


In [4]:
# 由于中文需要分词，此处直接计算整体长度
len(response)

81

In [None]:
# LLM在能堪堪胜任严格的字数限制，但实现得并不精确。此例中，英文输出要求控制在50个词，但有时会输出60或65
# 个单词的内容，但这也还算合理。原因是 LLM 使用分词器（tokenizer）解释文本，但它们往往在计算字符方面表现
# 一般般。有很多不同的方法来尝试控制您得到的输出的长度（如若干句话/词/个汉字/个字母 (characters) 等）。

In [5]:
# 问题二：抓错文本细节
# 我们继续完善这段推广词，会发现的第二个问题是，这个网站并不是直接向消费者销售，它实际上面向的是家具零售商，他们会
# 更关心椅子的技术细节和材料。在这种情况下，您可以继续修改这个 Prompt ，让它更精确地描述椅子的技术细节。
# 解决方法：要求它专注于与目标受众相关的方面。
# 优化后的 Prompt，说明面向对象，应具有什么性质且侧重于什么方面
prompt = f"""
您的任务是帮助营销团队基于技术说明书创建一个产品的零售网站描述。
根据```标记的技术说明书中提供的信息，编写一个产品描述。
该描述面向家具零售商，因此应具有技术性质，并侧重于产品的材料构造。
使用最多50个单词。
技术规格： ```{fact_sheet_chair}```
"""
response = get_completion_gpt(prompt)
print(response)

这款中世纪风格办公椅采用改性尼龙涂层铸铝底座，确保耐用性与稳定性。座椅填充高密度HD36泡沫，提供卓越舒适感。多种外壳颜色和底座涂层选项，适合家庭与商业环境。


In [6]:
# 可见，通过修改 Prompt ，模型的关注点倾向了具体特征与技术细节。
# 我可能进一步想要在描述的结尾展示出产品ID。因此，我可以进一步改进这个 Prompt ，要求在描述的结尾，展示出说明书中的7位产品ID。
# 更进一步
prompt = f"""
您的任务是帮助营销团队基于技术说明书创建一个产品的零售网站描述。
根据```标记的技术说明书中提供的信息，编写一个产品描述。
该描述面向家具零售商，因此应具有技术性质，并侧重于产品的材料构造。
在描述末尾，包括技术规格中每个7个字符的产品ID。
使用最多50个单词。
技术规格： ```{fact_sheet_chair}```
"""
response = get_completion_gpt(prompt)
print(response)

探索这款中世纪风格办公椅，采用改性尼龙涂层铸铝底座，配备五个轮子，确保灵活移动。可选多种外壳颜色和底座涂层，提供个性化选择。符合合同使用资格，适合家庭与商业场所。产品ID: SWC-100, SWC-110.


In [None]:
# 以上是许多开发人员通常会经历的 Prompt 开发的迭代过程简短示例。我的建议是，像上一章中所演示的那样，Prompt 
# 应该保持清晰和明确，并在必要时给模型一些思考时间。在这些要求的基础上，常见流程是首先尝试编写一版 Prompt ，
# 看看会发生什么，然后继续迭代完善 Prompt，以逐渐接近所需的结果。许多成功的 Prompt 都是通过这种迭代过程得出
# 的。我将向您展示一个更复杂的 Prompt 示例，可能会让您对 ChatGPT 的能力有更深入的了解。
# 问题三：添加表格描述
# 继续添加指引，要求提取产品尺寸信息并组织成表格，并指定表格的列、表名和格式；再将所有内容格式化为可以在网页使用的 HTML。

In [7]:
# 要求它抽取信息并组织成表格，并指定表格的列、表名和格式
prompt = f"""
您的任务是帮助营销团队基于技术说明书创建一个产品的零售网站描述。
根据```标记的技术说明书中提供的信息，编写一个产品描述。
该描述面向家具零售商，因此应具有技术性质，并侧重于产品的材料构造。
在描述末尾，包括技术规格中每个7个字符的产品ID。
在描述之后，包括一个表格，提供产品的尺寸。表格应该有两列。第一列包括尺寸的名称。第二列只包括英寸的测量值。
给表格命名为“产品尺寸”。
将所有内容格式化为可用于网站的HTML格式。将描述放在<div>元素中。
技术规格：```{fact_sheet_chair}```
"""
response = get_completion_gpt(prompt)
print(response)

```html
<div>
    <h2>中世纪风格办公椅</h2>
    <p>这款中世纪风格的办公椅是您办公空间的完美补充，兼具美观与功能性。椅子采用高质量的改性尼龙PA6/PA66涂层铸铝底座，确保了卓越的耐用性和稳定性。底座的厚度达到10毫米，提供了额外的支撑和安全感。</p>
    <p>椅子的设计考虑到了用户的舒适性，配备了气动调节功能，方便您根据需要轻松升降。座椅采用HD36泡沫，提供了优越的舒适度和支撑力，适合长时间使用。您可以选择无扶手设计或配备8个位置PU扶手，以满足不同的使用需求。</p>
    <p>此外，椅子底部配有五个轮子的塑料涂层铝底座，适用于软地板或硬地板，确保在各种环境中的灵活移动。我们提供多种外壳颜色和底座涂层选项，包括不锈钢、哑光黑色、光泽白色或铬，您可以根据个人喜好进行选择。</p>
    <p>这款办公椅不仅适用于家庭办公环境，也非常适合商业场所，符合合同使用资格，确保满足高标准的使用要求。</p>
    <p>产品ID: SWC-100, SWC-110</p>
</div>

<h3>产品尺寸</h3>
<table>
    <tr>
        <th>尺寸名称</th>
        <th>测量值（英寸）</th>
    </tr>
    <tr>
        <td>宽度</td>
        <td>20.87</td>
    </tr>
    <tr>
        <td>深度</td>
        <td>20.08</td>
    </tr>
    <tr>
        <td>高度</td>
        <td>31.50</td>
    </tr>
    <tr>
        <td>座椅高度</td>
        <td>17.32</td>
    </tr>
    <tr>
        <td>座椅深度</td>
        <td>16.14</td>
    </tr>
</table>
```


In [9]:
response[response.index('<div>'):response.rindex('```')]

'<div>\n    <h2>中世纪风格办公椅</h2>\n    <p>这款中世纪风格的办公椅是您办公空间的完美补充，兼具美观与功能性。椅子采用高质量的改性尼龙PA6/PA66涂层铸铝底座，确保了卓越的耐用性和稳定性。底座的厚度达到10毫米，提供了额外的支撑和安全感。</p>\n    <p>椅子的设计考虑到了用户的舒适性，配备了气动调节功能，方便您根据需要轻松升降。座椅采用HD36泡沫，提供了优越的舒适度和支撑力，适合长时间使用。您可以选择无扶手设计或配备8个位置PU扶手，以满足不同的使用需求。</p>\n    <p>此外，椅子底部配有五个轮子的塑料涂层铝底座，适用于软地板或硬地板，确保在各种环境中的灵活移动。我们提供多种外壳颜色和底座涂层选项，包括不锈钢、哑光黑色、光泽白色或铬，您可以根据个人喜好进行选择。</p>\n    <p>这款办公椅不仅适用于家庭办公环境，也非常适合商业场所，符合合同使用资格，确保满足高标准的使用要求。</p>\n    <p>产品ID: SWC-100, SWC-110</p>\n</div>\n\n<h3>产品尺寸</h3>\n<table>\n    <tr>\n        <th>尺寸名称</th>\n        <th>测量值（英寸）</th>\n    </tr>\n    <tr>\n        <td>宽度</td>\n        <td>20.87</td>\n    </tr>\n    <tr>\n        <td>深度</td>\n        <td>20.08</td>\n    </tr>\n    <tr>\n        <td>高度</td>\n        <td>31.50</td>\n    </tr>\n    <tr>\n        <td>座椅高度</td>\n        <td>17.32</td>\n    </tr>\n    <tr>\n        <td>座椅深度</td>\n        <td>16.14</td>\n    </tr>\n</table>\n'

In [10]:
# 表格是以 HTML 格式呈现的，加载出来
from IPython.display import display, HTML
display(HTML(response[response.index('<div>'):response.rindex('```')]))

尺寸名称,测量值（英寸）
宽度,20.87
深度,20.08
高度,31.5
座椅高度,17.32
座椅深度,16.14


In [None]:
# 本章的主要内容是 LLM 在开发应用程序中的迭代式 Prompt 开发过程。开发者需要先尝试编写 Prompt ，然后通过迭
# 代逐步完善它，直至得到需要的结果。作为一名高效的提示词工程师（Prompt Engineer），关键在于掌握有效的开发
# Prompt的过程，而不是去寻求得到“完美的”Prompt。对于一些更复杂的应用程序，可以对多个样本（如数百张说明书）
# 进行 Prompt 的迭代开发，并在样本集上进行评估。
# 最后，在更成熟的应用程序中，可以观察多个Prompt在多个样本集上的表现，测试平均或最差性能。但通常，仅当应用较成
# 型之后，才推荐您通过这种评估方式，来精益求精。