# Lession 2 - Prompt 如何迭代优化

## 1. 迭代提示开发

在使用LLM构建应用程序时，通常很难在第一次尝试中就成功的构建出最终所需要的Prompt，针对这种问题，可以通过一个好的迭代过程来不断完善Prompt，最终使其满足任务需求。因此在迭代过程中，第一次的提示是否有效并不重要，关键点在于 **找到一个有效的提示过程**

实际上，编写LLM Prompt的过程与机器学习的开发流程非常相似，都是"idea -> 实现 -> 查看结果 -> 错误分析 -> 修改实验 -> 重新实现"这样一个反复迭代的过程，在构建Prompt时，同样需要这个流程，在基于 **两个原则** 构建出第一个Prompt后，查看运行结果并找出问题反复迭代优化，以找出最优Prompt。

![](img/Iterative%20Prompt.png)

### 任务示例

根据讯飞星火大模型的使用指南生成一份营销描述

In [2]:
import openai
import os

os.environ["http_proxy"] = "http://127.0.0.1:<端口号>"
os.environ["https_proxy"] = "http://127.0.0.1:<端口号>"

openai.api_key  = 'sk-'

In [3]:
def get_completion(prompt, model="gpt-3.5-turbo"):
    '''
    prompt: 对应的提示
    model: 调用的模型，默认为 gpt-3.5-turbo(ChatGPT)，有内测资格的用户可以选择 gpt-4
    '''
    messages = [{"role": "user", "content": prompt}]
    response = openai.ChatCompletion.create(
        model=model,
        messages=messages,
        temperature=0, # 模型输出的温度系数，控制输出的随机程度
    )
    # 调用 OpenAI 的 ChatCompletion 接口
    return response.choices[0].message["content"]

In [4]:
text = """
SparkDesk能做什么？
#1、大模型的使用场景有哪些？
答：现在大模型可以在以下场景使用，同时也希望在更多的业务场景与商务伙伴共同开拓。
（1）内容扩展能力：我可以进行多风格多任务长文本扩展，例如邮件、文案、公文、作文、对话等；
（2）语言理解能力：我可以进行多层次跨语种语言理解，实现语法检查、要素抽取、语篇归整、文本摘要、情感分析、多语言翻译等；
（3）知识问答能力：我可以回答各种各样的问题，包括生活知识、工作技能、医学知识等；
（4）推理能力：我拥有基于思维链的推理能力，能够进行科学推理、常识推理等；
（5）多题型步骤级数学能力：我具备数学思维，能理解数学问题，覆盖多种题型，并能给出解题步骤；
（6）代码理解与编写能力：我可以进行代码理解、代码修改以及代码编写等工作；此外，我还具备对话游戏、角色扮演等特色能力，等待你的探索；
（7）当用户不知道具体场景时，还可以在讯飞星火大模型（官网地址：SparkDesk ）对话框输入“/”符号，系统就会为用户推荐指令模板，并根据用户进一步输入的关键词匹配更精准的模板，该功能极大提升了用户与大模型的交互效率。

#2、讯飞星火大模型在C端产品有哪些应用？
答：现有C端产品应用主要有以下几个方面。
办公本：
（1）语篇规整：记录完成以后，可以实现将口水稿变成书面语，使其更易于理解和阅读。
（2）会议纪要：在录音完成结束以后，自动总结出会议纪要，结合手写关键点与全文摘要，总结出重点内容。
学习机：
（1）语文、英语作文批改功能
（2）中学数学精准学分层学习方案推荐
（3）Talk Talk口语对话。
录音笔：
（1）语篇规整
（2）会议纪要（AI摘要、全文摘要）。
听见M2麦克风+听见软件：
（1）整理全文摘要
（2）输出工作待办
（3）制定工作计划
（4）编写品宣文案
（5）编写新闻稿件
（6）AI内容分析，追溯提问
（7）多语种内容翻译 。

#3、大模型将在日常生活工作中提供哪些帮助？
答：大模型将在不限于以下的生活工作的方方面面提供帮助。
（1）市场营销
（2）教育学习
（3）邮件/周报
（4）语言/翻译
（5）SEO
（6）诗歌/文学
（7）演讲/辩论/脱口秀
（8）准备面试
（9）法律文书
（10）影视/音乐
（11）解忧锦囊团
（12）角色扮演
（13）医疗知识
（14）点评/评论
（15）企业管理
（16）日常工具
（17）知识推荐
（18）内容优化"""

In [5]:
prompt = f"""
请根据'''标记的产品使用指南完成一份该产品的营销描述 \
产品使用指南: '''{text}'''
"""

response = get_completion(prompt)
print(response)

SparkDesk是一款强大的大模型产品，它可以在多个场景下提供帮助。无论是在市场营销、教育学习、邮件/周报、语言/翻译、SEO、诗歌/文学、演讲/辩论/脱口秀、准备面试、法律文书、影视/音乐、解忧锦囊团、角色扮演、医疗知识、点评/评论、企业管理、日常工具、知识推荐、内容优化等方面，SparkDesk都能提供精准的帮助。它具备多风格多任务长文本扩展、多层次跨语种语言理解、知识问答、推理、多题型步骤级数学、代码理解与编写等能力，同时还具备对话游戏、角色扮演等特色能力，让用户的体验更加丰富。SparkDesk还可以在讯飞星火大模型对话框输入“/”符号，系统就会为用户推荐指令模板，并根据用户进一步输入的关键词匹配更精准的模板，大大提升了用户与大模型的交互效率。无论是在办公本、学习机、录音笔、听见M2麦克风+听见软件等C端产品中，SparkDesk都有广泛的应用，可以实现语篇规整、会议纪要、作文批改、学分层学习方案推荐、Talk Talk口语对话、AI摘要、全文摘要、输出工作待办、制定工作计划、编写品宣文案、编写新闻稿件、AI内容分析、追溯提问、多语种内容翻译等功能。SparkDesk是您生活工作中不可或缺的助手。


#### 问题一：文本内容太长

In [6]:
prompt = f"""
请根据'''标记的产品使用指南完成一份该产品的营销描述 \
这份描述不能超过50个字
产品使用指南: '''{text}'''
"""

response = get_completion(prompt)
print(response)

SparkDesk：多语种AI大模型，助力生活工作，覆盖市场营销、教育学习、邮件/周报、语言/翻译、SEO等多个领域。


需要注意的是，LLM在解释文本时采用了分词器（tokenizer），由于分词器规则、词汇表大小以及上下文编码的影响，会使得分词器在拆分字符时，出现忽略特殊字符、将单词拆为子词活字符以及引入额外编码信息等情况，这会使得LLM在计算字符方面表现得一般，例如在限制了长度为50后，有时输出的字符长度会达到65左右。

#### 问题二：生成结果格式不规范

可以看到之前生成的结果并未添加格式约束，这使得用户无法直观的对生成内容进行了解，这里可以在Prompt中添加更复杂的说明，要求它在完成信息抽取的同时，生成一个表格对信息进行展示，并且可在HTML网页中使用

In [8]:
prompt = f"""
请根据'''标记的产品使用指南完成一份该产品的营销描述 \
该描述后需要增加一个表格，表格第一列是C端的产品，第二列是在C端产品中的应用 \
将所有内容格式化为可用于网站的HTML格式，将描述放在<div>元素中
产品使用指南: '''{text}'''
"""

response = get_completion(prompt)
print(response)

<div>
<h2>讯飞星火大模型</h2>
<p>讯飞星火大模型是一款具有多项人工智能能力的产品，可以在多个场景下提供帮助。以下是该产品的使用指南。</p>

<h3>SparkDesk能做什么？</h3>
<p>现在大模型可以在以下场景使用，同时也希望在更多的业务场景与商务伙伴共同开拓。</p>
<ul>
<li>内容扩展能力：我可以进行多风格多任务长文本扩展，例如邮件、文案、公文、作文、对话等；</li>
<li>语言理解能力：我可以进行多层次跨语种语言理解，实现语法检查、要素抽取、语篇归整、文本摘要、情感分析、多语言翻译等；</li>
<li>知识问答能力：我可以回答各种各样的问题，包括生活知识、工作技能、医学知识等；</li>
<li>推理能力：我拥有基于思维链的推理能力，能够进行科学推理、常识推理等；</li>
<li>多题型步骤级数学能力：我具备数学思维，能理解数学问题，覆盖多种题型，并能给出解题步骤；</li>
<li>代码理解与编写能力：我可以进行代码理解、代码修改以及代码编写等工作；此外，我还具备对话游戏、角色扮演等特色能力，等待你的探索；</li>
<li>当用户不知道具体场景时，还可以在讯飞星火大模型（官网地址：SparkDesk）对话框输入“/”符号，系统就会为用户推荐指令模板，并根据用户进一步输入的关键词匹配更精准的模板，该功能极大提升了用户与大模型的交互效率。</li>
</ul>

<h3>讯飞星火大模型在C端产品有哪些应用？</h3>
<p>现有C端产品应用主要有以下几个方面。</p>
<table>
<tr>
<th>C端产品</th>
<th>应用</th>
</tr>
<tr>
<td>办公本</td>
<td>
<ul>
<li>语篇规整：记录完成以后，可以实现将口水稿变成书面语，使其更易于理解和阅读。</li>
<li>会议纪要：在录音完成结束以后，自动总结出会议纪要，结合手写关键点与全文摘要，总结出重点内容。</li>
</ul>
</td>
</tr>
<tr>
<td>学习机</td>
<td>
<ul>
<li>语文、英语作文批改功能</li>
<li>中学数学精准学分层学习方案推荐</li>
<li>Talk Talk口语对话。</li>
</ul>
</td>
</tr>
<tr>
<td>录音笔</td>
<

In [10]:
# 表格是以 HTML 格式呈现的，加载出来
from IPython.display import display, HTML

display(HTML(response))

C端产品,应用
办公本,语篇规整：记录完成以后，可以实现将口水稿变成书面语，使其更易于理解和阅读。 会议纪要：在录音完成结束以后，自动总结出会议纪要，结合手写关键点与全文摘要，总结出重点内容。
学习机,语文、英语作文批改功能 中学数学精准学分层学习方案推荐 Talk Talk口语对话。
录音笔,语篇规整 会议纪要（AI摘要、全文摘要）。
听见M2麦克风+听见软件,整理全文摘要 输出工作待办 制定工作计划 编写品宣文案 编写新闻稿件 AI内容分析，追溯提问 多语种内容翻译。
