In [1]:
from openai import OpenAI

In [2]:
def get_completion_gpt(prompt, model="gpt-4o-mini", temperature=0): 
    messages = [{"role": "user", "content": prompt}] # 消息队列
    client = OpenAI()
    response = client.chat.completions.create(
        model=model,
        messages=messages,
        temperature=temperature, # 值越低则输出文本随机性越低
    )
    return response.choices[0].message.content

In [None]:
get_completion_gpt('你好')

In [9]:
# 目的是将给定的文本（text_1）转换为按步骤列出的形式。它使用一个包含格式化提示的字符串（prompt），然后将此提示传递给 
# get_completion_gpt 方法来生成响应。
# 插入变量： {text_1} 会被替换为 text_1 的内容，确保变量的值被插入到字符串中。
# \"\"\"：这部分是转义字符（\"）的使用，它告诉 Python 在字符串中放入字面量的双引号（"""），而不是开始或结束字符串。
# 这样做是为了确保最终字符串的内容中会包含这些双引号字符。
# {text_1}：这部分是 f-string 插值语法，它会将变量 text_1 的值插入到字符串中。
# 需要把水烧开。\后面的还是一整个文本，没有换行

In [None]:
# 模型根据这些 顺序性词汇、操作的依赖关系 和 明确的指令性语言 判断这是一个有先后顺序、符合步骤描述的过程文本。
# 在自然语言处理中，这种文本被识别为一个需要按顺序完成的操作流程。
# 反斜杠（\）的作用并不是插入换行符 \n，而是将长文本拆分成多个物理行，但 字符串本身不会被分割成多行。在代码中，
# 每一行文本实际上是 连接成一个完整的字符串，没有引入换行符或额外的空白字符。

In [3]:
# 文本理解
# 文本总结与条件检测
# 有步骤的文本（满足输入条件）
text_1 = f"""
泡一杯茶很容易。首先，需要把水烧开。\
在等待期间，拿一个杯子并把茶包放进去。\
一旦水足够热，就把它倒在茶包上。\
等待一会儿，让茶叶浸泡。几分钟后，取出茶包。\
如果你愿意，可以加一些糖或牛奶调味。\
就这样，你可以享受一杯美味的茶了。
"""
prompt = f"""
您将获得由三个引号括起来的文本。\
如果它包含一系列的指令，则需要按照以下格式重新编写这些指令：
第一步 - ...
第二步 - …
…
第N步 - …
如果文本中不包含一系列的指令，则直接写“未提供步骤”。"
\"\"\"{text_1}\"\"\"
"""
response = get_completion_gpt(prompt)
print(response)

第一步 - 把水烧开。  
第二步 - 拿一个杯子并把茶包放进去。  
第三步 - 一旦水足够热，就把它倒在茶包上。  
第四步 - 等待一会儿，让茶叶浸泡。  
第五步 - 几分钟后，取出茶包。  
第六步 - 如果你愿意，可以加一些糖或牛奶调味。  
第七步 - 享受一杯美味的茶。  


In [7]:
print(prompt)


您将获得由三个引号括起来的文本。如果它包含一系列的指令，则需要按照以下格式重新编写这些指令：
第一步 - ...
第二步 - …
…
第N步 - …
如果文本中不包含一系列的指令，则直接写“未提供步骤”。"
"""
泡一杯茶很容易。首先，需要把水烧开。在等待期间，拿一个杯子并把茶包放进去。一旦水足够热，就把它倒在茶包上。等待一会儿，让茶叶浸泡。几分钟后，取出茶包。如果你愿意，可以加一些糖或牛奶调味。就这样，你可以享受一杯美味的茶了。
"""



In [None]:
# 模型区分一段文本是否由步骤（或指令）组成，通常基于以下几种方式：
# 1. 语言结构和关键词,2.上下文和动作序列,3.缺乏指令性语言,如果文本以叙述方式描述场景、感受、观察结果等，而没有明确的操作指令
# ，那么模型会判断这不是步骤,4.上下文一致性
# 模型主要是通过语言模式、语气、上下文的顺序以及是否有操作性的描述来判断一段文本是否包含一系列步骤。步骤通常会包括指令
# 性的语言、时间序列以及明确的动作和目标，而没有这些特征的文本，模型则会判断为普通的描述性文本，通常会返回“未提供步骤”

In [10]:
# 无步骤的文本（不满足输入条件）
# 无步骤的文本
text_2 = f"""
今天阳光明媚，鸟儿在歌唱。\
这是一个去公园散步的美好日子。\
鲜花盛开，树枝在微风中轻轻摇曳。\
人们外出享受着这美好的天气，有些人在野餐，有些人在玩游戏或者在草地上放松。\
这是一个完美的日子，可以在户外度过并欣赏大自然的美景。
"""
prompt = f"""
您将获得由三个引号括起来的文本。\
如果它包含一系列的指令，则需要按照以下格式重新编写这些指令：
第一步 - ...
第二步 - …
…
第N步 - …
如果文本中不包含一系列的指令，则直接写“未提供步骤”。"
\"\"\"{text_2}\"\"\"
"""
response = get_completion_gpt(prompt)
print(response)

未提供步骤。


In [None]:
print(prompt)

In [None]:
# 模型会根据上下文中祖父母的回答(简短，形象，生动)，使用多个生动的比喻来表达“韧性”的概念。每个比喻都强化了“韧性”的含义

In [12]:
# 提供少量示例的文本续写（Few-shot）
prompt = f"""
你的任务是以一致的风格回答问题。
<孩子>: 教我耐心。
<祖父母>: 挖出最深峡谷的河流源于一处不起眼的泉眼；最宏伟的交响乐从单一的音符开始；最复杂的挂毯以一根孤独的线开始编织。
<孩子>: 教我韧性。
"""

In [13]:
response = get_completion_gpt(prompt)
print(response)

<祖父母>: 最坚韧的树木是在风暴中成长的；最璀璨的钻石是在压力下形成的；最美丽的花朵是在逆境中绽放的。


In [None]:
# 在 Python 中，三个反引号（```) 是用来表示 多行字符串 或者 代码块，它是键盘上 反引号（`） 键的三次按下。
# 它位于 键盘的左上角，通常在数字键 1 的左边，按下 Shift 键时显示为波浪符号（~）。不需要按任何其他组合键，
# 仅需连续按三次反引号键即可。

In [None]:
# 它简洁地总结了评论中的关键内容，特别是在聚焦于运输部分的同时，简明地提到产品的其他特点。您提到的**“快递提前一天
# 到达，令人满意”确实是评论中的一个亮点，突出了运输的优点，而“公仔可爱但相对较小，性价比略低”**则简要表达了关
# 于产品本身的一些评价，虽然聚焦于运输，但依然涵盖了评论中的一些其他元素。

In [14]:
# 关注点侧重(生成摘要)
prod_review_zh = """
这个熊猫公仔是我给女儿的生日礼物，她很喜欢，去哪都带着。
公仔很软，超级可爱，面部表情也很和善。但是相比于价钱来说，
它有点小，我感觉在别的地方用同样的价钱能买到更大的。
快递比预期提前了一天到货，所以在送给女儿之前，我自己玩了会。
"""
# 侧重运输
prompt = f"""
你的任务是从电子商务网站上生成一个产品评论的简短摘要。
请对三个反引号之间的评论文本进行概括，最多30个词汇，并且聚焦在产品运输上。
评论: ```{prod_review_zh}```
"""
response = get_completion_gpt(prompt)
print(response)

快递提前一天到达，令人满意。公仔可爱但相对较小，性价比略低。


In [15]:
# 关键信息提取
prompt = f"""
你的任务是从电子商务网站上的产品评论中提取相关信息。
请从以下三个反引号之间的评论文本中提取产品运输相关的信息，最多30个词汇。
评论: ```{prod_review_zh}```
"""
response = get_completion_gpt(prompt)
print(response)

快递比预期提前了一天到货。


In [None]:
# 上面的应用涵盖文本理解，示例文本续写，关键信息提取

In [None]:
# 在提供的 prompt 中，模型的步骤应该如下：
# 概括 <{text}> 中的内容。
# 将概括翻译成英语。
# 列出英语摘要中的所有人名（例如杰克和吉尔）。
# 输出一个 JSON 对象，包含英文摘要和名称数量。
# 因此，模型理解并处理的是 {text} 中的文本，而 <> 和 {} 的作用是区分任务指示和实际数据。

In [16]:
# 结构化输出
text = f"""
在一个迷人的村庄里，兄妹杰克和吉尔出发去一个山顶井里打水。\
他们一边唱着欢乐的歌，一边往上爬，\
然而不幸降临——杰克绊了一块石头，从山上滚了下来，吉尔紧随其后。\
虽然略有些摔伤，但他们还是回到了温馨的家中。\
尽管出了这样的意外，他们的冒险精神依然没有减弱，继续充满愉悦地探索。
"""
# example 
prompt = f"""
1-用一句话概括下面用<>括起来的文本。
2-将摘要翻译成英语。
3-在英语摘要中列出每个名称。
4-输出一个 JSON 对象，其中包含以下键：English_summary，num_names。
请使用以下格式：
文本：<要总结的文本>
摘要：<摘要>
翻译：<摘要的翻译>
名称：<英语摘要中的名称列表>
输出 JSON：<带有 English_summary 和 num_names 的 JSON>
Text: <{text}>
"""

In [17]:
print(prompt)


1-用一句话概括下面用<>括起来的文本。
2-将摘要翻译成英语。
3-在英语摘要中列出每个名称。
4-输出一个 JSON 对象，其中包含以下键：English_summary，num_names。
请使用以下格式：
文本：<要总结的文本>
摘要：<摘要>
翻译：<摘要的翻译>
名称：<英语摘要中的名称列表>
输出 JSON：<带有 English_summary 和 num_names 的 JSON>
Text: <
在一个迷人的村庄里，兄妹杰克和吉尔出发去一个山顶井里打水。他们一边唱着欢乐的歌，一边往上爬，然而不幸降临——杰克绊了一块石头，从山上滚了下来，吉尔紧随其后。虽然略有些摔伤，但他们还是回到了温馨的家中。尽管出了这样的意外，他们的冒险精神依然没有减弱，继续充满愉悦地探索。
>



In [18]:
response = get_completion_gpt(prompt)
print(response)

摘要：兄妹杰克和吉尔在爬山打水时不幸摔倒，但他们依然保持冒险精神，继续探索。  
翻译：Siblings Jack and Jill fell while climbing a hill to fetch water, but they maintained their adventurous spirit and continued to explore.  
名称：["Jack", "Jill"]  
输出 JSON：{"English_summary":"Siblings Jack and Jill fell while climbing a hill to fetch water, but they maintained their adventurous spirit and continued to explore.","num_names":2}


In [19]:
# 从客户的评论中提取结构化信息
# 中文
lamp_review_zh = """
我需要一盏漂亮的卧室灯，这款灯具有额外的储物功能，价格也不算太高。\
我很快就收到了它。在运输过程中，我们的灯绳断了，但是公司很乐意寄送了一个新的。\
几天后就收到了。这款灯很容易组装。我发现少了一个零件，于是联系了他们的客服，他们很快就给我寄来了缺失的零件！\
在我看来，Lumina 是一家非常关心顾客和产品的优秀公司！
"""
# 中文
prompt = f"""
从评论文本中识别以下项目：
- 评论者购买的物品
- 制造该物品的公司
评论文本用三个反引号分隔。将你的响应格式化为以 “物品” 和 “品牌” 为键的 JSON 对象。
如果信息不存在，请使用 “未知” 作为值。
让你的回应尽可能简短。
评论文本: ```{lamp_review_zh}```
"""

In [20]:
response = get_completion_gpt(prompt)
print(response)

```json
{
  "物品": "卧室灯",
  "品牌": "Lumina"
}
```


In [21]:
# 一次提取多条信息
# 中文
prompt = f"""
从评论文本中识别以下项目：
- 情绪（正面或负面）
- 审稿人是否表达了愤怒？（是或否）
- 评论者购买的物品
- 制造该物品的公司
评论用三个反引号分隔。将您的响应格式化为 JSON 对象，以 “Sentiment”、“Anger”、“Item” 和 “Brand” 作为键。
如果信息不存在，请使用 “未知” 作为值。
让你的回应尽可能简短。
将 Anger 值格式化为布尔值。
评论文本: ```{lamp_review_zh}```
"""
response = get_completion_gpt(prompt)
print(response)

```json
{
  "Sentiment": "正面",
  "Anger": false,
  "Item": "卧室灯",
  "Brand": "Lumina"
}
```


In [30]:
response[response.index('{'):response.rindex('```')]

'{\n  "Sentiment": "正面",\n  "Anger": false,\n  "Item": "卧室灯",\n  "Brand": "Lumina"\n}\n'

In [31]:
import json
data = json.loads(response[response.index('{'):response.rindex('```')])
# 打印转换后的字典对象
print(data)

{'Sentiment': '正面', 'Anger': False, 'Item': '卧室灯', 'Brand': 'Lumina'}


In [33]:
# 翻译与转换
# 多语种翻译
prompt = f"""
请将以下文本分别翻译成中文、英文、法语和西班牙语: 
```I want to order a basketball.```
"""
response = get_completion_gpt(prompt)
print(response)

中文: 我想订购一个篮球。

英文: I want to order a basketball.

法语: Je veux commander un ballon de basket.

西班牙语: Quiero pedir un balón de baloncesto.


In [None]:
# f-string：格式化字符串，通常用于插入变量值。
# 如果您的字符串中没有变量或表达式，那么加不加 f 是一样的，输出结果会一样。

In [None]:
# 正式语气：通常用于商务、正式场合，语言更加礼貌、规范。例如：“Would you like to order a pillow?” 
# 这种问句是比较正式的，语气较为客气。
# 非正式语气：用于朋友、熟人之间，语气更轻松、随意。例如：“Do you want to get a pillow?” 或者
# “Wanna grab a pillow?”，这些表述通常带有更轻松、随意的感觉
# 正式与非正式 语气的差别：正式语气多了一些礼貌成分，而非正式语气则更加简洁和随意。

In [35]:
# 翻译+正式语气
prompt = f"""
请将以下文本翻译成中文，分别展示成正式与非正式两种语气: 
```Would you like to order a pillow?```
"""
response = get_completion_gpt(prompt)
print(response)

正式语气：您想要订购一个枕头吗？

非正式语气：你想要买个枕头吗？


In [None]:
# - 是用来列举不同费用项的符号，起到 分隔不同项 的作用。它将每项费用列出，以便于逐条理解和计算。
# 在这种情况下，它并不是数学运算符，而是 项目符号，通常用于清晰地列出信息。

In [None]:
# 解析文本：识别费用项和它们与平方英尺数的关系。
# 定义变量：使用变量 x 表示平方英尺数。
# 转换为数学公式：将各项费用用数学表达式表示。
# 合并并简化：将费用项合并成一个公式。
# 呈现答案：给出最终的公式并进行解释。
# 这种逐步解析并构建数学模型的方式是LLM解决类似问题的常见方法。

In [None]:
# 理解自然语言并将其转换为数学表达式，实际上是自然语言处理（NLP）中的一个复杂任务。这需要模型不仅具备语言理解能力
# ，还要能够推理、抽象并生成特定格式的信息。在这个问题中，模型将语言中的费用描述转换成了数学公式，这主要依赖于以下几个方面：
# 1. 语言模型的训练数据，2. 语言模型的抽象能力，3. 推理和上下文理解，4. 数学关系的生成，5. 符号处理能力，6. 生成答案

In [36]:
# 逻辑推理
prompt = f"""
请判断学生的解决方案是否正确，请通过如下步骤解决这个问题：
步骤：
    首先，自己解决问题。
    然后将你的解决方案与学生的解决方案进行比较，并评估学生的解决方案是否正确。在自己完成问题之前，请勿决定学生的解决方案是否正确。
使用以下格式：
    问题：问题文本
    学生的解决方案：学生的解决方案文本
    实际解决方案和步骤：实际解决方案和步骤文本
    学生的解决方案和实际解决方案是否相同：是或否
    学生的成绩：正确或不正确
问题：
    我正在建造一个太阳能发电站，需要帮助计算财务。 
    - 土地费用为每平方英尺100美元
    - 我可以以每平方英尺250美元的价格购买太阳能电池板
    - 我已经谈判好了维护合同，每年需要支付固定的10万美元，并额外支付每平方英尺10美元
    作为平方英尺数的函数，首年运营的总费用是多少。
学生的解决方案：
    设x为发电站的大小，单位为平方英尺。
    费用：
    1. 土地费用：100x
    2. 太阳能电池板费用：250x
    3. 维护费用：100,000+100x
    总费用：100x+250x+100,000+100x=450x+100,000
实际解决方案和步骤：
"""
response = get_completion_gpt(prompt)
print(response)

问题：我正在建造一个太阳能发电站，需要帮助计算财务。 
- 土地费用为每平方英尺100美元
- 我可以以每平方英尺250美元的价格购买太阳能电池板
- 我已经谈判好了维护合同，每年需要支付固定的10万美元，并额外支付每平方英尺10美元
作为平方英尺数的函数，首年运营的总费用是多少。

学生的解决方案：
设x为发电站的大小，单位为平方英尺。
费用：
1. 土地费用：100x
2. 太阳能电池板费用：250x
3. 维护费用：100,000+100x
总费用：100x+250x+100,000+100x=450x+100,000

实际解决方案和步骤：
1. 土地费用：每平方英尺100美元，面积为x平方英尺，因此土地费用为100x。
2. 太阳能电池板费用：每平方英尺250美元，面积为x平方英尺，因此太阳能电池板费用为250x。
3. 维护费用：固定费用为100,000美元，额外费用为每平方英尺10美元，面积为x平方英尺，因此维护费用为100,000 + 10x。
4. 总费用计算：
   - 土地费用：100x
   - 太阳能电池板费用：250x
   - 维护费用：100,000 + 10x
   - 总费用 = 100x + 250x + (100,000 + 10x) = 100x + 250x + 100,000 + 10x = 360x + 100,000

学生的解决方案和实际解决方案是否相同：否  
学生的成绩：不正确
