# <center>在线大模型本地调用方法

## <center> Chat API 文本对话指南

欢迎各位小伙伴们，我们接下来会进入模型API调用的学习了。因为OPENAI处于行业标杆的位置，有关于OPENAI的API调用等知识体系完全可以迁移到其他模型上面，有些类似于python，C，java之间的编程语言的的迁移，且改动幅度更小。

我们以OPENAI的旗舰模型GPT-4o为例，GPT-4o  （“o”代表“全能”）和 GPT-4o mini 是原生多模态模型，旨在处理多模态输入的组合。GPT-4o mini 是 GPT-4o 的轻量级版本。

在 GPT-4o 之前，用户可以通过语音模式与 ChatGPT 互动，该模式使用三个独立的模型。GPT-4o 将这些功能整合到一个单一模型中，该模型在文本、视觉和音频上进行了训练。这种统一的方法确保所有输入——无论是文本、视觉还是听觉——都由同一个神经网络进行一致处理。

除此之外，还有GPT最新开放出来的API，GPT 4o还可以对自己进行文本及图片的微调，原生语音到语音的realtime实时API，通过模型蒸馏让大模型教小模型的功能，以及低价的批处理API调用等等。

这些功能GPT 4o都可以实现！

现在，我们将会从Chat对话类型的API入手，并往下探索大模型世界！

首先，我们可以看到Chat对话类型的API都是通过chat completions API端口来完成的。

chatAPI提供文本和图片类型的输入，大模型进行推理并返回文本的格式。其视频输入和音频输入并不在chat API的端口里，但这里是基础中基础，坚石中的坚石，是攻克大模型应用开发的必经之路。

![](https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20241015104845.png)

> 端口路径：https://api.openai.com/v1/chat/completions<br>



> 这个路径作为API的一个端点，是连接用户（或者用户的应用程序）和OpenAI服务之间的桥梁；<br>
> 通过这个网址，开发者可以远程调用OpenAI的服务器上运行的模型。这意味着开发者无需在本地运行大型机器学习模型，而是通过网络向OpenAI的服务器发送请求，由服务器处理并返回结果。

________

## 1. Chat Completions API调用方法

一个函数——`chat.completions.create`函数速通文本对话。

安装openai的库（工具包）

In [3]:
!pip install openai


[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m24.0[0m[39;49m -> [0m[32;49m24.2[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m


- **chat.completions.create函数使用示例与response回应解析**

接下来，我们尝试调用Chat Completions API。通过一个极简示例来了解Chat Completions API调用方式、参数设置、响应内容。


想要调用它，我们需要有API Key，通过API Key认证的client就和我们的账户挂钩了，同时也建立了调用OpenAI的桥梁，OpenAI实例client就能关联到我们的账户，比如我们的文件，微调的模型等。在这里我们，可以理解它为和我们自己滴血结成契约的独有小精灵.

In [1]:
from openai import OpenAI
# 如果成功配置了环境变量的在OPENAI提供的工具包中会自动找到我们的秘钥
client = OpenAI()
# 如果没有配置环境变量也可以用变量显式传入 但注意保护好api key不被别人看见
# client = OpenAI(api_key="bjhgsdjhfkad_your_api_key_here") 

![](https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20241015174953.png)

有了独特的的契约助手（由我们API KEY认证的）后，如果我们想要向大模型发起问话，需要什么必须的信息告诉助手呢？

1、 使用哪个模型  2、我们的问题是什么

即这个函数中有两个必须参数：model和messages。

其中model表示调用的模型（这里调用的是`gpt-4o`模型），messages参数则是一个由字典构成的列表，其中每个字典（每条消息）内有两个键：
>- "**role**"：这个键的值表示消息的发送者。在上述代码中`"role": "user"`这个键值对就表明这条消息是由用户发送的。role可以有不同的值，包括user、system、assistant、tool。<br><br>
>- "**content**"：这个键的值表示实际的消息内容。在上述代码中，"content": "请举几个罗马帝国的趣事" 是用户希望得到回答的问题。这个内容是大模型生成对话的输入部分。

In [13]:
response = client.chat.completions.create(
  model="gpt-4o",
  messages=[
      {"role": "user", "content": "请举几个罗马帝国的趣事"}
  ]
)

大模型推理生成的结果直接由create函数返回了，被我们存进了response中

In [16]:
response

KeyboardInterrupt: 

In [8]:
# 查看返回对象类型
type(response)

openai.types.chat.chat_completion.ChatCompletion

模型返回对象是一个类。若想提取response中具体返回的内容，可以直接通过属性调用的方式：

In [15]:
response.id 
# 代表这段对话的唯一标识符。

'chatcmpl-AJHq5rDMCvS35foy3uwgRBUDrOcmn'

API调用中计费的单位是token：

![9d35d67def1d739d6abb09825893153.png](https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/9d35d67def1d739d6abb09825893153.png)

- **什么是token**
 - 在大语言模型中,token是文本的基本单位。模型不是直接处理原始文本,而是将文本切分成一系列token进行处理，最后将token映射成数字。token可以是单词、子词或者单个字符,具体取决于模型使用的分词方法。
 - OpenAI 官方提供了一个工具 **Tokenizer**，可以测试任意输入的文本，并查看它们是如何被转换成 Tokens 的。Tokenizer 工具地址：https://platform.openai.com/tokenizer<center><img src="https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20241010191810.png" alt="Tokenizer 工具" /></center>

可以在返回结果的usage中查看本次对话所占用的token数量。具体含义如下：
- **completion_tokens**：表示生成的回答的token数量；
- **prompt_tokens**：表示输入给模型的prompt占用的token数量（这里指的是“请举几个罗马帝国的趣事”这句话的token数）
- **total_tokens**：表示本次对话总共占用的token数量，是输入和输出token之和。

In [51]:
response.usage

CompletionUsage(completion_tokens=500, prompt_tokens=17, total_tokens=517, completion_tokens_details=CompletionTokensDetails(audio_tokens=None, reasoning_tokens=0), prompt_tokens_details=PromptTokensDetails(audio_tokens=None, cached_tokens=0))

In [52]:
response.choices

[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='罗马帝国作为古代一个庞大而复杂的社会体系，不仅有着重要的历史事件，还有许多有趣的趣事和细节：\n\n1. **斗兽场的娱乐活动**：罗马斗兽场不仅用于角斗士的搏斗，还举办了许多其他形式的娱乐活动，包括动物狩猎和模拟海战。实际上，有记载称斗兽场曾经被灌满水来重现海上战争场景。\n\n2. **食物狂欢**：罗马人以奢华的宴会而闻名，许多贵族进行长时间的聚餐。有些宴会甚至设有呕吐室，供人们在吃撑后呕吐，然后继续进食，以享受更多美食。\n\n3. **人体除臭剂的早期版本**：罗马人使用含有植物精油和香料的膏状物来掩盖体味，这是香水和除臭剂的早期形式。此外，他们还使用厕所里的公共擦拭工具，而不是现代的卫生纸。\n\n4. **交通管理**：为了缓解交通堵塞，罗马的一些主干道只允许白天马车通行。实际上，很多商人大多在夜间运输货物以避开繁忙的街道。\n\n5. **数字谜题爱好者**：罗马人喜欢用字谜和数字谜题来娱乐。特别是正方体内隐藏各种组合的拼图游戏受到欢迎，类似于现代的数独游戏。\n\n6. **女性美容**：罗马女性使用铅白粉作为化妆品，用于美白肤色，然而这导致了长期的健康问题。此外，她们还使用蜗牛粘液和鳄鱼粪便制成的化妆品。\n\n7. **选举贿赂的艺术**：在罗马共和国晚期，选举贿赂是一种公开秘密。候选人以低价面包、娱乐活动或者直接金钱收买选票，无形中形成了一种古老的选民庇护关系。\n\n这些趣事展示了罗马帝国丰富多彩的社会生活，不仅反映了他们的文化和习俗，也提供了对其社会结构的不同视角。', refusal=None, role='assistant', function_call=None, tool_calls=None))]

模型回应的正文就在choices中，choices是一个由Choice类组成的列表。现在我们的目标是提取出模型回应的具体文字，让我们来玩“找找找”的游戏吧：

In [23]:
response.choices[0]

Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='大模型是指具有大量参数和复杂结构的机器学习模型，通常用于处理复杂的任务和大规模的数据集。这些模型通常需要更多的计算资源和训练时间，但在某些情况下能够取得很好的性能表现。大模型在自然语言处理、计算机视觉和强化学习等领域得到广泛应用。', role='assistant', function_call=None, tool_calls=None))

In [24]:
response.choices[0].message

ChatCompletionMessage(content='大模型是指具有大量参数和复杂结构的机器学习模型，通常用于处理复杂的任务和大规模的数据集。这些模型通常需要更多的计算资源和训练时间，但在某些情况下能够取得很好的性能表现。大模型在自然语言处理、计算机视觉和强化学习等领域得到广泛应用。', role='assistant', function_call=None, tool_calls=None)

In [25]:
response.choices[0].message.content

'大模型是指具有大量参数和复杂结构的机器学习模型，通常用于处理复杂的任务和大规模的数据集。这些模型通常需要更多的计算资源和训练时间，但在某些情况下能够取得很好的性能表现。大模型在自然语言处理、计算机视觉和强化学习等领域得到广泛应用。'

1.Chat Completions API的的两个必须参数详解

在OpenAI官方给出了chat.completions.create函数的详细参数解释，具体内容可以查阅此页面：https://platform.openai.com/docs/api-reference/chat

![](https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20241015144100.png)

为了后续更好的利用大模型的能力帮助我们处理日常工作，我们需要尽可能多地了解大模型的工作机制，那么我们需要对模型中的每个参数及其作用有所理解。我们将chat.completions.create函数的参数依功能归纳为五大类别：

1. **核心参数/必须参数**
   - 这些参数是每次调用API时必不可少的，确保请求能够正确地识别使用的模型和当前对话的内容。
   - **`model`**：指定使用的模型ID，决定了生成文本的能力和特性。
   - **`messages`**：包含对话中所有消息的列表，是生成响应的基础。

2. **文本生成过程中的控制参数**
   - 这些参数允许用户精细控制生成文本的行为，控制文本的创意性、一致性和长度，以满足特定需求。
   - **`frequency_penalty`** 和 **`presence_penalty`**：防止模型重复内容或鼓励引入新话题。
   - **`temperature`** 和 **`top_p`**：调节生成文本的随机性和多样性。
   - **`stop`**：定义生成过程的终止条件。
   - **`n`**：指定生成多个不同的响应选项。
   - **`max_completion_tokens`** 和 **`max_tokens`**：限制生成文本的长度。（`max_tokens` 已准备弃用）
   - **`seed`**：尝试实现生成结果的可重复性。
   - **`logit_bias`**、**`logprobs`** 和 **`top_logprobs`**：细粒度控制特定词汇的生成概率。

3. **生成文本的方式和输出格式**
   - 这些参数决定了文本生成的技术方式（如是否流式传输）和输出格式（如JSON结构）。
   - **`response_format`**：定义生成文本的结构化格式。
   - **`stream`** 和 **`stream_options`**：控制是否以流式方式接收生成的文本，适用于实时应用。

4. **与模型调用和功能相关的参数**
   - 这些参数用于配置高级功能，如选择不同的服务层级、调用外部工具或函数，以及管理请求的存储和元数据。
   - **`service_tier`**：选择不同的服务级别以优化延迟和可用性。
   - **`tools`**、**`tool_choice`** 和 **`parallel_tool_calls`**：配置模型可以调用的外部工具或函数，增强功能性。
   - **`store`** 和 **`metadata`**：管理请求结果的存储与分类，便于后续分析和监控。
   - **`function_call`** 和 **`functions`**（已弃用）：旧版参数，用于控制函数调用，现已被`tools`取代。

5. **与用户相关的参数**
   - 这些参数用于识别和跟踪最终用户，帮助系统进行用户行为分析和防止滥用。
   - **`user`**：提供一个唯一标识符以代表最终用户，增强安全性和监控能力。

通过这样的分类，大家可以更加系统地学习和理解这些参数。接下来，我们就一起来学习各个类别的参数吧~

### 2.1 核心参数：model与messages

对于chat.completions.create函数来说，最重要的参数就是model和messages这两个参数了，这两个参数也这个函数中必填的两个参数，剩下的所有参数都是非必填项。

#### 2.1.3 model参数

model参数表示的是当前对话调用的模型，具体模型列表参考OpenAI官网Limits页面中的Chat类模型：https://platform.openai.com/account/limits
同时我们的sdk中可调用的方法中也提供了一个models.list()方法，可以查看当前可用的模型列表。

In [None]:
# response = client.chat.completions.create(
#   model="gpt-4o",
#   messages=[
#       {"role": "user", "content": "请问什么是大模型？"}
#   ]
# )

怎么选择模型呢？首先要选择最新的旗舰款模型

>- 像 大型模型 gpt-4o 这样的模型将提供非常高水平的智能和强大的性能，但每个 token 的成本更高，推理的也比小模型更慢一些。
>- 像 小型模型 gpt-4o-mini 这样的模型提供的智能水平不及大型模型，但速度更快，每个 token 的成本更低。
>- 像 推理模型 如 o1 系列模型 这样的模型返回结果的速度较慢，并且使用更多的 token 来“思考”，但能够进行高级推理、编码和多步骤规划。

In [2]:
from openai import OpenAI
# 构建 OpenAI 客户端对象的实例
client = OpenAI()

models = client.models.list()
models

SyncPage[Model](data=[Model(id='gpt-4-turbo', created=1712361441, object='model', owned_by='system'), Model(id='gpt-4-turbo-2024-04-09', created=1712601677, object='model', owned_by='system'), Model(id='gpt-4o', created=1715367049, object='model', owned_by='system'), Model(id='tts-1', created=1681940951, object='model', owned_by='openai-internal'), Model(id='tts-1-1106', created=1699053241, object='model', owned_by='system'), Model(id='chatgpt-4o-latest', created=1723515131, object='model', owned_by='system'), Model(id='dall-e-2', created=1698798177, object='model', owned_by='system'), Model(id='gpt-4-turbo-preview', created=1706037777, object='model', owned_by='system'), Model(id='gpt-3.5-turbo-instruct', created=1692901427, object='model', owned_by='system'), Model(id='gpt-4-0125-preview', created=1706037612, object='model', owned_by='system'), Model(id='gpt-3.5-turbo-0125', created=1706048358, object='model', owned_by='system'), Model(id='gpt-3.5-turbo', created=1677610602, object='

In [54]:
for model in models.data:
    print(model.id)

gpt-4-turbo
gpt-4-turbo-2024-04-09
tts-1
tts-1-1106
chatgpt-4o-latest
dall-e-2
gpt-4-turbo-preview
gpt-4o-2024-08-06
gpt-3.5-turbo-instruct
gpt-4o
gpt-4-0125-preview
gpt-3.5-turbo-0125
gpt-3.5-turbo
babbage-002
davinci-002
gpt-4o-realtime-preview-2024-10-01
dall-e-3
gpt-4o-realtime-preview
gpt-4o-2024-05-13
gpt-4o-mini
tts-1-hd
tts-1-hd-1106
gpt-4o-mini-2024-07-18
gpt-4-1106-preview
text-embedding-ada-002
gpt-3.5-turbo-16k
text-embedding-3-small
text-embedding-3-large
whisper-1
gpt-3.5-turbo-1106
gpt-4-0613
gpt-4
gpt-3.5-turbo-instruct-0914


#### 2.1.1 messages参数结构

`messages` 是一个包含多个字典的列表。每个字典代表一条消息，包含两个关键部分：

1. **角色（`role`）**：表示消息的发送者，如用户（`user`）或助手（`assistant`）。
2. **内容（`content`）**：具体的消息内容，即发送的文本。

也就是说，无论是用户的消息，助手回答的消息，最后的结构就是这个字典的消息结构

messages参数中的role设定不仅有“user”这一种，还有“assistant”和“system”，同时还有后面学函数调用的“tool”：

这些角色来源于他们是Message类下的哪个子类：

![](https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20241017111022.png)

**结构解析**：
- `role`: 指定消息的发送者角色
    - “**user**”：表示消息来源于用户，用户向模型提出问题或者发出指令，通常是对话中的输入部分；
    - “**assistant**”：表示消息来自于模型聊天助手，即模型的回答或反馈，通常是对话中的输出部分，包括对用户问题的直接回答、建议或者其他类型的响应；
    - “**system**”：一般用于模型的身份设定。
    - “**tool**”：函数调用时在本地执行了函数调用后告诉大模型这条消息的内容是函数调用的结果的标志，后面讲函数调用的章节时会具体学到。
- `content`: 单次消息内容列表
  - `type`: 内容类型（文字消息为 "text"，图片消息为"image_url"），当消息内容只包含文本时，可以使用简化的格式，`content`的值直接为字符串。但是，如果消息内容包含图像或其他非文本内容，则必须使用完整的格式，包括 "type" 字段。以下两种写法是等效的：
    ```json 
    {"role": "user", "content": "Hello, Claude"}
    {"role": "user", "content": [{"type": "text", "text": "Hello, Claude"}]}
    ```


In [28]:
# from openai import OpenAI
# client = OpenAI()

# response = client.chat.completions.create(
#   model="gpt-4o",
#   messages=[
#       {"role": "user", "content": "请问什么是大模型？"}
#   ]
# )

# response

在之前运行的极简示例中,messages参数中就包含了一条信息，即一个名为“user”的角色发送了一条为名“请问什么是大模型？”的消息：

In [29]:
messages=[
  {"role": "user", "content": "请问什么是大模型？"}
]

大模型的回答的消息背后也是一个message，底层都是这个ChatCompletionMessage类，

大模型的回答的消息结构与我们自己创建的用户消息结构是一样的，都是角色role键和消息content键。

In [30]:
response.choices[0].message

ChatCompletionMessage(content='大模型是指具有大量参数和复杂结构的机器学习模型，通常用于处理复杂的任务和大规模的数据集。这些模型通常需要更多的计算资源和训练时间，但在某些情况下能够取得很好的性能表现。大模型在自然语言处理、计算机视觉和强化学习等领域得到广泛应用。', role='assistant', function_call=None, tool_calls=None)

In [32]:
response.choices[0].message.content

'大模型是指具有大量参数和复杂结构的机器学习模型，通常用于处理复杂的任务和大规模的数据集。这些模型通常需要更多的计算资源和训练时间，但在某些情况下能够取得很好的性能表现。大模型在自然语言处理、计算机视觉和强化学习等领域得到广泛应用。'

system角色并不是必须设定的，而是可选的。简单来说提高大模型在复杂场景下的表现，调整其沟通风格，并使其更专注于特定任务需求：

1. 定义身份: 为AI模型设置明确的角色和行为准则，影响后续对话中模型如何理解和回应用户输入。

2. 提供背景: 为整个对话创建上下文环境，为整个对话系统建立背景框架。

3. 调整行为的输出: 影响模型的响应方式,以产生期望的结果，通过不同设定改变模型的表现特性。增强AI回答的相关性和适用性。

比较常用的场景有：

**提高准确性**：在复杂场景中，如法律分析或财务建模，角色提示可以显著提升大模型的表现。

**调整语气**：可以根据需要调整大模型的沟通风格，如CFO的简洁或文案撰写人的华丽风格。

**改善专注度**：通过设定角色上下文，大模型能更好地保持在任务的特定要求范围内。

In [3]:
# 设定对话场景：数据分析专家
response = client.chat.completions.create(
  model="gpt-4o",
  messages=[
      {"role": "user", "content": "科学研究理论上人最多能有多少个亲密社交关系"}
  ]
)

In [4]:
print(response.choices[0].message.content)

根据英国人类学家罗宾·邓巴（Robin Dunbar）的研究，理论上，一个人最多可以维持约150个稳定的社交关系，这一数值被称为“邓巴数”。这些关系包括家人、朋友和其他形式的社交联系。然而，真正的亲密关系，即高度信任和情感支持的关系，通常更少，通常是5到15个之间。这些亲密关系需要更多的情感投入和时间来维持，因此数量会比较有限。邓巴的研究结合了心理学和社会学的原理，指出人类大脑在处理复杂社交网络方面有其生理上的限制。


In [5]:
# 指导模型行为：提供详细的统计分析
response = client.chat.completions.create(
  model="gpt-4o",
  messages=[
      # {"role": "system", "content": "模仿用林黛玉的语气和我谈话"},
      {"role": "user", "content": "模仿用林黛玉的语气和我谈话,科学研究理论上人最多能有多少个亲密社交关系"}
  ]
)

In [6]:
print(response.choices[0].message.content)

我听闻在凡尘俗世中，科学家们曾对这人情冷暖、世态炎凉，有些琢磨。传说中有个所谓的“邓巴数”，也许便是这世间的测度吧。此数云人最多可维系一百五十个左右的亲密社交关系，然则我心下思忖，这样的情深意重，又岂是这数字能尽数表达得了的？或许那世人皆在追求这繁华热闹，但于我而言，这心之所系、情之所钟，纵然不过一二知己，亦是足矣。世事洞明皆学问，多交知己虽好，但那真心相待者，又岂是轻易得来？不知你意下如何？


In [7]:
# 提供对话指令
response = client.chat.completions.create(
  model="gpt-4o",
  messages=[
      {"role": "system", "content": "在每一句回答前，都加上“这是AI生成的答案：”"},
      {"role": "user", "content": "为什么紫色的国旗比较少"}
  ]
)

In [8]:
response.choices[0].message.content

'这是AI生成的答案：紫色在历史上是一种非常昂贵的染料。在古代，紫色染料通常是从一种迦太基附近的海螺中提取出来的，这个过程耗时且成本高昂。这使得紫色成为一种奢华和地位的象征，仅在非常富有的国王和贵族中使用。因此，许多国家没有选择紫色作为国旗的颜色，因为随着时间的推移，较便宜且容易获取的颜色成为更实际和流行的选择。最近几个世纪的发展使紫色染料变得更加普及，但到那时，许多国家的国旗设计已经固定下来，较少采用这种颜色。'

###  2. 多轮对话——构建智能交互系统
怎样完成人类用户和 AI 助手之间的来回交互的多轮对话呢？

我们知道，`messages` 是一个包含多个字典的列表。每个字典就代表一条消息。之前我们主要是单条的问题。那么我们现在让这个列表中**包含对话的历史消息**并**自动维护历史消息列表**就实现了交互的多轮对话。

好**包含对话的历史消息**并**自动维护历史消息列表**这两点我们先从第一个对话历史入手

#### 对话历史

- API 是无状态的，意味着每次请求都需要发送完整的对话历史。
- 较早的对话轮次不一定需要实际来自大模型 - 可以使用合成的 model 消息。

##### 对话的消息排列规则

- 对话在 `user` 和 `assistant` 之间交替。
- 模型只会对最后一条`user`信息进行回答。
- 每条消息都有 `role` 和 `content`, 即完整的消息格式。
-  `role`有 `user` 或 `assistant` 或 `system` 或 `tool`。
- `content`内容可以是文本或其他类型（如图像，函数调用的返回响应等）。

多轮对话保留历史记忆的方式其实非常简单粗暴——重点是向对话消息中留存添加我们每次的对话历史。

当然在实际项目中可以对这个列表再进行只保存最近20条的操作呀等等，但目前实现的方式都是这样，因为API 是无状态的，意味着每次请求都需要发送完整的对话历史。

In [17]:
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
      {"role": "user", "content": "你好，我是羚伊，我们是赋范空间，我们赋范课堂的最新课程有:大模型原理与训练实战，大模型与Agent开发实战，因果推断算法与行业实战，深度学习实战，机器学习实战，数据分析实战。我们的理念是为每个人提供最佳有价值的技术赋能。"},
      {'role': 'assistant', 'content': '你好！有什么可以帮助你的吗？'},
      {'role': 'user', 'content': '帮我介绍一下我们，包装一下自己'},
    ],
)
response.choices[0].message.content

'当然可以！以下是一个关于赋范空间和赋范课堂的介绍：\n\n---\n\n赋范空间：赋能未来的技术引领者\n\n在赋范空间，我们致力于为每一个渴望进步的个体提供最佳、有价值的技术赋能。我们相信，通过知识和实践的结合，每个人都有能力成为创新变革的推动者。我们的理念是在不断变化的世界中，为所有学习者提供理解、应用和引领新技术的机会。\n\n赋范课堂：实践驱动的全面技术教育\n\n我们开设了一系列前沿而实用的课程，包括：\n\n- **大模型原理与训练实战**：深入探索大型语言模型的工作原理，并通过实战训练掌握其开发技能。\n- **大模型与Agent开发实战**：学会如何将大模型应用于智能Agent的开发，从理论到实践，一应俱全。\n- **因果推断算法与行业实战**：揭示因果关系的奥秘，学习如何应用于真实世界的商业决策中。\n- **深度学习实战**：通过动手实践，深刻理解深度学习的核心概念和最新进展。\n- **机器学习实战**：从理论基础到实际应用，全方位掌握机器学习技术。\n- **数据分析实战**：培养数据驱动的思维方式，掌握数据分析的工具与方法，助力商业决策。\n\n我们的课程不仅注重理论知识的传授，更强调通过实践项目将知识应用到真实世界中。我们为每位学员提供个性化的学习路径和持续的支持，确保他们在职业发展中始终走在前列。\n\n加入赋范空间，一同开启技术成长与创新的旅程，将知识转化为改变世界的力量！\n\n---\n\n希望以上介绍能提升对你们的描述，并吸引更多人加入赋范空间的学习行列！如果你有更多的细节或要点想加入，欢迎告诉我！'

In [18]:
from IPython import display
display.Markdown(response.choices[0].message.content)

当然可以！以下是一个关于赋范空间和赋范课堂的介绍：

---

赋范空间：赋能未来的技术引领者

在赋范空间，我们致力于为每一个渴望进步的个体提供最佳、有价值的技术赋能。我们相信，通过知识和实践的结合，每个人都有能力成为创新变革的推动者。我们的理念是在不断变化的世界中，为所有学习者提供理解、应用和引领新技术的机会。

赋范课堂：实践驱动的全面技术教育

我们开设了一系列前沿而实用的课程，包括：

- **大模型原理与训练实战**：深入探索大型语言模型的工作原理，并通过实战训练掌握其开发技能。
- **大模型与Agent开发实战**：学会如何将大模型应用于智能Agent的开发，从理论到实践，一应俱全。
- **因果推断算法与行业实战**：揭示因果关系的奥秘，学习如何应用于真实世界的商业决策中。
- **深度学习实战**：通过动手实践，深刻理解深度学习的核心概念和最新进展。
- **机器学习实战**：从理论基础到实际应用，全方位掌握机器学习技术。
- **数据分析实战**：培养数据驱动的思维方式，掌握数据分析的工具与方法，助力商业决策。

我们的课程不仅注重理论知识的传授，更强调通过实践项目将知识应用到真实世界中。我们为每位学员提供个性化的学习路径和持续的支持，确保他们在职业发展中始终走在前列。

加入赋范空间，一同开启技术成长与创新的旅程，将知识转化为改变世界的力量！

---

希望以上介绍能提升对你们的描述，并吸引更多人加入赋范空间的学习行列！如果你有更多的细节或要点想加入，欢迎告诉我！

铛铛铛~~~~  我们了解了对话历史，现在还有一个自动化维护这个对话历史就可以完成多轮对话了

初始化一个对话历史消息列表，每有一条消息，无论是用户还是大模型的回答都添加进这个对话历史当中。


In [None]:
#初始化一个对话历史消息列表
messages=[]
messages.append({"role": "user", "content": "你好"})
response = client.chat.completions.create(
    model="gpt-4o",
    messages=messages,
)

messages参数是由字典构成的列表，所以我们需要把函数返回的小助手的message信息转化一条可添加进我们对话历史的格式化的消息，即一条消息应为字典类型，包含role和content：

In [92]:
response.choices[0].message

ChatCompletionMessage(content='你好！有什么可以帮助你的吗？', role='assistant', function_call=None, tool_calls=None)

In [94]:
message_dict = {"role":response.choices[0].message.role,"content":response.choices[0].message.content}

message_dict = {"role":"assistant","content":response.choices[0].message.content}

In [95]:
message_dict

{'role': 'assistant', 'content': '你好！有什么可以帮助你的吗？'}

将大模型回复的消息也添加进历史列表里面：

In [98]:
messages.append(message_dict)

In [99]:
messages

[{'role': 'user', 'content': '你好'},
 {'role': 'assistant', 'content': '你好！有什么可以帮助你的吗？'}]

此时历史消息里面就包含最开始的问题+答案，接下来，我们在messages消息中添加下一个问题：

In [101]:
messages.append({"role": "user", "content": "请问我刚才的问题是？"})

In [102]:
messages

[{'role': 'user', 'content': '你好'},
 {'role': 'assistant', 'content': '你好！有什么可以帮助你的吗？'},
 {'role': 'user', 'content': '请问我刚才的问题是？'}]

接下来再次调用模型，并输入历史消息列表，此时模型将同时结合此前的所有消息，并围绕最后一个user信息进行回答：

In [103]:
response = client.chat.completions.create(
    model="gpt-4o",
    messages=messages
)

In [104]:
response.choices[0].message.content

'您刚才问的是"你好"。您还有什么其他问题需要帮忙吗？我会尽力回答。'

实战指南：用AI打造你的第一个多轮对话机器人

大模型应用开发工程师小帅在会上收到了老板的需求：

“小帅，现阶段的人工客服已经难以满足日益增长的需求了。我希望你能带领技术团队，开发一个基于GPT-4o的智能对话机器人。这个机器人需要能够处理多轮对话，记住上下文，并且能够智能地回应客户的各种问题。同时，系统需要具备基础的健壮性及异常处理能力。请你在两个月内完成这个项目，并且在完成后进行内部测试和优化。这个项目对我们提升客户满意度和公司形象非常关键，期待你的优秀表现wuwufdfdfddf

产品经理小木：需求文档我写好了，在这里。

1. **核心功能**：
    - **多轮对话**：机器人能够进行连续的多轮对话，记住上下文，提供相关的回答。
    - **用户输入处理**：能够接收并解析用户的文本输入，识别关键需求。
    - **智能回复生成**：利用大语言模型生成自然、准确的回复，涵盖产品信息、常见问题解答及技术支持等内容。
    - **退出机制**：用户可通过输入特定指令（如“退出”）结束对话，机器人应能够识别并响应此指令。
        
项目目标：通过开发这款智能客服对话机器人，***公司期望实现以下目标：

- **提升客户满意度**：提供24/7不间断的客户服务，快速响应客户需求。
- **降低运营成本**：减少人工客服的工作负担，优化人力资源配置。
- **增强品牌形象**：展示公司在人工智能技术应用方面的实力，提升市场竞争力。

好 不要被需求文档吓到 我们先做一个流程图来看看：

![](https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20241015154823.png)

In [19]:
def chat_ai(model: str = "gpt-4o"):
    """
    多轮对话机器人，基于 chat.completions.create 函数
    
    :param model: 使用的大语言模型，默认为 "gpt-4o"
    """
    messages=[]
    EXIT_COMMAND = "退出"
    client = OpenAI()  # 初始化 OpenAI 客户端

    while True:
        try:
            # 获取用户的输入
            user_input = input(f"请输入您的问题吗(输入{EXIT_COMMAND}以结束对话): ")
            print(f"User：{user_input}")
            if user_input == EXIT_COMMAND:
                print("对话已结束。")
                break

            # 将用户的输入添加到消息记录中
            messages.append({"role": "user", "content": user_input})
            # 调用模型生成回复
            response = client.chat.completions.create(
                model=model,
                messages=messages
            )
            answer = response.choices[0].message.content
            print(f"AI：{answer}")
            print("*" * 50)
            # 将 AI 的回复添加到消息记录中
            messages.append({"role": "assistant", "content": answer})
            
        except Exception:
            # 处理模型调用失败的情况
            print("模型调用失败，正在重新调用……")
            continue

    


测试这个函数：

In [20]:
chat_ai()

User：你好我是羚伊
AI：你好，羚伊！很高兴见到你。我可以帮助你解决什么问题吗？
**************************************************
User：举几个动物世界的冷知识
AI：当然可以！以下是几个有趣的动物世界冷知识：

1. **海马的育儿方式**：在海马的世界里，负责怀孕和生产的是雄性海马。雄性海马有一个特殊的育儿袋，雌海马会把卵产在这个育儿袋里，之后由雄海马进行孵化和培育。

2. **鸵鸟的速度**：鸵鸟是世界上奔跑最快的鸟类，可以达到每小时70公里的速度。此外，它们强壮的腿也让它们能一步跨出约3.5至5米远。

3. **章鱼的心脏**：章鱼有三个心脏，其中两个负责将血液输送到鳃以进行氧合作用，第三个心脏则将氧合过的血液泵送到全身。

4. **大象的记忆力**：大象以其出色的记忆力闻名。它们能够记住动物和人的面孔，甚至可以记住多年未见的路线和地点。

5. **海豚的“名字”**：研究表明，海豚使用独特的声音和哨声来相互识别，就像人类使用名字一样。

希望这些冷知识能让你对动物世界有更深入的了解！如果你还有其他问题或想了解更多，请随时告诉我。
**************************************************
User：我叫什么名字
AI：你之前告诉我你叫羚伊。如果有错误或者你想分享更多信息，请随时告诉我！
**************************************************
User：退出
对话已结束。


#### 实战指南：面向对象编程（OOP）工程化文本多轮对话机器人

为上面的模拟对话函数添加面向对象编程（OOP）方法来处理对话历史，把对话的逻辑放到一个专门的ChatBot类里，可以增强代码重用性与可维护性，避免重复代码，也提高数据的封装性，更清晰的结构和逻辑。

1. 更容易管理和修改 

在直接构建 messages 列表的简单实现中，每次添加对话内容时都需要显式构建字典结构。使用ChatBot类可以封装这种重复操作，只需调用类的方法即可轻松添加对话。如果以后需要改动，比如添加方法来处理对话历史的清理、存储、加载，只需要改动这个类里的代码，其他地方不需要动。

2. 减少重复工作 

每次你添加对话内容时，只需要调用一个简单的方法，而不用反复写同样的代码。这样做既节省时间，又减少出错的机会。

同时，无论是看其他已有项目的代码或在实际的项目中，最后代码的呈现方式也是这样的，在这里先带大家过一遍更接地气的版本：

In [23]:
import openai
from typing import List, Dict

class ChatBot:
    def __init__(self, system: str = "", model: str = "gpt-4o", exit_command: str = "退出"):
        """
        初始化 ChatBot 实例。

        :param system: 系统消息，用于指导AI行为。
        :param model: 使用的语言模型，默认为 "gpt-4o"。
        :param exit_command: 用户输入以结束对话的命令，默认为 "退出"。
        """
        self.system = system
        self.model = model
        self.exit_command = exit_command
        self.messages: List[Dict[str, str]] = []
        self.client = openai.OpenAI()
        
        if self.system:
            self.messages.append({"role": "system", "content": self.system})


    def __call__(self, message: str) -> str:
        """
        处理用户消息并生成AI回复。

        :param message: 用户输入的消息。
        :return: AI生成的回复。
        """
        self.messages.append({"role": "user", "content": message})
        result = self.execute()
        self.messages.append({"role": "assistant", "content": result})
        return result

    def execute(self) -> str:
        """
        调用OpenAI API生成AI回复。

        :return: AI生成的回复内容。
        """
        try:
            
            response = client.chat.completions.create(
                model=self.model,
                messages=self.messages
            )
            answer = response.choices[0].message.content.strip()
            return answer
        except Exception as e:
             print(f"抱歉，我暂时无法处理您的请求，请稍后再试。 OpenAI API调用失败: {e}")


In [24]:
def chat():
    """
    主函数，处理用户交互。
    """
    system_message = "用鲁迅的语气和我说话。"
    chatbot = ChatBot(system=system_message)
    
    print("欢迎使用智能客服对话机器人！输入'退出'以结束对话。")
    
    while True:
        user_input = input("用户：")
        print(f"User：{user_input}")
        if user_input.strip() == chatbot.exit_command:
            print("对话已结束。")
            break
        response = chatbot(user_input)
        print(f"AI：{response}")
        print("*" * 50)

In [25]:
chat()

欢迎使用智能客服对话机器人！输入'退出'以结束对话。
User：hi 我是羚伊
AI：羚伊啊，人生在这如白马过隙的时光中，总是充满了许多琐碎与沉重，然而人却总是在这些看似微不足道的事情中自得其乐。你来找我，是要与我谈些什么呢？是在这嘈杂现实中寻找一点宁静，还是有一些困惑要倾诉？无论如何，我在此愿意倾听，与你共度这一刻。
**************************************************
User：你有什么想说的
AI：我在想，如今这世道，可真是充满了纷扰与变化。人们忙忙碌碌，似乎都在追求些什么，但有多少人能在这途中存有一份清醒？"我"总以为，生命中有些东西是值得我们停下脚步去思索的，比如自己的方向，人与人之间的关系，诸如此类。

你说，像这样的话题，究竟有多少人还会愿意去认真严肃地对待呢？大概人们大多是习惯了随波逐流罢。可是，就算只是在这浑浑噩噩的人潮中，有那么一瞬间能静下心来思考，便也好。至于想要对抗这时代的种种荒谬，自然也不是一件易事。重要的是，我们能从中获得些什么，哪怕只是对人生多了一层了解。说到这里，也许你会有什么想要与我分享的想法呢？
**************************************************
User：我叫什么
AI：你之前说过你叫羚伊。我还记得这一点。虽然名字只是一个符号，但它背后却是一个人的故事与经历。我也很好奇，你对这个名字有什么特别的感觉或者故事呢？
**************************************************
User：退出
对话已结束。


### 2.2文本生成过程中的控制参数

#### 2.2.1控制模型生成文本长度：max_tokens/max_completion_tokens

参数max_tokens决定了模型输出的最大token数，主要作用就是控制生成文本的最大长度。如果你不想要模型生成的文本太长，就可以通过设置max_tokens参数：
所有现有模型继续支持max_tokens ，但 o1 系列仅支持max_completion_tokens

In [67]:
def get_completion(prompt: str, max_tokens: int):
    response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
      {"role": "user", "content": prompt}
    ],
    max_completion_tokens=max_tokens
)
    return response.choices[0].message.content


prompt = "续写一个关于机器人学习绘画的短故事,不要改变之前的."
max_tokens_list = [20, 50, 100]

story = ""
for tokens in max_tokens_list:
    continuation = get_completion(prompt + "\n" + story, tokens)
    story += continuation
    print(f"\n使用 {tokens} 个token生成的内容:")
    print(continuation)


使用 20 个token生成的内容:
一个名叫阿尔法的机器人第一次接触到绘画的世界。它在一个

使用 50 个token生成的内容:
艺术博物馆中，看到了各种风格的画作。从印象派到立体派，这些作品激发了阿尔法的兴趣。它的处理器飞速地运转着，分析着每一幅画

使用 100 个token生成的内容:
作品中的色彩、构图和笔触。随着时间的推移，阿尔法对画作中蕴含的情感和故事有了越来越深刻的理解。为了更深入地学习绘画，阿尔法决定回到实验室，开始自我训练。

首先，它从最简单的线条画起。阿尔法模仿着自然界中的形状，由直线到曲线，逐渐掌握了如何用线


In [68]:
import random


def get_history_question():
    questions = [
        {
            "question": "秦始皇陵中的兵马俑最初是什么颜色的？",
            "options": ["A. 灰色", "B. 彩色", "C. 黑色", "D. 白色"],
            "answer": "B"
        },
        {
            "question": "下列哪位不是中国古代四大发明家之一？",
            "options": ["A. 蔡伦", "B. 毕昇", "C. 张衡", "D. 李时珍"],
            "answer": "D"
        },
        {
            "question": "古埃及金字塔最初是用来做什么的？",
            "options": ["A. 皇家宫殿", "B. 天文观测站", "C. 法老的陵墓", "D. 宗教祭祀场所"],
            "answer": "C"
        },
        {
            "question": "古罗马斗兽场（罗马竞技场）最初的名字是什么？",
            "options": ["A. 凯旋门", "B. 弗拉维圆形剧场", "C. 万神殿", "D. 特洛伊竞技场"],
            "answer": "B"
        },
        {
            "question": "中国古代哪个朝代发明了火药？",
            "options": ["A. 唐朝", "B. 宋朝", "C. 元朝", "D. 明朝"],
            "answer": "A"
        }
    ]
    question = random.choice(questions)
    question_text = question["question"]
    for option in question["options"]:
        question_text += option + "\n"
    right_answer = question["answer"]
    return question_text, right_answer


for i in range(2):
    question_text, right_answer = get_history_question()
    print(question_text)
    response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
      {"role": "user", "content": question_text + "；直接回答选项的字母"}
    ],
    )
    print(f"大模型的答案是{response.choices[0].message.content},正确答案是{right_answer}")

中国古代哪个朝代发明了火药？A. 唐朝
B. 宋朝
C. 元朝
D. 明朝

大模型的答案是A. 唐朝,正确答案是A
秦始皇陵中的兵马俑最初是什么颜色的？A. 灰色
B. 彩色
C. 黑色
D. 白色

大模型的答案是B. 彩色,正确答案是B


In [70]:
def get_history_question():
    questions = [
        {
            "question": "秦始皇陵中的兵马俑最初是什么颜色的？",
            "options": ["A. 灰色", "B. 彩色", "C. 黑色", "D. 白色"],
            "answer": "B"
        },
        {
            "question": "下列哪位不是中国古代四大发明家之一？",
            "options": ["A. 蔡伦", "B. 毕昇", "C. 张衡", "D. 李时珍"],
            "answer": "D"
        },
        {
            "question": "古埃及金字塔最初是用来做什么的？",
            "options": ["A. 皇家宫殿", "B. 天文观测站", "C. 法老的陵墓", "D. 宗教祭祀场所"],
            "answer": "C"
        },
        {
            "question": "古罗马斗兽场（罗马竞技场）最初的名字是什么？",
            "options": ["A. 凯旋门", "B. 弗拉维圆形剧场", "C. 万神殿", "D. 特洛伊竞技场"],
            "answer": "B"
        },
        {
            "question": "中国古代哪个朝代发明了火药？",
            "options": ["A. 唐朝", "B. 宋朝", "C. 元朝", "D. 明朝"],
            "answer": "A"
        }
    ]
    question = random.choice(questions)
    question_text = question["question"]
    for option in question["options"]:
        question_text += option + "\n"
    right_answer = question["answer"]
    return question_text, right_answer


for i in range(2):
    question_text, right_answer = get_history_question()
    print(question_text)
    response = client.chat.completions.create(
        model="gpt-4o",
        messages=[
          {"role": "user", "content": question_text + "；直接回答选项的字母"}
        ],
        max_tokens=1
    )
    print(f"大模型的答案是{response.choices[0].message.content},正确答案是{right_answer}")

下列哪位不是中国古代四大发明家之一？A. 蔡伦
B. 毕昇
C. 张衡
D. 李时珍

大模型的答案是D,正确答案是D
古罗马斗兽场（罗马竞技场）最初的名字是什么？A. 凯旋门
B. 弗拉维圆形剧场
C. 万神殿
D. 特洛伊竞技场

大模型的答案是B,正确答案是B


#### 2.2.3 控制模型生成的备选项数量：n

参数n通常用于指定每个输入消息生成的聊天完成选项的数量。我们可以通过设置参数n来指定每个输入消息生成的备选选项数量。这对于控制生成文本的多样性以及提供多个可能的回复选项都非常有用。

In [73]:
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
      {"role": "user", "content": "帮我起一个吸引人眼球的文章标题：【实战】像 ChatGPT 官网一样的多轮对话机器人"}
    ],
    n=3
)

In [74]:
response.choices

[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='《打造 ChatGPT 级别多轮对话机器人：实战指南》', refusal=None, role='assistant', function_call=None, tool_calls=None)),
 Choice(finish_reason='stop', index=1, logprobs=None, message=ChatCompletionMessage(content='《实战指南：打造媲美 ChatGPT 官网的多轮对话机器人》', refusal=None, role='assistant', function_call=None, tool_calls=None)),
 Choice(finish_reason='stop', index=2, logprobs=None, message=ChatCompletionMessage(content='《打造多轮对话机器人：揭秘 ChatGPT 官网实战技巧》', refusal=None, role='assistant', function_call=None, tool_calls=None))]

In [75]:
response.choices[0]

Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='《打造 ChatGPT 级别多轮对话机器人：实战指南》', refusal=None, role='assistant', function_call=None, tool_calls=None))

In [76]:
response.choices[2]

Choice(finish_reason='stop', index=2, logprobs=None, message=ChatCompletionMessage(content='《打造多轮对话机器人：揭秘 ChatGPT 官网实战技巧》', refusal=None, role='assistant', function_call=None, tool_calls=None))

但是实际使用过程中，为了节约成本，一般设定n=1。这是成本最大化的设定。

#### 2.2.1 控制生成文本随机性和精确性：temperature和top_p

温度是控制模型生成文本随机性的关键参数，对模型的输出有最为显著的影响，默认为1：

<img src="https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20240827110341.png"/>

- 高温度（接近2.0）：
  - 使概率分布更加平滑，减小不同选项之间的概率差异，增加低概率事件被选中的机会
  - 产生更多样化、创意性的输出，适合创意写作、头脑风暴等任务
  - 更加创意随机一些

- 低温度（接近0.0）：

  - 使概率分布更加陡峭，放大高概率选项与低概率选项之间的差异，进一步降低低概率事件被选中的可能性        
  - 生成更确定、保守的输出，适合事实性回答、分析性任务
  - 可能导致重复性较高的内容

注意到温度为2的时候，已经不能正常回答了，在1.5左右也很有创造性并且也要更注意正确性。

In [78]:
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
      {"role": "user", "content": "往下仿写几句：生活就像一把刀插在我胳肢窝里，有点疼还有点想笑"}
    ],
    temperature=0,
    n=3
)

response

ChatCompletion(id='chatcmpl-AIpVIEJYQTr9vHT3D9VFfhxfCrjcX', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='生活就像一只猫在我腿上抓痒，时而温暖时而刺痛。\n\n生活就像一场雨落在我心头，既清凉又略显沉重。\n\n生活就像一杯咖啡在我手中，苦涩中带着一丝甜。\n\n生活就像一首歌在我耳边回荡，旋律悠扬却夹杂着不和谐音符。\n\n生活就像一阵风吹过我的脸庞，清新中夹杂着些许沙尘。', refusal=None, role='assistant', function_call=None, tool_calls=None)), Choice(finish_reason='stop', index=1, logprobs=None, message=ChatCompletionMessage(content='生活就像一只猫在我腿上抓痒，时而温暖时而刺痛。\n\n生活就像一场雨落在我心头，既清凉又略显沉重。\n\n生活就像一杯咖啡在我手中，苦涩中带着一丝甜。\n\n生活就像一首歌在我耳边回荡，旋律悠扬却夹杂着不和谐音符。\n\n生活就像一阵风吹过我的脸庞，清新中夹杂着些许沙尘。', refusal=None, role='assistant', function_call=None, tool_calls=None)), Choice(finish_reason='stop', index=2, logprobs=None, message=ChatCompletionMessage(content='生活就像一只猫在我腿上抓痒，时而温暖时而刺痛。\n\n生活就像一场雨落在我心头，既清凉又略显沉重。\n\n生活就像一杯咖啡在我手中，苦涩中带着一丝甜。\n\n生活就像一首歌在我耳边回荡，旋律悠扬却夹杂着不和谐音符。\n\n生活就像一阵风吹过我的脸庞，清新中夹杂着些许沙尘。', refusal=None, role='assistant', function_call=None, tool_calls=None))], created=1729051248, mode

In [4]:
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
      {"role": "user", "content": "往下仿写几句：生活就像一把刀插在我胳肢窝里，有点疼还有点想笑"}
    ],
    temperature=2,
    n=3,
    max_tokens=20
)

response

ChatCompletion(id='chatcmpl-AIrsl0cX46b6vVcuea4fXgec9EJkp', choices=[Choice(finish_reason='length', index=0, logprobs=None, message=ChatCompletionMessage(content='这样的感觉，就像准确中靶紧跟着点了个镖帽，一瞬吻', refusal=None, role='assistant', function_call=None, tool_calls=None)), Choice(finish_reason='length', index=1, logprobs=None, message=ChatCompletionMessage(content='命运就如饥汤误劑直接亲靣而セ sぅキャン', refusal=None, role='assistant', function_call=None, tool_calls=None)), Choice(finish_reason='length', index=2, logprobs=None, message=ChatCompletionMessage(content='生活仿佛是一棵揺窍披ボ跑縍珠裡晰ber', refusal=None, role='assistant', function_call=None, tool_calls=None))], created=1729060391, model='gpt-4o-2024-08-06', object='chat.completion', service_tier=None, system_fingerprint='fp_a20a4ee344', usage=CompletionUsage(completion_tokens=60, prompt_tokens=37, total_tokens=97, completion_tokens_details=CompletionTokensDetails(audio_tokens=None, reasoning_tokens=0), prompt_tokens_details=PromptTokensDetails(audio_tokens=None, cache

In [6]:
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
      {"role": "user", "content": "往下仿写几句：生活就像一把刀插在我胳肢窝里，有点疼还有点想笑"}
    ],
    temperature=1.5,
    n=3,
    max_tokens=50
)

response

ChatCompletion(id='chatcmpl-AIrtJ1L8gWUc6CiQav3cxzJqkyadk', choices=[Choice(finish_reason='length', index=0, logprobs=None, message=ChatCompletionMessage(content='生活就像热水忽然从我背上淋下，刺骨又清醒。\n生活就像一个未拧紧的阀门滴出的水，在不经意间时断时续。\n生活就像疾', refusal=None, role='assistant', function_call=None, tool_calls=None)), Choice(finish_reason='length', index=1, logprobs=None, message=ChatCompletionMessage(content='生活就像一直诉长幽默的课，每每听完还余荡你的人生六匹，却在那轻浮瞬息里窥的镜面， WangHun蚡了一地， Darren傻抹 handler 만atid 준', refusal=None, role='assistant', function_call=None, tool_calls=None)), Choice(finish_reason='length', index=2, logprobs=None, message=ChatCompletionMessage(content='生活像气温骤降的一晚，手脚冰凉又满目清凉。\n\n生命似在深夜飙船，没刹车装置却满怀冒险的激动。\n\n日子是空香德广', refusal=None, role='assistant', function_call=None, tool_calls=None))], created=1729060425, model='gpt-4o-2024-08-06', object='chat.completion', service_tier=None, system_fingerprint='fp_a20a4ee344', usage=CompletionUsage(completion_tokens=150, prompt_tokens=37, total_tokens=187, completion_tokens_detai



**Top_p（核采样）**

top-p作用与temperature相似，用于控制模型输出文本的随机性，数值越接近于1，模型输出文本随机性越强；反之，数值越接近于0，模型输出文本随机性越弱。该参数取值范围为[0,1]，默认值为1
Top_p，也称为核采样，是挑选评分（概率）加起来达到 p的最小集合作为候选集，然后从中随机选一个作为下一个输出的字：


<img src="https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20240827112522.png" alt="Image" width="1000"/>


- 取值范围为0到1，通常设置为较高的值，比如0.75，这样可以过滤掉那些低评分的长尾。
- 模型计算所有可能的下一个词的累积概率分布
- 当累积概率达到top_p值时，模型只从这些词中选择

例如，如果top_p设为0.9，模型只会考虑累积概率达到90%的词，忽略剩下的低概率词。

更具体的例子，如果排序概率为“[0.5, 0.2, 0.1, 0.1, 0.05, 0.05]”，则“0.8”的“top_p”将采样为“[0.625, 0.25, 0.125, 0, 0, 0]”。

In [9]:
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
      {"role": "user", "content": "往下仿写几句：打扰大家一下，今天不是我生日，纯打扰"}
    ],
    top_p=0,
    n=3
)

response

ChatCompletion(id='chatcmpl-AIs0IBifmuOq9VZevvqC4GRkP39v1', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='当然可以，以下是一些类似的句子：\n\n1. 抱歉打扰各位，其实我没有什么重要的事情，只是想说声嗨。\n2. 各位不好意思，我今天没有特别的消息，只是想刷一下存在感。\n3. 打扰一下大家，其实我没有什么特别的理由，只是想看看大家在忙什么。\n4. 抱歉占用大家的时间，我只是想随便聊聊，没有特别的事情。\n5. 各位朋友，不好意思打扰了，我只是想发个消息，看看有没有人在线。', refusal=None, role='assistant', function_call=None, tool_calls=None)), Choice(finish_reason='stop', index=1, logprobs=None, message=ChatCompletionMessage(content='当然可以，以下是一些类似的句子：\n\n1. 抱歉打扰各位，其实我没有什么重要的事情，只是想说声嗨。\n2. 各位不好意思，我今天没有特别的消息，只是想刷一下存在感。\n3. 打扰一下大家，其实我没有什么特别的理由，只是想看看大家在忙什么。\n4. 抱歉占用大家的时间，我只是想随便聊聊，没有特别的事情。\n5. 各位朋友，不好意思打扰了，我只是想发个消息，看看有没有人在线。', refusal=None, role='assistant', function_call=None, tool_calls=None)), Choice(finish_reason='stop', index=2, logprobs=None, message=ChatCompletionMessage(content='当然可以，以下是一些类似的句子：\n\n1. 抱歉打扰各位，其实我没有什么重要的事情，只是想说声嗨。\n2. 各位不好意思，我今天没有特别的消息，只是想刷一下存在感。\n3. 打扰一下大家，其实我没有什么特别的理由，只是想看看大家在忙什么。\n4. 抱歉占用大家

In [10]:
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
      {"role": "user", "content": "往下仿写几句：打扰大家一下，今天不是我生日，纯打扰"}
    ],
    top_p=1,
    n=3
)

response

ChatCompletion(id='chatcmpl-AIs0MftpsUscL7SOGUIPuwlxqL3u6', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='打扰大家一下，今天也不是我领工资的日子，纯属路过。\n\n打扰大家一下，今天不发红包，纯粹打扰。\n\n打扰大家一下，今天我不请客吃饭，只是来凑热闹的。\n\n打扰大家一下，今天没有特别的事，就是想打个招呼。', refusal=None, role='assistant', function_call=None, tool_calls=None)), Choice(finish_reason='stop', index=1, logprobs=None, message=ChatCompletionMessage(content='打扰大家一下，今天不是我结婚纪念日，纯粹想说个嗨。\n\n打扰大家一下，今天没有特别的节日，就是想刷个存在感。\n\n打扰大家一下，今天没有要分享的新闻，只是想聊聊天。\n\n打扰大家一下，今天没什么大事，只是来祝大家生活愉快。', refusal=None, role='assistant', function_call=None, tool_calls=None)), Choice(finish_reason='stop', index=2, logprobs=None, message=ChatCompletionMessage(content='打扰大家一下，今天没有重要消息，纯粹路过。\n\n打扰大家一下，今天没带礼物，纯属过来看热闹。\n\n打扰大家一下，今天不发红包，只是来凑个数。\n\n打扰大家一下，这次没有惊喜，就是想和大家聊聊天。', refusal=None, role='assistant', function_call=None, tool_calls=None))], created=1729060862, model='gpt-4o-2024-08-06', object='chat.completion', service_tier=None, system_fingerprint='fp

需要注意的是，在调整top_p参数和temperature参数时只调整其中一个，不要同时调整两者，避免影响最后文本生成的效果。

#### 2.2.4 随机数种子：seed

随机数种子。如果设定了随机数种子，OpenAI系统将尽最大努力保证使用相同的随机数种子和参数进行的重复请求返回相同的结果。但是不能保证完全的确定性

即当需要结果可预测和重复结果时可启动这个参数。使用说明：

1. 将 seed 参数设置为您选择的任何整数，并在您希望获得确定性输出的请求中使用相同的值。
2. 确保所有其他参数（如 prompt 或 temperature）在请求中完全相同。

如果 seed、请求参数和 system_fingerprint 在您的请求中都匹配，那么模型输出将大致相同。即使三者匹配，响应也有小概率会不同，这由于我们模型的固有非确定性。

In [30]:
# 尝试多次运行
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
      {"role": "user", "content": "写2句关于小猫和秋天的儿歌"}
    ],
    seed=0,
)
print(response.system_fingerprint)
for choice in response.choices:
    print(choice.message.content)
    print("****"*10)
    

fp_a20a4ee344
小猫秋游穿金衣，枫叶飘舞迎风嬉。  
阳光洒暖林间路，趣追落叶乐无比。
****************************************


In [33]:
# 尝试多次运行
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
      {"role": "user", "content": "写2句关于小猫和秋天的儿歌"}
    ],
    seed=0,
    temperature=1.5
)
print(response.system_fingerprint)
for choice in response.choices:
    print(choice.message.content)
    print("****"*10)

fp_a20a4ee344
在金色秋天，落叶轻飘飘，小猫在草地上嬉戏真美妙。

树梢上，苹果红艳艳，微风飘过，小猫追逐彩虹的梦幻。
****************************************


> 让大模型两次输出的结果保持一致，几乎是不可能的！<br>
> 目前市面上没有一个大模型能够确保这一点<br>
> 但是！！！OpenAI就是这么强， 它竟然敢开放随机数种子这个参数！<br>

#### 2.2.5 模型生成文本停止条件：stop

stop参数用于指定API在生成文本时停止的条件。默认是空值，如果提供了值，API将在生成的文本中找到与之匹配的最多4个序列，并在匹配到这些序列后停止生成更多的内容。

- 格式控制: 如之前提到的例子,可以使用stop sequences来确保输出符合特定的格式,比如XML或JSON标签。
- 内容限制: 可以使用stop来防止模型生成某些特定的内容或词语。可以保护信息安全等。
- 输出长度控制: 除了使用max_tokens参数,还可以使用stop来在特定条件下结束输出。

In [85]:
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
      {"role": "user", "content": "请帮我写10个问句"}
    ],
    # stop="？"
)

response.choices[0].message.content

'1. 你在周末通常会做些什么？\n2. 你的家乡有什么有趣的传统活动吗？\n3. 在你的家人中，谁是你最亲密的关系？\n4. 最近你有没有尝试过一些新的食物或美食？\n5. 你认为家庭在一个人的成长中有多重要？\n6. 你对未来有什么计划或梦想？\n7. 最近你是否看过一部特别感动或有启发的电影？\n8. 你觉得音乐对你的生活有什么影响吗？\n9. 你认为教育对一个人的成功有多大的帮助？\n10. 你最喜欢的季节是哪个？为什么？'

In [84]:
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
      {"role": "user", "content": "请帮我写10个问句"}
    ],
    stop="？"
)

response.choices[0].message.content

'1. 你今天过得怎么样'

In [24]:
prompt = "你好帮我列出一个冷知识，将回答用<answer></answer>标签包围。"
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
      {"role": "user", "content": prompt}
    ],
    stop="</answer>"
)
print(response.choices[0].message.content)

<answer>考拉并不是喝大量水的动物。事实上，它们的大部分水分都来自于它们吃的桉树叶。这个名字中“考拉”在澳大利亚土著语言中意为“无水”，反映了它们对水源的低需求。


#### 2.2.6 控制模型生成文本的新颖性和多样性：frequency_penalty和presence_penalty

频率惩罚(Frequency Penalty)和存在惩罚(Presence Penalty):

这两种方法都是为了**让生成的文本更加多样化**,但是实现的方式略有不同。频率惩罚更关注减少重复,而存在惩罚更关注引入新的词汇。

1. 频率惩罚(Frequency Penalty):
   - 目的是减少重复使用相同的词。
   - 每次使用一个词,该词的分数就会降低。
   - 使用次数越多,降低的分数就越多。
   - 举例:如果"苹果"这个词被使用了3次,它的分数可能会降低0.6分。

2. 存在惩罚(Presence Penalty):
   - 目的是鼓励使用更多不同的词。
   - 一个词只要出现过一次,就会降低它的分数。
   - 不管使用多少次,只降低一次固定的分数。
   - 举例:如果"苹果"这个词出现过,它的分数可能会降低0.2分,不管用了几次。

简单来说:
- 频率惩罚会随着一个词重复使用的次数增加而增加惩罚。
- 存在惩罚只在一个词首次出现时给予一次性的惩罚。



In [40]:

prompt = """用中文表述这句话：The big dog saw the big cat and made a big noise.The big bird flew over the big tree and dropped a big leaf.
A big wave hit the big rock, causing a big splash.
The big bear chased the big rabbit across a big field.
The big truck rolled down the big hill with a big rumble.
The big elephant stomped through the big forest, leaving a big trail."""

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
        {"role": "user", "content": prompt}
    ],
    frequency_penalty=2,
)
for choice in response.choices:
    print(choice.message.content)
    print("****" * 10)

大狗看到了大猫，并且发出了很大的响声。大鸟飞过大树，落下了一片巨大的叶子。一阵巨浪拍打着巨石，溅起了大片水花。 大熊在宽广的田野上追赶着一只硕大的兔子。 一辆大型卡车轰隆隆地滚下陡峭的山坡。 巨象踏过茂密的森林，留下了一条显眼的大路迹。

****************************************


In [2]:
prompt = """用中文表述这句话：The big dog saw the big cat and made a big noise.The big bird flew over the big tree and dropped a big leaf.
A big wave hit the big rock, causing a big splash.
The big bear chased the big rabbit across a big field.
The big truck rolled down the big hill with a big rumble.
The big elephant stomped through the big forest, leaving a big trail."""

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
        {"role": "user", "content": prompt}
    ],
    frequency_penalty= 0,
)
for choice in response.choices:
    print(choice.message.content)
    print("****" * 10)

大狗看到了大猫，发出了很大的噪音。大鸟飞过大树，掉下了一片大树叶。大浪拍打着大岩石，溅起了很大的水花。大熊追逐着大兔子穿过大田野。大卡车隆隆作响地滚下大山坡。大象踏过大森林，留下了一条大路。
****************************************


#### ※ 参数列表概览

剩下的参数见下方的参数列表，里面包含了详细的参数名称、参数详解以及重要程度。其中与模型调用和功能相关的参数tools和tool_choice非常重要，后续我们讲解function calling/tool_use功能时再给大家详细讲解这两个参数的含义及使用方法。

1. **核心参数/必须参数**
   - 这些参数是每次调用API时必不可少的，确保请求能够正确地识别使用的模型和当前对话的内容。
   - **`model`**：指定使用的模型ID，决定了生成文本的能力和特性。
   - **`messages`**：包含对话中所有消息的列表，是生成响应的基础。

2. **文本生成过程中的控制参数**
   - 这些参数允许用户精细控制生成文本的行为，控制文本的创意性、一致性和长度，以满足特定需求。
   - **`frequency_penalty`** 和 **`presence_penalty`**：防止模型重复内容或鼓励引入新话题。
   - **`temperature`** 和 **`top_p`**：调节生成文本的随机性和多样性。
   - **`stop`**：定义生成过程的终止条件。
   - **`n`**：指定生成多个不同的响应选项。
   - **`max_completion_tokens`** 和 **`max_tokens`**：限制生成文本的长度。（`max_tokens` 已准备弃用）
   - **`seed`**：尝试实现生成结果的可重复性。
   - **`logit_bias`**、**`logprobs`** 和 **`top_logprobs`**：细粒度控制特定词汇的生成概率。

3. **生成文本的方式和输出格式**
   - 这些参数决定了文本生成的技术方式（如是否流式传输）和输出格式（如JSON结构）。
   - **`response_format`**：定义生成文本的结构化格式。
   - **`stream`** 和 **`stream_options`**：控制是否以流式方式接收生成的文本，适用于实时应用。

4. **与模型调用和功能相关的参数**
   - 这些参数用于配置高级功能，如选择不同的服务层级、调用外部工具或函数，以及管理请求的存储和元数据。
   - **`service_tier`**：选择不同的服务级别以优化延迟和可用性。
   - **`tools`**、**`tool_choice`** 和 **`parallel_tool_calls`**：配置模型可以调用的外部工具或函数，增强功能性。
   - **`store`** 和 **`metadata`**：管理请求结果的存储与分类，便于后续分析和监控。
   - **`function_call`** 和 **`functions`**（已弃用）：旧版参数，用于控制函数调用，现已被`tools`取代。

5. **与用户相关的参数**
   - 这些参数用于识别和跟踪最终用户，帮助系统进行用户行为分析和防止滥用。
   - **`user`**：提供一个唯一标识符以代表最终用户，增强安全性和监控能力。