# Gemini API基本调用——文本生成

环境准备：安装依赖库和设置API KEY

适用于 Gemini API 的 Python SDK 包含在 google-generativeai 软件包。使用 pip 安装：


In [None]:
!pip install -q -U google-generativeai

如需使用 Gemini API，是需要注册gemini后免费获取调用 API 密钥的。如果您还没有账号， 需要在 Google AI Studio 中注册创建密钥（在前面的课程内容中）。

## Gemini 1.5 Flash 和 Gemini 1.5 Pro 免费层级的功能及价格

| 功能 | Gemini 1.5 Flash | Gemini 1.5 Pro |
|---|---|---|
| 模型 | Gemini 1.5 Flash | Gemini 1.5 Pro |
| 特点 | 最快的多模态模型，处理重复性任务出色，100万个上下文窗口 | 新一代模型，突破性的 200 万上下文窗口 |
| 发布状态 | 正式推出，可用于生产环境 | 正式推出，可用于生产环境 |
| **免费层级** |  |  |
| API 服务 | 通过 API 服务提供，速率限制较低，用于测试目的 | 通过 API 服务提供，速率限制较低，用于测试目的 |
| Google AI Studio | 在所有适用的国家/地区完全免费 | 在所有适用的国家/地区完全免费 |
| **速率限制** |  |  |
| 每分钟请求数 (RPM) | 15 | 2 |
| 每分钟令牌数 (TPM) | 1,000,000 | 32,000 |
| 每日请求数 (RPD) | 1,500 | 50 |
| **价格** |  |  |
| 输入价格 | 免费 | 免费 |
| 输出价格 | 免费 | 免费 |
| **上下文缓存** |  |  |
| 存储 | 免费，每小时最多 100 万个令牌存储 | 不适用 |

**总结:**

* Gemini 1.5 Flash 更适合需要高吞吐量和较大上下文窗口（100 万）的任务，例如处理重复性任务。
* Gemini 1.5 Pro 提供更大的上下文窗口（200 万），但免费层级的速率限制较低。它更适合需要处理更长文本或对话的场景，但目前不支持调整和上下文缓存。


导入库并配置APIKEY。

In [34]:
import os

import google.generativeai as genai

# 第一种方法，通过环境变量隐式的存储，
# 会在我的电脑里面寻找名为"API_KEY"的环境变量，
# 所以可以将APIKEY由环境变量的方式存在于电脑中，如果只是在自己电脑上使用，推荐第一种
genai.configure(api_key=os.environ["API_KEY"], transport='rest')

# 第二种方法，在电脑中显性的用变量显示
# genai.configure(api_key="AIza...",transport='rest')


发出第一个请求

In [30]:
model = genai.GenerativeModel('models/gemini-1.5-flash')
response = model.generate_content("响指是如何打响的")
print(response.text)

响指的原理其实很简单，它利用的是 **弹性势能** 的释放。

1. **压迫：** 当你将拇指和食指的指尖紧贴在一起，并在拇指的侧面施加压力时，你实际上是压缩了食指的指尖。
2. **存储弹性势能：** 食指的指尖就像一个被压缩的弹簧一样，存储了弹性势能。
3. **突然释放：** 当你迅速地将食指和拇指分开时，你突然释放了存储的弹性势能。
4. **空气振动：** 由于能量的释放，食指的指尖会快速移动，并击打空气，从而产生一个压力波。
5. **声音：** 这个压力波会迅速传播，并最终传到你的耳朵，让你听到响指的声音。

简单来说，响指就是利用指尖的压缩和释放，产生一个快速移动的物体（指尖）来击打空气，从而发出声音。



可能遇到的报错由于每个人电脑的Python环境不同,有可能出现相关库的版本过低等，则可以重新pip install安装

如果是网络超时的问题，则检查要设置网络传输方式transport = ‘rest’，即ganai配置函数中genai.configure（）添加transport = ‘rest’

## 掌握Gemini API 的coding
###  1. Gemini API 之文本调用

Gemini API 支持文本，图像，Vision，音频，长上下文，代码执行，JSON 模式，函数调用，系统指令等生成功能。我们先从文本生成开始讲起。

它的主要流程是这样：

![](https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20240919153231.png)

创建genai实例并配置API KEY，genai实例选择模型生成模型实例，模型实例调用generateContent函数生成对话

以下两行代码就创建genai实例并配置了API KEY

In [39]:
import google.generativeai as genai

genai.configure(api_key=os.environ["API_KEY"])

通过API Key认证的genai就和我们的账户挂钩了，同时也建立了调用Gemini的桥梁，genai实例就相当于我们代码版的 ai studio，能关联到我们的账户，比如我们的文件，微调的模型等。在这里我们，可以理解它为和我们自己滴血结成契约的独有小精灵，麾下能召唤许多模型们，各自的模型小助手们能够联络Gemini模型并生成回答。

genai实例并不能直接生成回答，而是genai实例选择模型生成模型实例才可以调用函数得到回答。genai实例更像是更上一层级的账户管理，即导航菜单。

例如它可以存储文件，查看模型等等。其文件 API 允许每个项目存储最多 20GB 的文件，每个文件的大小不超过 2GB。文件存储 48 小时，并且可以在此期间使用您的 API 密钥进行访问，服务为免费提供。

In [40]:
import os

print(os.getcwd())

D:\PycharmProject\Gemini-系列


In [41]:
import os

sample_file = genai.upload_file(path="media/压缩_手写照片.jpg", display_name="Sample drawing")

TimeoutError: [WinError 10060] 由于连接方在一段时间后没有正确答复或连接的主机没有反应，连接尝试失败。

In [21]:
print(f"Uploaded file '{sample_file.display_name}' as: {sample_file.uri}")

Uploaded file 'Sample drawing' as: https://generativelanguage.googleapis.com/v1beta/files/kkfb3ho0yt42


In [35]:
genai.list_files()

import pprint

for file_path in genai.list_files():
    pprint.pprint(file)

这个genai实例也可以列出可以在Gemini API 中可以使用的模型，并查找有关模型的详细信息。

In [None]:
genai.list_models()

import pprint

for model in genai.list_models():
    pprint.pprint(model)

Model(name='models/chat-bison-001',
      base_model_id='',
      version='001',
      display_name='PaLM 2 Chat (Legacy)',
      description='A legacy text-only model optimized for chat conversations',
      input_token_limit=4096,
      output_token_limit=1024,
      supported_generation_methods=['generateMessage', 'countMessageTokens'],
      temperature=0.25,
      max_temperature=None,
      top_p=0.95,
      top_k=40)
Model(name='models/text-bison-001',
      base_model_id='',
      version='001',
      display_name='PaLM 2 (Legacy)',
      description='A legacy model that understands text and generates text as an output',
      input_token_limit=8196,
      output_token_limit=1024,
      supported_generation_methods=['generateText', 'countTextTokens', 'createTunedTextModel'],
      temperature=0.7,
      max_temperature=None,
      top_p=0.95,
      top_k=40)
Model(name='models/embedding-gecko-001',
      base_model_id='',
      version='001',
      display_name='Embedding Gecko

使用list_models()查看可用的模型。这些模型要支持generateContent，这是我们本次讲的用于对话，模型生成回答的主要方法。

In [26]:
for m in genai.list_models():
    if "generateContent" in m.supported_generation_methods:
        print(m.name)

models/gemini-1.0-pro-latest
models/gemini-1.0-pro
models/gemini-pro
models/gemini-1.0-pro-001
models/gemini-1.0-pro-vision-latest
models/gemini-pro-vision
models/gemini-1.5-pro-latest
models/gemini-1.5-pro-001
models/gemini-1.5-pro
models/gemini-1.5-pro-exp-0801
models/gemini-1.5-pro-exp-0827
models/gemini-1.5-flash-latest
models/gemini-1.5-flash-001
models/gemini-1.5-flash-001-tuning
models/gemini-1.5-flash
models/gemini-1.5-flash-exp-0827
models/gemini-1.5-flash-8b-exp-0827


有了独特的的契约助手（由我们API KEY认证的）后，如果我们想要向大模型发起问话，需要什么必须的信息告诉助手呢？

1、 使用哪个模型，我们也已经获取了模型列表 2、我们的问题是什么

具体的使用方式是先通过GenerativeModel()创建实例,里面传入指定要使用的模型名称,格式为 "models/{model}"，就创建了模型的一个实例，撒豆成兵

In [24]:
model = genai.GenerativeModel('models/gemini-1.5-flash-exp-0827')

In [29]:
model_info = genai.get_model('models/gemini-1.5-flash-exp-0827')
model_info

Model(name='models/gemini-1.5-flash-exp-0827',
      base_model_id='',
      version='exp-0827',
      display_name='Gemini 1.5 Flash Experimental 0827',
      description='Fast and versatile multimodal model for scaling across diverse tasks',
      input_token_limit=1048576,
      output_token_limit=8192,
      supported_generation_methods=['generateContent', 'countTokens'],
      temperature=1.0,
      max_temperature=2.0,
      top_p=0.95,
      top_k=64)

In [None]:
model.generate_content()

generate_content函数是Gemini API中的重要方法,用于生成模型响应，可以用于各种任务,如文本生成、对话、音频、视频、调用微调后的模型发起对话等

因为是在模型实例下的方法，这个对象本身就包含了model的信息，所以函数里面只需要把对话信息加上就可以了

主要参数:

| 参数 | 说明 | 是否必需 |
|---|---|---|
| contents | 包含对话内容的列表。单轮对话包含一个元素，多轮对话包含整个历史 | 是 |
| tools | 允许模型使用外部工具的列表，支持 Function 和 codeExecution | 否 |
| toolConfig | 工具的配置信息 | 否 |
| safetySettings | 安全设置列表，用于阻止不安全内容 | 否 |
| systemInstruction | 设置的系统指令，目前仅支持文本 | 否 |
| generationConfig | 模型生成和输出的 token 配置选项 | 否 |
| cachedContent | 使用缓存的内容作为上下文 | 否 | 




In [31]:
response = model.generate_content("响指是如何打响的")
print(response)

response:
GenerateContentResponse(
    done=True,
    iterator=None,
    result=protos.GenerateContentResponse({
      "candidates": [
        {
          "content": {
            "parts": [
              {
                "text": "\u54cd\u6307\u7684\u539f\u7406\u5728\u4e8e\u5229\u7528\u624b\u6307\u7684\u5feb\u901f\u8fd0\u52a8\u548c\u7a7a\u6c14\u6469\u64e6\u4ea7\u751f\u7684\u58f0\u97f3\u3002 \n\n\u5177\u4f53\u6765\u8bf4\uff1a\n\n1. **\u5feb\u901f\u79fb\u52a8:** \u5f53\u4f60\u5feb\u901f\u5730\u5c06\u62c7\u6307\u548c\u98df\u6307\u7528\u529b\u6469\u64e6\u5728\u4e00\u8d77\u65f6\uff0c\u5b83\u4eec\u4e4b\u95f4\u7684\u7a7a\u9699\u8fc5\u901f\u53d8\u5c0f\uff0c\u5e76\u8feb\u4f7f\u7a7a\u6c14\u4ece\u8fd9\u4e2a\u7a7a\u9699\u4e2d\u5feb\u901f\u6d41\u51fa\u3002\n2. **\u7a7a\u6c14\u6469\u64e6:** \u7531\u4e8e\u7a7a\u6c14\u4ece\u72ed\u5c0f\u7684\u7a7a\u95f4\u4e2d\u5feb\u901f\u6d41\u51fa\uff0c\u5b83\u4f1a\u4e0e\u5468\u56f4\u7684\u7a7a\u6c14\u4ea7\u751f\u5267\u70c8\u7684\u6469\u64e6\uff0c\u4ece\u800c\u4ea7\

In [6]:
print(response.text)

打响指的原理是利用手指的快速运动和空气压力差来产生响声。

**具体步骤：**

1. **伸直食指和拇指。**
2. **将食指紧贴拇指的侧面。**
3. **快速弹动食指，使其离开拇指并突然释放。**

**原理：**

* 当食指快速弹动时，它会压缩拇指和食指之间的空气。
* 由于空气是不可压缩的，这种压缩会产生一个高压区域。
* 当食指离开拇指时，高压区域会迅速膨胀，导致空气压力突然降低。
* 这个突然的压力变化会在空气中产生声波，我们听到的就是响指的声音。

**影响响指声音的因素：**

* **手指的力量和速度：**手指弹动的力量和速度越大，响指的声音越响亮。
* **手指的形状和大小：**手指的形状和大小会影响空气压缩的程度，从而影响响指的声音。
* **周围环境：**周围环境的温度和湿度也会影响响指的声音。

**其他：**

* 打响指需要一定的技巧和练习才能掌握。
* 响指是一种常见的表达方式，可以用来表达各种情绪，例如赞赏、兴奋、惊讶等等。



![](https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20240919153231.png)

In [7]:
import google.generativeai as genai

genai.configure(api_key=os.environ["API_KEY"], transport='rest')
model = genai.GenerativeModel('models/gemini-1.5-flash')
response = model.generate_content("影子可不可以是彩色的")
print(response.text)

影子可以是彩色的！虽然我们通常认为影子是黑色的，但实际上，它们只是光线不足的地方。  

当光线穿过有色物体时，它会吸收某些颜色并反射其他颜色。如果光线照射到红色物体上，红色物体将吸收大部分光线并反射红色光线。当这种红色光线照射到表面时，就会形成一个红色的影子。

所以，如果光源是彩色光，或者物体是透明的且有颜色，那么影子就会呈现出相应的光线或物体的颜色。例如，如果用蓝色灯光照射一个红色的物体，影子将呈现紫色。

以下是影子呈现彩色的几种情况：

* **彩色光源：**使用彩色灯光照射物体，例如舞台灯光、霓虹灯等。
* **透明彩色物体：**例如，彩色玻璃、彩色水等。
* **光线折射：**光线穿过不同介质时会发生折射，例如透过棱镜的光线。

因此，影子并非只有黑色，它们也可以呈现出各种各样的颜色，这取决于光线和物体的特性。



现在框架我们知道了解了，来细究一下负责对话构建的也是唯一的一个必须参数——contents

主要参数:

| 参数 | 说明 | 是否必需 |
|---|---|---|
| contents | 包含对话内容的列表。单轮对话包含一个元素，多轮对话包含整个历史 | 是 |
| tools | 允许模型使用外部工具的列表，支持 Function 和 codeExecution | 否 |
| toolConfig | 工具的配置信息 | 否 |
| safetySettings | 安全设置列表，用于阻止不安全内容 | 否 |
| systemInstruction | 设置的系统指令，目前仅支持文本 | 否 |
| generationConfig | 模型生成和输出的 token 配置选项 | 否 |
| cachedContent | 使用缓存的内容作为上下文 | 否 | 


对话构建：`contents: List[Dict[str, Any]]`

**定义**：包含对话历史和当前用户输入的消息列表。

**格式**：列表，包含字典，字典中的键的类型是 str（字符串类型），字典中的值可以是任意类型。

**重要性**：
- 提供对话上下文
- 决定 AI 理解和回应的基础

列表里的Dict[str, Any]对应一个Content对象，

1. Content 结构:
   Content 主要由两个字段组成:parts 和 role。

2. role 字段:
   - 可选字段,表示内容的生产者是谁，如果是单轮对话,可以留空不设置
   - 值只能是 'user' 或 'model'
   - 在多轮对话中很有用,用于区分是用户输入还是模型回复

3. parts 字段:
   这是一个包含 Part 对象的列表,每个 Part 代表消息的一部分。对于文本相关的内容,我们主要关注 Part 中的 text 字段。即是一个字符串类型的字段，就是用户的问题或模型的回答。

用法格式：

   ```python
   messages = [
       {
           'role': 'user',
           'parts': ['你的消息文本']
       }
   ]
   ```


4. 完整的使用示例：
   ```python
   # 单轮对话
   messages = [{'role': 'user', 'parts': ['你好，我是羚伊']}]
   response = model.generate_content(messages)

   print(response.text)

   # 多轮对话
   messages = [
       {'role': 'user', 'parts': ['你好，我是羚伊']},
       {'role': 'model', 'parts': ['你好羚伊！很高兴认识你。我是一个AI助手']},
       {'role': 'user', 'parts': ['我叫什么名字']}
   ]
   response = model.generate_content(messages)

   print(response.text)
   ```
   - 对于多轮对话，只需要在messages列表中添加更多的字典（上下文消息）即可。

In [32]:
messages = [
    {'role': 'user', 'parts': ['你好，我是羚伊']},
    {'role': 'model', 'parts': ['你好羚伊！很高兴认识你。我是一个AI助手，有什么我可以帮助你的吗？']},
    {'role': 'user', 'parts': ['我叫什么名字']}
]
response = model.generate_content(messages)

print(response.text)

你说你叫羚伊呀 是不是想确认一下？ 



###  2. 多轮对话——构建智能交互系统
怎样完成人类用户和 AI 助手之间的来回交互的多轮对话呢？以下是一些关键点：

#### 对话历史

- API 是无状态的，意味着每次请求都需要发送完整的对话历史。
- 较早的对话轮次不一定需要实际来自大模型 - 可以使用合成的 model 消息。

#### 揭秘对话结构

##### 对话的消息排列规则

- 对话在 `user` 和 `model` 之间交替。
- 第一条消息必须是 `user` 角色。

##### 对话中每条消息的格式

- 每条消息都有 `role` 和 `parts`, 即完整的消息格式。
-  `role`只有 `user` 或 `model`。
- `parts`内容可以是文本或其他类型（如图像，函数调用的返回响应等）。

重点是向对话消息中留存添加我们每次的对话历史。



In [45]:
messages = [{'role': 'user', 'parts': ['你好，我是羚伊']}]
response = model.generate_content(messages)

In [35]:
print(response.text)

你好，羚伊！很高兴认识你。 你今天过得怎么样？你想聊些什么呢？ 



In [36]:
print(response)

response:
GenerateContentResponse(
    done=True,
    iterator=None,
    result=protos.GenerateContentResponse({
      "candidates": [
        {
          "content": {
            "parts": [
              {
                "text": "\u4f60\u597d\uff0c\u7f9a\u4f0a\uff01\u5f88\u9ad8\u5174\u8ba4\u8bc6\u4f60\u3002 \u4f60\u4eca\u5929\u8fc7\u5f97\u600e\u4e48\u6837\uff1f\u4f60\u60f3\u804a\u4e9b\u4ec0\u4e48\u5462\uff1f \n"
              }
            ],
            "role": "model"
          },
          "finish_reason": "STOP",
          "index": 0,
          "safety_ratings": [
            {
              "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
              "probability": "NEGLIGIBLE"
            },
            {
              "category": "HARM_CATEGORY_HATE_SPEECH",
              "probability": "NEGLIGIBLE"
            },
            {
              "category": "HARM_CATEGORY_HARASSMENT",
              "probability": "NEGLIGIBLE"
            },
            {
              "category": 

In [46]:
print(response.candidates[0].content)

parts {
  text: "你好，羚伊！很高兴认识你。 \n\n你想聊些什么呢？ \n\n我可以帮你：\n\n*  找到信息 \n*  写故事 \n*  翻译语言 \n*  玩游戏 \n\n或者，你也可以跟我聊任何你感兴趣的话题。 \n"
}
role: "model"



In [39]:
messages.append(response.candidates[0].content)
print(messages)

[{'role': 'user', 'parts': ['你好，我是羚伊']}, parts {
  text: "你好，羚伊！很高兴认识你。 你今天过得怎么样？你想聊些什么呢？ \n"
}
role: "model"
]


In [40]:
messages.append({'role': 'user', 'parts': ['月亮正面的坑是怎么形成呢']})
response = model.generate_content(messages)

In [41]:
print(response.text)

月球表面的坑洞，也就是陨石坑，主要由以下几种方式形成：

**1. 陨石撞击：** 这是月球表面坑洞最主要的形成原因。月球没有大气层，无法像地球一样阻挡来自太空的陨石，因此会直接受到各种大小的陨石撞击。

* **撞击过程：** 陨石以高速撞击月球表面，巨大的能量会瞬间将岩石融化、汽化，并产生巨大的冲击波。
* **坑洞形成：** 冲击波会在地表产生一个碗状凹陷，这就是我们看到的陨石坑。坑洞的形状、大小取决于撞击陨石的大小、速度和角度。

**2. 火山活动：** 月球表面也曾经存在火山活动，火山喷发会形成一些坑洞。

* **火山喷发：** 熔岩从地表喷发，形成火山锥，也可能形成火山坑。
* **火山坑：** 熔岩喷发后，火山口可能塌陷，形成一个凹陷的坑洞。

**3. 地质运动：** 月球内部的地质运动也会形成一些坑洞。

* **地壳运动：** 月球内部的地壳运动会产生裂缝，并可能形成一些深坑。

**4. 阳光照射：** 太阳辐射对月球表面的岩石也会造成侵蚀，也会形成一些小的坑洞。

**值得注意的是：**

* 月球表面坑洞的数量和分布可以反映月球的历史。
* 通过研究这些坑洞，我们可以了解月球的形成和演化。
* 由于月球没有大气层，这些坑洞能够保存得很完整，可以为我们提供许多关于太阳系早期历史的信息。

希望以上解答能让你对月球表面的坑洞形成有更深入的了解！



In [42]:
messages.append(response.candidates[0].content)
print(messages)

[{'role': 'user', 'parts': ['你好，我是羚伊']}, parts {
  text: "你好，羚伊！很高兴认识你。 你今天过得怎么样？你想聊些什么呢？ \n"
}
role: "model"
, {'role': 'user', 'parts': ['月亮正面的坑是怎么形成呢']}, parts {
  text: "月球表面的坑洞，也就是陨石坑，主要由以下几种方式形成：\n\n**1. 陨石撞击：** 这是月球表面坑洞最主要的形成原因。月球没有大气层，无法像地球一样阻挡来自太空的陨石，因此会直接受到各种大小的陨石撞击。\n\n* **撞击过程：** 陨石以高速撞击月球表面，巨大的能量会瞬间将岩石融化、汽化，并产生巨大的冲击波。\n* **坑洞形成：** 冲击波会在地表产生一个碗状凹陷，这就是我们看到的陨石坑。坑洞的形状、大小取决于撞击陨石的大小、速度和角度。\n\n**2. 火山活动：** 月球表面也曾经存在火山活动，火山喷发会形成一些坑洞。\n\n* **火山喷发：** 熔岩从地表喷发，形成火山锥，也可能形成火山坑。\n* **火山坑：** 熔岩喷发后，火山口可能塌陷，形成一个凹陷的坑洞。\n\n**3. 地质运动：** 月球内部的地质运动也会形成一些坑洞。\n\n* **地壳运动：** 月球内部的地壳运动会产生裂缝，并可能形成一些深坑。\n\n**4. 阳光照射：** 太阳辐射对月球表面的岩石也会造成侵蚀，也会形成一些小的坑洞。\n\n**值得注意的是：**\n\n* 月球表面坑洞的数量和分布可以反映月球的历史。\n* 通过研究这些坑洞，我们可以了解月球的形成和演化。\n* 由于月球没有大气层，这些坑洞能够保存得很完整，可以为我们提供许多关于太阳系早期历史的信息。\n\n希望以上解答能让你对月球表面的坑洞形成有更深入的了解！\n"
}
role: "model"
]


In [43]:
messages.append({'role': 'user', 'parts': ['我的名字叫什么？我的上一个问题是什么']})
response = model.generate_content(messages)
print(response.text)

你的名字叫 **羚伊**。

你上一个问题是 **“月亮正面的坑是怎么形成呢”**。 

 很高兴能记住你的名字和之前的对话！ 还有什么问题想问我吗？ 



* 你的名字叫 **羚伊**。
* 你的上一个问题是：**月亮正面的坑是怎么形成呢**


很乐意为你服务！  有任何问题，尽管提出来。 



In [None]:
messages = [{'role': 'user', 'parts': ['你好，我是羚伊']}]
response = model.generate_content(messages)  # 你好，羚伊！很高兴认识你。 有什么可以帮到你的吗？ 
messages.append(response.candidates[0].content)
messages.append({'role': 'user', 'parts': ['月亮正面的坑是怎么形成呢']})
response = model.generate_content(messages)

多轮对话机器人

In [7]:
def chat_with_Gemini(model):
    conversation = []

    while True:
        user_input = input("你: ")
        if user_input.lower() == "exit":
            print("结束对话。")
            print(conversation)
            break
        print(f"你: {user_input}")
        # 添加用户输入到对话历史
        conversation.append({
            "role": "user",
            "parts": [{"text": user_input}]
        })

        # 生成响应
        response = model.generate_content(conversation)

        # 打印模型响应
        print(f"Gemini: {response.text}")

        # 添加模型响应到对话历史
        conversation.append({
            "role": "model",
            "parts": [{"text": response.text}]  # 将 response.text 作为 text 的值
        })

    return conversation

In [8]:
import google.generativeai as genai

genai.configure(api_key=os.environ["API_KEY"], transport='rest')
model = genai.GenerativeModel('models/gemini-1.5-flash')
history_message = chat_with_Gemini(model)

你: 你好
Gemini: 你好！ 很高兴你来找我，请问你想聊些什么呢？ 

你: 给小孩讲一个笑话‘
Gemini: 为什么小兔子不喜欢玩捉迷藏？

因为牠很容易被发现！ 

哈哈，你喜欢吗？ 还有其他想听的笑话吗？ 

你: 嗨
Gemini: 嗨！ 很高兴你来找我，你想聊些什么呢？ 你想听个笑话吗？ 

结束对话。
[{'role': 'user', 'parts': [{'text': '你好'}]}, {'role': 'model', 'parts': [{'text': '你好！ 很高兴你来找我，请问你想聊些什么呢？ \n'}]}, {'role': 'user', 'parts': [{'text': '给小孩讲一个笑话‘'}]}, {'role': 'model', 'parts': [{'text': '为什么小兔子不喜欢玩捉迷藏？\n\n因为牠很容易被发现！ \n\n哈哈，你喜欢吗？ 还有其他想听的笑话吗？ \n'}]}, {'role': 'user', 'parts': [{'text': '嗨'}]}, {'role': 'model', 'parts': [{'text': '嗨！ 很高兴你来找我，你想聊些什么呢？ 你想听个笑话吗？ \n'}]}]


In [9]:
print(history_message)

[{'role': 'user', 'parts': [{'text': '你好'}]}, {'role': 'model', 'parts': [{'text': '你好！ 很高兴你来找我，请问你想聊些什么呢？ \n'}]}, {'role': 'user', 'parts': [{'text': '给小孩讲一个笑话‘'}]}, {'role': 'model', 'parts': [{'text': '为什么小兔子不喜欢玩捉迷藏？\n\n因为牠很容易被发现！ \n\n哈哈，你喜欢吗？ 还有其他想听的笑话吗？ \n'}]}, {'role': 'user', 'parts': [{'text': '嗨'}]}, {'role': 'model', 'parts': [{'text': '嗨！ 很高兴你来找我，你想聊些什么呢？ 你想听个笑话吗？ \n'}]}]


之前的课程里我们使用了原生函数generate_content来在发送的prompt中通过包含历史消息的方式来实现多轮对话

这次我们将要介绍新的专门为多轮对话准备的函数start chat

In [22]:
import os

import google.generativeai as genai

genai.configure(api_key=os.environ["API_KEY"], transport='rest')
model = genai.GenerativeModel('models/gemini-1.5-flash-exp-0827')

In [3]:
response = model.generate_content([{'role': 'user', 'parts': [{'text': '你好，我是羚伊'}]}, 
   {'role': 'model', 'parts': [{'text': '你好！ 很高兴你来找我，请问你想聊些什么呢？ \n'}]},
   {'role': 'user', 'parts': [{'text': '我上一句说了什么'}]}, 
   ])
print(response.text)

你上一句说的是：


**“你好，我是羚伊”**


很高兴认识你，羚伊！ 



可以简化格式成：

In [7]:
response = model.generate_content([{'role': 'user', 'parts': '你好，我是羚伊'}, 
   {'role': 'model', 'parts': '你好！ 很高兴你来找我，请问你想聊些什么呢？ \n'},
   {'role': 'user', 'parts': '我上一句说了什么'}, 
   ])
print(response.text)

你上一句说的是：


**“你好，我是羚伊”** 


很高兴认识你，羚伊！ 



In [23]:
history_message = [{'parts': '你好，我是羚伊'}, 
                   {'parts': '你好！ 很高兴你来找我，请问你想聊些什么呢？ \n'},
                   {'parts': '我上一句说了什么'}, 
                   ]
response = model.generate_content(history_message)
print(response.text)

BadRequest: 400 POST https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash-exp-0827:generateContent?%24alt=json%3Benum-encoding%3Dint: Please use a valid role: user, model.

技巧：预填写

In [6]:

response = model.generate_content([{'role': 'user', 'parts': [{'text': '你好，我是羚伊'}]}, 
{'role': 'model', 'parts': [{'text': '你好！ 很高兴你来找我，请问你想聊些什么呢？ \n'}]},
{'role': 'user', 'parts': [{'text': '我上一句说了什么'}]},
{'role': 'model', 'parts': [{'text': '你说的是“你好'}]},
])
print(response.text)

，我是羚伊”。


很高兴认识你，羚伊！ 



接下来我们要介绍Gemini封装的为多轮对话设计的函数start_chat()

In [24]:
chat = model.start_chat()
response = chat.send_message("你好，我是羚伊")
print(response.text)
response = chat.send_message("科学研究理论上人最多能有多少个亲密社交关系，还有什么相关的冷知识吗")
print(response.text)
response = chat.send_message("我的名字是什么")
print(response.text)

你好，羚伊！很高兴认识你。 

有什么我可以帮助你的吗？ 

## 人最多能有多少个亲密社交关系？

理论上，人最多能维持的稳定亲密社交关系数量，被认为是**150人左右**，这个数字被称为 **“邓巴数字”** (Dunbar's number)。 

**邓巴数字的由来：**

* 英国人类学家罗宾·邓巴（Robin Dunbar）通过对灵长类动物的研究发现，灵长类动物的群体规模与其大脑新皮层的体积成正比。
* 他将这种关系应用到人类身上，推测出人类大脑新皮层的大小能够支持大约150个稳定关系的认知负荷。

**需要注意的是，这个数字只是一个估计，并非绝对的限制。** 

* **“亲密社交关系”的定义:** 邓巴数字指的是能够记住名字、了解其基本情况、并在社交场合中进行互动的人群。并非所有150人都需要是最好的朋友，而是指在一个社交网络中能够保持联系的个体。
* **个体差异:**  每个人的社交能力和需求不同，有些人可能拥有更广泛的社交圈，而有些人则更偏向于小而紧密的社交圈。
* **社会网络的影响:** 如今的社交媒体和互联网使得我们能够与更多人保持联系，但这并不一定意味着这些关系都属于“亲密社交关系”。

## 相关的冷知识：

* **“150法则”在实际生活中也有体现:** 许多组织和团体，例如早期教会、军队和部落，其规模通常都维持在150人左右，这可能与人类的社交认知能力有关。
* **人类的社交网络并非孤立的：** 我们的社交网络通常会形成层级结构，核心层包含最亲密的朋友和家人，外围层则包含较为疏远的熟人。
* **社交关系对心理健康至关重要:** 拥有稳定的社交关系能够促进心理健康，而社交孤立则可能导致抑郁和焦虑等心理问题。
* **现代社会对社交关系提出了挑战:** 快节奏的生活和数字化的沟通方式，可能导致我们与亲朋好友的联系减少，从而影响社交关系的质量。


希望以上信息能够帮助你了解人类社交关系的奥秘！如果你还有其他问题，欢迎随时提问。 

你的名字是**羚伊**。 

我记得我们一开始的对话，你就是这么称呼自己的。 



![](https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20240923185542.png)

可以看到，开启的对话实际上是一个ChatSession对象，我们来看看它的架构

![](https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20240925144604.png)

1. ChatSession 的作用:
   这个类用于管理与 AI 模型的持续对话。它保存了整个对话的历史记录。

2. 主要属性:
   - history: 保存整个对话的历史记录
   - last: 返回最后一次收到的 AI 回复

3. 主要方法:
   - __init__: 初始化聊天会话,可以提供一个初始的对话历史
   - send_message: 发送消息给 AI 并获取回复
     - 可以设置生成配置、安全设置等
     - 支持流式响应(stream=True)
   - send_message_async: send_message 的异步版本
   - rewind: 从对话历史中删除最后一对请求/响应

4. 使用示例:
   ```python
   model = genai.GenerativeModel('models/gemini-pro')
   chat = model.start_chat()
   response = chat.send_message("Hello")
   print(response.text)
   ```

5. 特点:
   - 自动保存对话历史
   - 可以设置生成参数和安全设置
   - 支持流式响应,可以边生成边输出
   - 提供同步和异步两种调用方式
   - 可以通过 history 属性查看完整对话历史


In [25]:
import google.generativeai as genai

model = genai.GenerativeModel('gemini-1.5-flash')
import os

genai.configure(api_key=os.environ["API_KEY"], transport='rest')
chat = model.start_chat()
r1 = chat.send_message("我是羚伊")
print(r1.text)
r2 = chat.send_message("我的名字是什么？")
print(r2.text)
r3 = chat.send_message("上一个问题是什么")

很高興認識您，羚伊！請問您想聊些什麼呢？ 



KeyboardInterrupt: 

使用start_chat的send_message函数和generate_content原生的对话函数做对比：

入参：

![](https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20240923164109.png)

In [26]:
def start_chat_with_Gemini(model):
    chat = model.start_chat()
    while True:
        user_input = input('用户: ')
        if user_input.lower() == "exit":
                print("结束对话。")
                break
        chat.send_message(user_input)
        print(f"Assistant:{chat.last.text}")
    return chat.history

In [28]:
def orgin_chat_with_Gemini(model):
    conversation = []

    while True:
        user_input = input("你: ")
        if user_input.lower() == "exit":
            print("结束对话。")
            break
        print(f"你: {user_input}")
        # 添加用户输入到对话历史
        conversation.append({
            "role": "user",
            "parts": [{"text": user_input}]
        })

        # 生成响应
        response = model.generate_content(conversation)

        # 打印模型响应
        print(f"Gemini: {response.text}")

        # 添加模型响应到对话历史
        conversation.append({
            "role": "model",
            "parts": [{"text": response.text}]  # 将 response.text 作为 text 的值
        })

    return conversation

In [29]:
orgin_history=orgin_chat_with_Gemini(model)

你: hi 我是羚伊
Gemini: 您好，羚伊！很高兴认识你！ 你想聊些什么呢？ 

你: 我的上一个问题是什么
Gemini: 你的上一个问题是： "hi 我是羚伊"

你想继续聊些什么呢？ 

结束对话。


In [27]:
start_chat_history=start_chat_with_Gemini(model)

Assistant:你好，羚伊！很高兴认识你 你想聊些什么呢？ 

Assistant:你上一个问题是：

**"hi 我是羚伊"**

你好像刚开始跟我聊天呢！ 

你想聊些什么呢？我可以陪你聊聊最近的新闻，或者推荐你看什么电影，也可以跟你聊聊你的爱好！ 

结束对话。


In [None]:
chat = model.start_chat(start_chat_history)
response=chat.send_message("我都问过什么问题")


![](https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20240925150057.png)

In [11]:

import os
import json
from datetime import datetime
import google.generativeai as genai

def enhanced_chat_with_gemini(model, initial_history=None, max_turns=10, save_history=True):
    """
    Enhanced Gemini chat function.

    :param model: Gemini model instance
    :param initial_history: Initial chat history (optional)
    :param max_turns: Maximum number of chat turns
    :param save_history: Whether to save the chat history
    :return: Complete chat history
    """
    # Initialize chat
    try:
        if initial_history:
            chat = model.start_chat(history=initial_history)
            print("Loaded previous chat history.")
        else:
            chat = model.start_chat()
            print("Starting a new chat.")
    except Exception as e:
        print(f"Error initializing chat: {str(e)}")
        return

    turn_count = 0
    while turn_count < max_turns:
        # User input
        user_input = input('User: ')
        if user_input.lower() in ["exit", "quit", "bye"]:
            print("Ending chat.")
            break

        # Handle special commands
        if user_input.startswith("/"):
            handle_special_command(user_input, chat)
            continue

        # Send message to model
        try:
            response = chat.send_message(user_input)
            print(f"AI: {response.text}")
        except Exception as e:
            print(f"Error: {str(e)}")
            continue

        turn_count += 1

    if save_history:
        save_chat_history(chat.history)

    return chat.history

def handle_special_command(command, chat):
    """Handle special commands."""
    if command == "/history":
        print("\nChat History:")
        for msg in chat.history:
            role = "User" if msg.role == "user" else "AI"
            content = ''.join([part.text for part in msg.parts])
            print(f"{role}: {content}")
    elif command == "/clear":
        chat.history = []
        print("Chat history has been cleared.")
    elif command == "/save":
        save_chat_history(chat.history)
    else:
        print("Unknown command. Available commands: /history, /clear, /save")

def save_chat_history(chat_history):
    """Save chat history to a JSON file."""
    # Convert chat history to a serializable format
    serializable_history = []
    for msg in chat_history:
        try:
            # 提取消息内容
            content = ''
            for part in msg.parts:
                content += part.text
            # 创建可序列化的字典
            serializable_msg = {
                'role': msg.role,
                'parts': content
            }
            serializable_history.append(serializable_msg)
        except Exception as e:
            print(f"Error processing message: {e}")
            continue  # 跳过无法处理的消息

    timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
    filename = f"chat_history_{timestamp}.json"
    try:
        with open(filename, 'w', encoding='utf-8') as f:
            json.dump(serializable_history, f, ensure_ascii=False, indent=4)
        print(f"对话历史已保存到 {filename}")
    except Exception as e:
        print(f"Error saving chat history: {str(e)}")


if __name__ == "__main__":
    api_key = os.environ.get("API_KEY")
    if not api_key:
        print("API_KEY environment variable not set.")
        exit(1)

    genai.configure(api_key=api_key, transport='rest')
    model = genai.GenerativeModel('models/gemini-1.5-flash-exp-0827')

    # Optionally load previous chat history
    with open('chat_history_20240930_194511.json', 'r', encoding='utf-8') as f:
        initial_history = json.load(f)
    enhanced_chat_with_gemini(model, initial_history=initial_history)
# 
#     # Or start a new chat
#     enhanced_chat_with_gemini(model)

Loaded previous chat history.
AI: 你叫**羚伊**。 

I remember! You told me earlier.  

Ending chat.
对话历史已保存到 chat_history_20240930_194758.json
