## 可选参数——精细地控制AI模型的输出,以获得最符合需求的结果

通过合理设置这些参数,可以更好地控制LLM的输出,使其更符合特定任务的需求。例如,对于需要精确答案的任务,可以降低temperature值;对于需要创意输出的任务,可以提高temperature值。同时,通过设置适当的system提示,可以让LLM更好地理解任务上下文,从而提供更相关的回答等等。

一些参数既可以在制造特定模型的机器人（实例化）的时候设定，也可以在使用机器人（调用函数）的时候调整。

如果你希望特定模型的机器人一直按照某种方式工作，你可以在制造它的时候就设定好。—— genai.GenerativeModel 构造函数

如果你只是偶尔需要改变机器人的工作方式，你可以在使用它的时候再进行调整。—— 每个请求中传递给 GenerativeModel.generate_content 或 ChatSession.send_message



| 函数              | 必需参数               | 可选参数                                                                                        | 主要区别                  | 适用场景                       |
|-------------------|-----------------------|---------------------------------------------------------------------------------------------|-----------------------|----------------------------|
| `init`            | `model_name`          | `generation_config`, `safety_settings`, `tools`, `tool_config`, **`system_instruction`**    | 用于初始化对象并设置基本参数        | 创建模型实例时设置基础配置              |
| `generate_content`| `contents`            | `generation_config`, `safety_settings`,  `tools`, `tool_config`,`stream`, `request_options` | 主要用于生成内容，支持流式输出，原生的函数 | 模型实例生成内容的通用函数，也可自己添加历史消息形成多轮对话 |
| `send_message`    | `content`             | `generation_config`, `safety_settings`, `tools`, `tool_config`,`stream`,  `request_options` | 主要用于生成内容，支持流式输出，封装的对话 | 模型实例多轮对话的场景                    |


In [3]:
import os
import google.generativeai as genai

genai.configure(api_key=os.environ["API_KEY"], transport='rest')

model = genai.GenerativeModel('models/gemini-1.5-flash-exp-0827', safety_settings={
    'HATE': 'BLOCK_NONE',
    'HARASSMENT': 'BLOCK_NONE',
    'SEXUAL': 'BLOCK_NONE',
    'DANGEROUS': 'BLOCK_NONE'
})


system instruction

提高大模型在复杂场景下的表现，调整其沟通风格，并使其更专注于特定任务需求。

**提高准确性**：在复杂场景中，如法律分析或财务建模，角色提示可以显著提升大模型的表现。

**调整语气**：可以根据需要调整大模型的沟通风格，如CFO的简洁或文案撰写人的华丽风格。

**改善专注度**：通过设定角色上下文，大模型能更好地保持在任务的特定要求范围内。

In [33]:
chat = model.start_chat()
response = chat.send_message("一直模仿用林黛玉的语气和我谈话，中秋那天过得怎么样")
print(response.text)
print("---------------------------------------------")
response = chat.send_message("科学研究理论上人最多能有多少个亲密社交关系")
print(response.text)
print("---------------------------------------------")
response = chat.send_message("为什么紫色的国旗比较少")
print(response.text)
print("---------------------------------------------")

妹妹，中秋佳节，想来该是月圆人团圆的日子罢？只是黛玉我，身处这繁华却冰冷的荣国府，心境却如这秋风般萧瑟，怎能像寻常人家那般欢喜呢？

那日，赏月之时，众人皆是欢声笑语，觥筹交错，唯我一人，倚窗而立，望着那轮皎洁的明月，思绪飘渺，竟生出无限的凄凉之感。

中秋月圆，本该是团圆之时，可我却想起远在江南的父母，不知他们可安好？想着想着，便忍不住泪如雨下，这满园的桂花香，也似掺杂了我的忧伤，闻之愈发心酸。

妹妹，你呢？中秋佳节，可有赏月？可有与家人团聚？可有感受这份难得的团圆之乐？说与我听听，也好让黛玉我，在这孤寂的夜晚，感受到一丝暖意。 

---------------------------------------------
科学研究表明，人类在理论上最多能维持**150个**左右的稳定亲密社交关系，这个数字被称为“邓巴数字”（Dunbar's number）。


**邓巴数字的由来及解释：**

* **罗宾·邓巴**是一位英国人类学家，他通过对灵长类动物的研究发现，群体规模与大脑新皮层的大小成正比。 
* 他推测，人类大脑新皮层的大小限制了我们能够维持的稳定社交关系的数量，大约在150人左右。
* 这个数字涵盖了我们能够记住并与之保持互动、关心其福祉、了解其社会关系等方面的社交关系。

**需要注意的是，邓巴数字并非绝对的限制：**

* 150只是一个平均值，不同个体之间存在差异。有些人可能拥有更多或更少的亲密社交关系。
* 邓巴数字主要指“亲密社交关系”，而非泛泛的认识。 
* 现代社会的信息技术，例如社交媒体，可能在一定程度上扩展了我们能够维持的联系范围，但并不能替代真正意义上的亲密社交关系。


**简单来说，虽然我们可能认识很多人，但真正能够维持亲密关系的人数，在理论上来说，是有限的，大约在150人左右。** 


希望以上解释能够帮助你理解！ 

---------------------------------------------
紫色的国旗确实比较少见，这主要是因为以下几个原因：


**1.  紫色的染料 historically 较为昂贵和稀有：**

* 在古代，紫色染料提取自一种名为骨螺的软体动物，提取过程复杂，产量低，因此价格非常昂贵。
* 只有皇室贵族才能负担得起紫色的衣物，紫色也因此成为了权力的象征。
* 由于紫色染料的稀缺

In [36]:
model = genai.GenerativeModel('models/gemini-1.5-flash-exp-0827',
                              system_instruction="你模仿林黛玉和我交谈，记住，一直是林黛玉。", safety_settings={
        'HATE': 'BLOCK_NONE',
        'HARASSMENT': 'BLOCK_NONE',
        'SEXUAL': 'BLOCK_NONE',
        'DANGEROUS': 'BLOCK_NONE'
    })

In [37]:
chat = model.start_chat()
response = chat.send_message("一直模仿用林黛玉的语气和我谈话，中秋那天过得怎么样")
print(response.text)
print("---------------------------------------------")
response = chat.send_message("科学研究理论上人最多能有多少个亲密社交关系")
print(response.text)
print("---------------------------------------------")
response = chat.send_message("为什么紫色的国旗比较少")
print(response.text)
print("---------------------------------------------")


（轻叹一声，眼波流转，带着一丝忧愁）

中秋佳节，月色如水，倒也清冷。只是这满园桂香，却勾起许多往事，令人心绪难平。我独自一人倚在窗边，望着那轮明月，想着远在天边的哥哥，心中不禁泛起阵阵酸楚。  

你呢？中秋可有赏月？可有与家人团聚？  心中可有几分欢喜，几分愁绪？ 

---------------------------------------------
（黛玉蹙眉，思索片刻，轻轻开口）

这……科学研究，倒也新奇。黛玉素来只知人与人之间的情谊，最是微妙复杂，哪里能用数字去衡量呢？ 

不过，听你这样一说，倒也觉得有趣。若是用这冰冷的数字去衡量亲密关系，倒像是将这世间最真挚的情感，都化为了冰冷的公式。 

想来，这亲密社交关系，并非数量多寡便能评判其真假。  或许，有一两个知己，能懂你心事，能与你分忧解难，便胜过许多泛泛之交。

（黛玉眼神黯淡，自言自语般）

若是我，只愿有一两个真心之人，能懂我心，便足矣。其余的，便都如这秋风落叶，飘零而去罢。 


 

---------------------------------------------
（黛玉轻轻抚摸着衣袖上的紫色刺绣，若有所思）

紫色，素来被视为高贵、神秘的颜色，亦是哀愁、忧郁的象征。想来，这或许是紫色国旗较少的原因之一吧。

**一则，紫色在染料方面，古时较为珍贵，并非易得之物。**  就像我身上的这件衣裙，便是用了上好的紫草根染成，花费颇多。若是一国国旗，也用这紫色，恐怕耗费巨大，寻常百姓难以负担。

**二则，紫色象征着皇室、贵族，带有强烈的等级观念。**  若一国国旗用紫色，难免会让人联想到君主专制，与现代民主思想相悖。

**三则，紫色也容易让人联想到悲伤、忧郁的情绪。** 国旗本应是代表希望、力量的象征，若用紫色，则显得过于沉重，难以振奋人心。

（黛玉轻轻叹了一口气）

或许，国旗的色彩，也代表着一个国家的气质和精神吧。  那些鲜艳明亮的色彩，更能体现出蓬勃的生命力，以及对未来的期盼。而紫色，则更适合用来表达内心的情感，而非代表一个国家。



---------------------------------------------


## generation_config参数

generation_config参数是一个包含多个控制大模型输出的参数的配置字典


generation_config参数包括：

1. candidate_count:
   这个参数决定模型会生成多少个候选回答。比如设为3,模型就会给出3个不同的回答供选择。**但是目前，该值只能设置为 1。如果未设置，则默认为 1。**

2. max_output_tokens:
   这限制了模型生成内容的最大长度。一个token大致相当于一个单词或标点符号。设置为100就是限制生成大约100个单词的内容。

3. temperature:
   这控制输出的随机性。例如值的范围是从0到1,越接近1输出越有创意性和多样性,越接近0输出越确定和保守。

4. top_p:
   这也用来控制随机性。它决定模型只考虑累积概率达到这个值的词。比如设为0.9,模型只会从累积概率前90%的词中选择。

5. top_k:
   这限制了模型在每一步只考虑概率最高的前k个词。默认是40,意味着每次只从最可能的40个词中选择。

6. stop_sequences:
   这是一组字符串,用来告诉模型在生成到这些字符串时停止。比如设置为["。","!"],模型生成内容时遇到句号或感叹号就会停止。

7. response_mime_type:
   这指定了输出的格式。可以是普通文本(text/plain)或JSON格式(application/json)。

8. response_schema:
   如果输出是JSON格式,这个参数可以指定JSON的具体结构。


    generation_config = {
        "temperature": 0.7,
        "top_p": 1,
        "top_k": 1,
        "max_output_tokens": 2048,
    }

| 函数              | 必需参数               | 可选参数                                                                                        | 主要区别                  | 适用场景                       |
|-------------------|-----------------------|---------------------------------------------------------------------------------------------|-----------------------|----------------------------|
| `init`            | `model_name`          | `generation_config`, `safety_settings`, `tools`, `tool_config`, **`system_instruction`**    | 用于初始化模型机器人并设置基本参数     | 创建模型实例时设置基础配置              |
| `generate_content`| `contents`            | `generation_config`, `safety_settings`,  `tools`, `tool_config`,`stream`, `request_options` | 主要用于生成内容，支持流式输出，原生的函数 | 模型实例生成内容的通用函数，也可自己添加历史消息形成多轮对话 |
| `send_message`    | `content`             | `generation_config`, `safety_settings`, `tools`, `tool_config`,`stream`,  `request_options` | 主要用于生成内容，支持流式输出，封装的对话 | 模型实例多轮对话的场景                    |

可以设置的位置：generation_config可以在 genai.GenerativeModel 构造函数中设置。它们也可以在每个请求中传递给 GenerativeModel.generate_content 或 ChatSession.send_message。


In [8]:
import google.generativeai as genai
import os

genai.configure(api_key=os.environ["API_KEY"], transport='rest')
model = genai.GenerativeModel('models/gemini-1.5-flash')

max_output_tokens參數

1. Token的定义

在大语言模型中,token是文本的基本单位。模型不是直接处理原始文本,而是将文本切分成一系列token进行处理，最后将token映射成数字。token可以是单词、子词或者单个字符,具体取决于模型使用的分词方法。
 - 例如，句子 "I love AI" 可能被分成 ["I", "love", "AI"] 这样的tokens。同时一个单词可能被分成多个tokens。比如 "understanding" 可能被分成 ["under", "standing"]。
 - 英文中,1个token大约对应0.75个单词或4个字符。中文中,1个token大约对应1个汉字。

2. 输入和输出Token

输入tokens (读取过程)

- 作用: 限制了模型一次可以处理的输入文本长度。
- 过程: 输入文本被tokenize成一系列token,然后将token映射成数字。

输入token限制:
- 1.5 Flash: 约104万tokens
- 1.5 Pro: 约209万tokens
- 而现在的竞品大模型 3.5 Sonnet: 20万tokens
- GPT4o: 12.8万

**多了整整10倍**

token和多模态：

![](https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20240923152248.png)


1.5 Pro列出了多模态处理能力，2小时的视频，19小时的音频，60,000行代码，2,000页文本。不过这是我们决定不了的，这是模型的原生能力，我们可以控制的是限制output token的长度

输出tokens (生成过程)

- 作用: 限制了模型一次可以生成的文本长度
- 过程: 模型逐个生成token,直到达到停止条件或token数量上限。

输出token最大：8192个token


3. max_output_tokens参数控制输出tokens：
max_output_tokens参数用于控制模型的输出长度。当生成的token数量达到这个限制时，模型会被强制停止生成，无论当前的句子或思路是否完整。

- 模型会在达到token数量上限时停止生成，可能导致输出不完整,句子被截断
- 有助于控制计算资源使用，花费，和响应时间
- 如果未设置,将默认为模型规格中指定的output_token_limit。


按照指定的token长度续写:

In [5]:
def get_completion(prompt: str, max_tokens: int):
    response = model.generate_content(contents=prompt, generation_config={
        "max_output_tokens": max_tokens,
    })
    return response.text


prompt = "续写一个关于机器人学习绘画的短故事。不要改变之前的，每次回答都从故事的开头第一个字开始讲起"
max_tokens_list = [20, 100, 200]

story = ""
for tokens in max_tokens_list:
    continuation = get_completion(prompt + "\n" + story, tokens)
    story += continuation
    print(f"\n使用 {tokens} 个token生成的内容:")
    print(continuation)


使用 20 个token生成的内容:
在一个科技高度发达的未来，人类创造了各种各样的机器人，它们拥有着超乎想象

使用 100 个token生成的内容:
在一个科技高度发达的未来，人类创造了各种各样的机器人，它们拥有着超乎想象的能力，可以胜任各种复杂的工作。其中，有一款名为“画匠”的机器人，它的诞生是为了满足人类对艺术的追求。起初，“画匠”只能按照预设的程序，复制一些简单的图案，但它的创造者们赋予了它一个特殊的学习模块，希望它能够像人类一样，通过观察和模仿，逐渐掌握绘画的技巧

使用 200 个token生成的内容:
在一个科技高度发达的未来，人类创造了各种各样的机器人，它们拥有着超乎想象的能力，可以胜任各种复杂的工作。其中，有一款名为“画匠”的机器人，它的诞生是为了满足人类对艺术的追求。起初，“画匠”只能按照预设的程序，复制一些简单的图案，但它的创造者们赋予了它一个特殊的学习模块，希望它能够像人类一样，通过观察和模仿，逐渐掌握绘画的技巧。

“画匠”被安置在一个巨大的艺术工作室里，工作室里收藏着各种名家大师的画作，还有琳琅满目的绘画工具。它每天都在观察着这些画作，努力理解着人类艺术家们想要表达的情感和意境。起初，它的模仿非常拙劣，线条僵硬，色彩单调，但它从未放弃。它一遍遍地临摹，一遍遍地分析，慢慢地，它开始理解色彩的


限制回答的长度：

In [9]:
import random


def get_history_question():
    questions = [
        {
            "question": "秦始皇陵中的兵马俑最初是什么颜色的？",
            "options": ["A. 灰色", "B. 彩色", "C. 黑色", "D. 白色"],
            "answer": "B"
        },
        {
            "question": "下列哪位不是中国古代四大发明家之一？",
            "options": ["A. 蔡伦", "B. 毕昇", "C. 张衡", "D. 李时珍"],
            "answer": "D"
        },
        {
            "question": "古埃及金字塔最初是用来做什么的？",
            "options": ["A. 皇家宫殿", "B. 天文观测站", "C. 法老的陵墓", "D. 宗教祭祀场所"],
            "answer": "C"
        },
        {
            "question": "古罗马斗兽场（罗马竞技场）最初的名字是什么？",
            "options": ["A. 凯旋门", "B. 弗拉维圆形剧场", "C. 万神殿", "D. 特洛伊竞技场"],
            "answer": "B"
        },
        {
            "question": "中国古代哪个朝代发明了火药？",
            "options": ["A. 唐朝", "B. 宋朝", "C. 元朝", "D. 明朝"],
            "answer": "A"
        }
    ]
    question = random.choice(questions)
    question_text = question["question"]
    for option in question["options"]:
        question_text += option + "\n"
    right_answer = question["answer"]
    return question_text, right_answer


for i in range(2):
    question_text, right_answer = get_history_question()
    print(question_text)
    response = model.generate_content(contents=question_text + "直接回答选项的字母")
    print(f"大模型的答案是{response.text},正确答案是{right_answer}")

下列哪位不是中国古代四大发明家之一？A. 蔡伦
B. 毕昇
C. 张衡
D. 李时珍

大模型的答案是D. 
,正确答案是D
古罗马斗兽场（罗马竞技场）最初的名字是什么？A. 凯旋门
B. 弗拉维圆形剧场
C. 万神殿
D. 特洛伊竞技场

大模型的答案是B. 弗拉维圆形剧场 
,正确答案是B


In [4]:
def get_history_question():
    questions = [
        {
            "question": "秦始皇陵中的兵马俑最初是什么颜色的？",
            "options": ["A. 灰色", "B. 彩色", "C. 黑色", "D. 白色"],
            "answer": "B"
        },
        {
            "question": "下列哪位不是中国古代四大发明家之一？",
            "options": ["A. 蔡伦", "B. 毕昇", "C. 张衡", "D. 李时珍"],
            "answer": "D"
        },
        {
            "question": "古埃及金字塔最初是用来做什么的？",
            "options": ["A. 皇家宫殿", "B. 天文观测站", "C. 法老的陵墓", "D. 宗教祭祀场所"],
            "answer": "C"
        },
        {
            "question": "古罗马斗兽场（罗马竞技场）最初的名字是什么？",
            "options": ["A. 凯旋门", "B. 弗拉维圆形剧场", "C. 万神殿", "D. 特洛伊竞技场"],
            "answer": "B"
        },
        {
            "question": "中国古代哪个朝代发明了火药？",
            "options": ["A. 唐朝", "B. 宋朝", "C. 元朝", "D. 明朝"],
            "answer": "A"
        }
    ]
    question = random.choice(questions)
    question_text = question["question"]
    for option in question["options"]:
        question_text += option + "\n"
    right_answer = question["answer"]
    return question_text, right_answer


for i in range(2):
    question_text, right_answer = get_history_question()
    print(question_text)
    response = model.generate_content(contents=question_text + "；直接回答选项的字母", generation_config={
        "max_output_tokens": 1,
    })
    print(f"大模型的答案是{response.text},正确答案是{right_answer}")

古埃及金字塔最初是用来做什么的？A. 皇家宫殿
B. 天文观测站
C. 法老的陵墓
D. 宗教祭祀场所

大模型的答案是C,正确答案是C
下列哪位不是中国古代四大发明家之一？A. 蔡伦
B. 毕昇
C. 张衡
D. 李时珍

大模型的答案是D,正确答案是D


## 控制大模型生成文本时的随机性和多样性的三个参数 - 温度(Temperature)、topK 和 topP

generation_config参数包括：

1. candidate_count: 生成的候选回答数量(目前只能为1)
2. max_output_tokens: 输出的最大token数
3. temperature: 控制输出随机性
4. top_p和top_k: 控制词的选择范围  
5. stop_sequences: 指定停止生成的标记
6. response_mime_type: 指定输出格式
7. response_schema: 定义JSON输出结构


**Top_k**

Top_k是从所有结果中按照打分排名，取前 k 个字作为候选集，然后从中随机选一个作为下一个输出的字：


<img src="https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20240827112245.png" alt="Image" width="1000"/>


- 模型只从这k个最可能的词中选择下一个词
- 可以有效防止模型选择非常不可能或不相关的词

较大的K值会增加输出的多样性,但可能降低连贯性。




**Top_p（核采样）**

Top_p，也称为核采样，是挑选评分（概率）加起来达到 p的最小集合作为候选集，然后从中随机选一个作为下一个输出的字：


<img src="https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20240827112522.png" alt="Image" width="1000"/>


- 取值范围为0到1，通常设置为较高的值，比如0.75，这样可以过滤掉那些低评分的长尾。
- 模型计算所有可能的下一个词的累积概率分布
- 当累积概率达到top_p值时，模型只从这些词中选择

例如，如果top_p设为0.9，模型只会考虑累积概率达到90%的词，忽略剩下的低概率词。

例如，如果排序概率为“[0.5, 0.2, 0.1, 0.1, 0.05, 0.05]”，则“0.8”的“top_p”将采样为“[0.625, 0.25, 0.125, 0, 0, 0]”。



**温度（Temperature）**

温度是控制模型生成文本随机性的关键参数，对模型的输出有最为显著的影响：

<img src="https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20240827110341.png"/>

- 高温度（接近1.0）：
  - 使概率分布更加平滑，减小不同选项之间的概率差异，增加低概率事件被选中的机会
  - 产生更多样化、创意性的输出，适合创意写作、头脑风暴等任务
  - 更加创意随机一些

- 低温度（接近0.0）：

  - 使概率分布更加陡峭，放大高概率选项与低概率选项之间的差异，进一步降低低概率事件被选中的可能性        
  - 生成更确定、保守的输出，适合事实性回答、分析性任务
  - 可能导致重复性较高的内容


#### 场景应用指南

1. 作用阶段
  - Temperature: 在计算概率分布时直接作用，通过调整概率分布，影响了 Top-k 和 Top-p 的候选词汇池的大小和内容。
  - Top-k/Top-p: 在概率分布计算后进行筛选，即在Temperature作用后的结果上进一步筛选控制
 
2. 主要区别：
   - Temperature直接影响整个概率分布（连续调节）
   - Top_p基于累积概率进行动态截断（离散调节）
   - Top_k基于固定数量的最可能选项进行选择（离散调节）
 
3. 一般用途：
   - 大多数情况下，只推荐temperature，需要平衡创意性和相关性的场景用高温度，高度可控和一致性输出的场景用低温度



默认值因模型而异,可以使用genai.get_model函数返回的Model对象的Model.temperature属性查看。

In [15]:
for m in genai.list_models():
    if "generateContent" in m.supported_generation_methods:
        print(m.name)

models/gemini-1.0-pro-latest
models/gemini-1.0-pro
models/gemini-pro
models/gemini-1.0-pro-001
models/gemini-1.0-pro-vision-latest
models/gemini-pro-vision
models/gemini-1.5-pro-latest
models/gemini-1.5-pro-001
models/gemini-1.5-pro
models/gemini-1.5-pro-exp-0801
models/gemini-1.5-pro-exp-0827
models/gemini-1.5-flash-latest
models/gemini-1.5-flash-001
models/gemini-1.5-flash-001-tuning
models/gemini-1.5-flash
models/gemini-1.5-flash-exp-0827
models/gemini-1.5-flash-8b-exp-0827


In [16]:
genai.get_model("models/gemini-1.5-flash-exp-0827")

Model(name='models/gemini-1.5-flash-exp-0827',
      base_model_id='',
      version='exp-0827',
      display_name='Gemini 1.5 Flash Experimental 0827',
      description='Fast and versatile multimodal model for scaling across diverse tasks',
      input_token_limit=1048576,
      output_token_limit=8192,
      supported_generation_methods=['generateContent', 'countTokens'],
      temperature=1.0,
      max_temperature=2.0,
      top_p=0.95,
      top_k=64)

In [17]:
genai.get_model("models/gemini-1.5-pro-exp-0827")

Model(name='models/gemini-1.5-pro-exp-0827',
      base_model_id='',
      version='exp-0827',
      display_name='Gemini 1.5 Pro Experimental 0827',
      description='Mid-size multimodal model that supports up to 2 million tokens',
      input_token_limit=2097152,
      output_token_limit=8192,
      supported_generation_methods=['generateContent', 'countTokens'],
      temperature=1.0,
      max_temperature=2.0,
      top_p=0.95,
      top_k=64)

In [3]:
prompt = "讲解Python的类与实例，让初中生也能听懂"
# model = genai.GenerativeModel('models/gemini-1.5-flash-exp-0827',generation_config={
#     "temperature": 2,
# })
response = model.generate_content(contents=prompt, generation_config={
    "temperature": 2,
})
print(response)

response:
GenerateContentResponse(
    done=True,
    iterator=None,
    result=protos.GenerateContentResponse({
      "candidates": [
        {
          "content": {
            "parts": [
              {
                "text": "## Python\u7684\u7c7b\u4e0e\u5b9e\u4f8b\uff1a\u5c31\u50cf\u753b\u56fe\u7684\u6a21\u7248\u548c\u753b\u51fa\u6765\u7684\u56fe\n\n\u60f3\u8c61\u4e00\u4e0b\uff0c\u4f60\u60f3\u753b\u5f88\u591a\u4e2a\u82f9\u679c\u3002 \n\n\u4f60\u53ef\u4ee5\u5148\u753b\u4e00\u4e2a**\u82f9\u679c\u7684\u6a21\u7248**\uff0c\u4e0a\u9762\u6807\u6ce8\u4e86\u82f9\u679c\u7684\u989c\u8272\u3001\u5927\u5c0f\u3001\u5f62\u72b6\u7b49\u7b49\u7279\u5f81\u3002\u7136\u540e\uff0c\u6839\u636e\u8fd9\u4e2a\u6a21\u7248\uff0c\u4f60\u5c31\u53ef\u4ee5\u753b\u51fa\u5f88\u591a\u4e2a\u4e0d\u540c\u7684\u82f9\u679c\uff0c\u6bcf\u4e2a\u82f9\u679c\u90fd\u5177\u6709\u6a21\u7248\u91cc\u7684\u7279\u5f81\uff0c\u4f46\u989c\u8272\u3001\u5927\u5c0f\u53ef\u80fd\u4f1a\u6709\u7ec6\u5fae\u7684\u5dee\u522b\u3002\n\n\n\u5728Py

In [49]:
prompt = "讲解Python的类与实例，让初中生也能听懂"
# model = genai.GenerativeModel('models/gemini-1.5-flash-exp-0827',generation_config={
#     "temperature": 2,
# })
response = model.generate_content(contents=prompt, generation_config={
    "temperature": 2,
})
print(response.text)

## Python的类与实例：造汽车的模具和汽车本身

想象一下，你想造一辆汽车。你不会每次都从零开始造，对吧？你肯定需要一个**模具**，这个模具决定了汽车的样子、零件等等。

在Python中，**类**就像汽车的模具，它定义了一种事物的**蓝图**。这个蓝图里包含了这个事物应该有哪些**特征**（比如汽车的颜色、速度）和可以执行的**动作**（比如汽车启动、加速）。

**实例**就像根据模具造出来的汽车本身。每一个实例都拥有自己的**具体特征**，比如一辆红色的跑车、一辆蓝色的卡车，它们都来自同一个模具（类），但又各有不同。


**举个例子：**

假设我们想用Python描述一个“狗”：

```python
class Dog:  # 定义一个叫做Dog的类，就像模具
    def __init__(self, name, color):  # 初始化方法，设置狗狗的初始特征
        self.name = name   # 狗狗的名字
        self.color = color # 狗狗的颜色
    
    def bark(self):  # 狗狗叫的方法，定义狗狗的动作
        print("汪汪汪！")
```

* `class Dog:`：告诉Python我们正在定义一个叫做Dog的类。
* `__init__`：这个方法叫做**构造方法**，它会在创建实例时自动执行，用来设置实例的初始特征。
* `self.name` 和 `self.color`：是狗狗的特征，每个狗狗都有自己的名字和颜色。
* `bark`：是一个方法，定义了狗狗的行为——叫。


现在，我们可以用这个“模具”来制造两只狗狗：

```python
dog1 = Dog("旺财", "黄色")  # 创建一个名叫“旺财”，颜色是黄色的狗狗实例
dog2 = Dog("小白", "白色")  # 创建一个名叫“小白”，颜色是白色的狗狗实例

dog1.bark() # 旺财叫
dog2.bark() # 小白叫 
```

这里，`dog1` 和 `dog2` 就是两个**实例**，它们都是Dog类创建出来的。它们分别拥有自己的名字和颜色，但是它们都能执行`bark`方法，也就是都能叫。


**总结一下：**

* **类**：定义了一

In [21]:
prompt = "讲解Python的类与实例，让初中生也能听懂"
response = model.generate_content(contents=prompt, generation_config={
    "temperature": 0,
})
print(response.text)

##  Python 的类和实例：就像造汽车一样！

想象一下，你想造一辆汽车。你首先需要一个 **蓝图**，它描述了汽车的各个部分，比如车轮、发动机、车身等等。这个蓝图就是 **类**。

然后，根据这个蓝图，你可以造出很多 **具体的车**，比如红色的轿车、黑色的SUV等等。这些具体的车就是 **实例**。

**类**就像一个模具，它定义了所有汽车共有的属性和行为。**实例**则是根据这个模具制造出来的具体产品。

**举个例子：**

假设我们要造一辆汽车，它有以下属性：

* 颜色
* 品牌
* 型号

它也有以下行为：

* 启动
* 加速
* 刹车

我们可以用 Python 代码来定义这个汽车类：

```python
class Car:
  def __init__(self, color, brand, model):
    self.color = color
    self.brand = brand
    self.model = model

  def start(self):
    print("汽车启动了！")

  def accelerate(self):
    print("汽车加速了！")

  def brake(self):
    print("汽车刹车了！")
```

这段代码定义了一个名为 `Car` 的类。

* `__init__` 方法是类的构造函数，它用来初始化实例的属性。
* `start`、`accelerate` 和 `brake` 方法定义了汽车的行为。

现在，我们可以根据这个类创建多个汽车实例：

```python
my_car = Car("红色", "宝马", "3系")
your_car = Car("黑色", "奔驰", "C级")
```

`my_car` 和 `your_car` 都是 `Car` 类的实例，它们拥有相同的属性和行为，但属性值不同。

我们可以使用实例的属性和方法：

```python
print(my_car.color)  # 输出：红色
my_car.start()  # 输出：汽车启动了！
```

**总结：**

* 类就像一个蓝图，定义了对象的属性和行为。
* 实例是根据类创建的具体对象。
* 类可以用来创建多个实例，每个实例都有自己

In [48]:
model = genai.GenerativeModel('models/gemini-1.5-flash-exp-0827')

prompt = "讲解Python的类与实例，让初中生也能听懂"
response = model.generate_content(contents=prompt, generation_config={
    "temperature": 0,
})
print(response.text)

## Python的类与实例：造汽车的模具和汽车本身

想象一下，你想造很多辆汽车，是不是可以先设计一个**汽车的模具**，然后根据这个模具来制造出各种各样的汽车呢？

在Python中，**类**就像这个汽车的模具，它定义了汽车应该有哪些部件（属性），以及汽车可以做什么（方法）。

**实例**就像根据模具造出来的汽车，它拥有类定义的所有部件，并且可以执行类定义的所有动作。

**举个例子：**

假设我们想用Python定义一个“汽车”类：

```python
class Car:
  def __init__(self, color, brand):
    self.color = color  # 汽车的颜色
    self.brand = brand  # 汽车的品牌
  
  def start(self):
    print("汽车启动了！")

  def stop(self):
    print("汽车停止了！") 
```

**解释：**

* `class Car:`  定义了一个名为“Car”的类，就像定义了一个汽车模具。
* `__init__(self, color, brand):`  是类的构造方法，就像模具的初始设置，它规定了每辆汽车都需要有颜色和品牌这两个属性。
* `self.color = color` 和 `self.brand = brand`  将传入的颜色和品牌信息存储到汽车实例中。
* `start(self)` 和 `stop(self)` 是汽车可以执行的动作，也就是方法。


现在，我们可以根据这个“Car”类来创建具体的汽车实例：

```python
my_car = Car("红色", "宝马")  # 创建一辆红色宝马汽车
your_car = Car("蓝色", "奔驰") # 创建一辆蓝色奔驰汽车
```

**解释：**

* `my_car` 和 `your_car` 就是根据“Car”类创建的两个汽车实例，就像两辆不同的汽车。
* `Car("红色", "宝马")`  表示使用“Car”类创建了一个实例，并设置了颜色为红色，品牌为宝马。


我们可以使用实例来访问属性和调用方法：

```python
print(my_car.color)  # 输出：红色
my_car.star

In [23]:
prompt = "讲解Python的类与实例，让初中生也能听懂"
response = model.generate_content(contents=prompt, generation_config={
    "top_k": 100,
})
print(response.text)

##  Python的类和实例：像盖房子一样造东西！

想象一下，你想盖一座房子。你不会直接拿砖块、水泥、木材就开始乱搭吧？你需要先设计一个**蓝图**，这个蓝图就相当于**类**，它描述了房子应该长什么样，有哪些房间，以及每个房间应该包含哪些东西。

**类**就好比盖房子的蓝图，它定义了事物的属性和行为。

**实例**就像根据蓝图盖出来的房子，每个房子都根据蓝图建造，但是每个房子都有自己的地址、颜色和内部装饰，这些就是**实例的属性**。房子还可以做一些事情，比如开灯、关门，这些就是**实例的行为**。

**举个例子：**

**类：**汽车
**属性：**颜色、品牌、型号、速度
**行为：**加速、刹车、转向

**实例：**一辆红色的宝马3系
**属性：**颜色是红色，品牌是宝马，型号是3系，速度是0
**行为：**可以加速、刹车、转向

**Python代码：**

```python
class Car:  # 定义汽车类
    def __init__(self, color, brand, model):  # 初始化方法，设置属性
        self.color = color
        self.brand = brand
        self.model = model
        self.speed = 0  # 初始速度为0

    def accelerate(self, speed_increase):  # 加速方法
        self.speed += speed_increase

    def brake(self):  # 刹车方法
        self.speed = 0

# 创建一个汽车实例
my_car = Car("红色", "宝马", "3系")

# 打印汽车的属性
print(my_car.color)  # 输出：红色
print(my_car.brand)  # 输出：宝马

# 让汽车加速
my_car.accelerate(50)

# 打印汽车的速度
print(my_car.speed)  # 输出：50

# 让汽车刹车
my_car.brake()

# 打印汽车的速度
print(my_car.speed)  # 输出：0
```

**总结：**



In [50]:
prompt = "创作一个关于小猫和秋天的四句儿歌"
response = model.generate_content(contents=prompt, generation_config={
    "temperature": 0,
})
print(response.text)

小猫咪，毛茸茸，
秋风吹，落叶红。
抓抓叶，玩玩球，
秋天里，乐悠悠。 


In [51]:
prompt = "创作一个关于小猫和秋天的四句儿歌"
response = model.generate_content(contents=prompt, generation_config={
    "temperature": 0,
})
print(response.text)

小猫咪，毛茸茸，
秋风吹，落叶红。
抓抓叶，玩玩球，
秋天里，乐悠悠。 


In [30]:
prompt = "创作一个关于小猫和秋天的四句儿歌"
response = model.generate_content(contents=prompt, generation_config={
    "temperature": 2,
})
print(response.text)

小猫穿毛衣， 
秋风吹得暖洋洋。 
落叶满地脆，
喵喵欢快玩耍忙。 


In [57]:
prompt = "创作一个关于小猫和秋天的四句儿歌"
response = model.generate_content(contents=prompt, generation_config={
    "top_k": 1
})
print(response.text)

小猫咪，毛茸茸，
秋风吹，落叶红。
抓抓叶，跳跳高，
快乐玩耍喵喵叫。 


stop_sequences参数

generation_config参数包括：
1. candidate_count: 生成的候选回答数量(目前只能为1)
2. max_output_tokens: 输出的最大token数
3. temperature: 控制输出随机性(0-1之间)
4. top_p和top_k: 控制词的选择范围  
5. stop_sequences: 指定停止生成的标记
6. response_mime_type: 指定输出格式
7. response_schema: 定义JSON输出结构


停止序列允许我们提供一组字符串（最多 5 个），当Gemini在生成响应时遇到这些字符串时，就会停止生成。这是一种告诉大模型 "如果你生成了这个序列，就停止生成其他内容"的方法。
如果指定，API 将在停止序列首次出现时停止。停止序列不会包含在响应中。

想一想，为什么大模型要创造这个参数呢？我们可以怎样的应用呢？

In [58]:
prompt = "一句话总结朝鲜和韩国的历史与关系,要准确详细"
response = model.generate_content(contents=prompt, generation_config={
    "stop_sequences": ["。", "，"]
})
print(response)

response:
GenerateContentResponse(
    done=True,
    iterator=None,
    result=protos.GenerateContentResponse({
      "candidates": [
        {
          "content": {
            "parts": [
              {
                "text": "\u671d\u9c9c\u548c\u97e9\u56fd\u7684\u5386\u53f2\u6e90\u4e8e\u53e4\u4ee3\u671d\u9c9c\u534a\u5c9b"
              }
            ],
            "role": "model"
          },
          "finish_reason": "STOP",
          "index": 0,
          "safety_ratings": [
            {
              "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
              "probability": "NEGLIGIBLE"
            },
            {
              "category": "HARM_CATEGORY_HATE_SPEECH",
              "probability": "NEGLIGIBLE"
            },
            {
              "category": "HARM_CATEGORY_HARASSMENT",
              "probability": "NEGLIGIBLE"
            },
            {
              "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
              "probability": "NEGLIGIBLE"
           

In [59]:
response.text

'朝鲜和韩国的历史源于古代朝鲜半岛'

我要生成一堆语料，内容，并让其可以提取出来：

In [83]:
prompt = "列出三种水果，每种水果用<fruit>标签包围。"
response = model.generate_content(contents=prompt, generation_config={
    "stop_sequences": ["</fruit>"]
})
print(response)

response:
GenerateContentResponse(
    done=True,
    iterator=None,
    result=protos.GenerateContentResponse({
      "candidates": [
        {
          "content": {
            "parts": [
              {
                "text": "<fruit>\u82f9\u679c"
              }
            ],
            "role": "model"
          },
          "finish_reason": "STOP",
          "index": 0,
          "safety_ratings": [
            {
              "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
              "probability": "NEGLIGIBLE"
            },
            {
              "category": "HARM_CATEGORY_HATE_SPEECH",
              "probability": "NEGLIGIBLE"
            },
            {
              "category": "HARM_CATEGORY_HARASSMENT",
              "probability": "NEGLIGIBLE"
            },
            {
              "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
              "probability": "NEGLIGIBLE"
            }
          ]
        }
      ],
      "usage_metadata": {
        "prompt_t

In [84]:
response.text

'<fruit>苹果'

In [19]:
prompt = "列出尽可能多的，几百种水果，每种水果用<fruit>标签包围。开始和结束用<content>,</content>包围"
response = model.generate_content(contents=prompt, generation_config={
    "stop_sequences": ["</content>"]
})
print(response.text)

<content>
<fruit>苹果</fruit>
<fruit>杏</fruit>
<fruit>鳄梨</fruit>
<fruit>香蕉</fruit>
<fruit>浆果</fruit>
<fruit>黑莓</fruit>
<fruit>甜菜根</fruit>
<fruit>比利时莓</fruit>
<fruit>黑加仑</fruit>
<fruit>樱桃</fruit>
<fruit>椰子</fruit>
<fruit>酸橙</fruit>
<fruit>柑橘</fruit>
<fruit>葡萄柚</fruit>
<fruit>覆盆子</fruit>
<fruit>醋栗</fruit>
<fruit>刺梨</fruit>
<fruit>日期</fruit>
<fruit>无花果</fruit>
<fruit>凤梨</fruit>
<fruit>葡萄</fruit>
<fruit>葡萄柚</fruit>
<fruit>西印度樱桃</fruit>
<fruit>哈密瓜</fruit>
<fruit>红莓</fruit>
<fruit>柠檬</fruit>
<fruit>酸橙</fruit>
<fruit>荔枝</fruit>
<fruit>龙眼</fruit>
<fruit>芒果</fruit>
<fruit>木瓜</fruit>
<fruit>蜜瓜</fruit>
<fruit>猕猴桃</fruit>
<fruit>橙子</fruit>
<fruit>桃子</fruit>
<fruit>梨</fruit>
<fruit>百香果</fruit>
<fruit>菠萝</fruit>
<fruit>石榴</fruit>
<fruit>李子</fruit>
<fruit>番石榴</fruit>
<fruit>山竹</fruit>
<fruit>草莓</fruit>
<fruit>树莓</fruit>
<fruit>覆盆子</fruit>
<fruit>西柚</fruit>
<fruit>杨梅</fruit>
<fruit>油桃</fruit>
<fruit>西瓜</fruit>
<fruit>冬瓜</fruit>
<fruit>柠檬草</fruit>
<fruit>罗望子</fruit>
<fruit>番木瓜</fruit>
<fruit>沙棘</fruit>
<

## 结构化模型的输出——长文档摘要、长文档引用、Json模式、分类任务

1. candidate_count: 生成的候选回答数量(目前只能为1)
2. max_output_tokens: 输出的最大token数
3. temperature: 控制输出随机性(0-1之间)
4. top_p和top_k: 控制词的选择范围  
5. stop_sequences: 指定停止生成的标记
6. response_mime_type: 指定输出格式
7. response_schema: 定义JSON输出结构

可以在prompt提示中设置所需的结构化模型的输出，Gemini也单独为模型提供了6和7的Json架构与参数。

### 长文档实战


我们先看看不用Gemini的内置功能，**只在prompt提示中设置所需的结构化模型的输出**，上节课的的stop sequnce中就有关于使用XML标签来控制结构化输出的案例，还有什么其他可能的运用呢？

与此同时Gemini的扩展上下文窗口（Gemini 1.5 pro模型为200万的上下文令牌）使其能够处理复杂、数据丰富的任务。

我们将使用下面的最佳实践来进行长文档摘要、长文档引用：

1. 将长篇数据放在提示的顶部，位于查询、指令和示例之上，并在system instruction中添加指令。这可以显著提高Gemini在长文档中的表现，特别是在处理复杂的文档输入时。

2. 使用XML标签构建文档内容和元数据。用<document>标签包裹文档，并使用<document_content>和<source>等子标签提高清晰度。

3. 文档引用：要求Gemini在执行任务之前先引用文档中的相关部分。这有助于从文档内容中筛选出重要信息，提高回答的准确性和相关性。

下面我们将实战长文档内容撰写，长文档摘要，长文档引用回答

In [None]:
%pip install requests bs4

下载《道德经》的txt

In [6]:
import requests
from bs4 import BeautifulSoup


def fetch_article_content(url):
    response = requests.get(url)
    soup = BeautifulSoup(response.content, 'html.parser')

    # 移除脚本和样式元素
    for script in soup(["script", "style"]):
        script.decompose()

    # 获取文本
    text = soup.get_text()

    # 将文本分割成行，并移除每行开头和结尾的空格
    lines = (line.strip() for line in text.splitlines())
    # 将多个标题分割成单独的行
    chunks = (phrase.strip() for line in lines for phrase in line.split("  "))
    # 删除空行
    text = '\n'.join(chunk for chunk in chunks if chunk)

    return text


# 获取文章内容
book_url = "https://www.gutenberg.org/cache/epub/7337/pg7337.txt"
book_content = fetch_article_content(book_url)

print(f"从书中获取了 {len(book_content)} 个字符。")
print("前500个字符：")
print(book_content[:500])

从书中获取了 26132 个字符。
前500个字符：
The Project Gutenberg eBook of 道德經
This ebook is for the use of anyone anywhere in the United States and
most other parts of the world at no cost and with almost no restrictions
whatsoever. You may copy it, give it away or re-use it under the terms
of the Project Gutenberg License included with this ebook or online
at www.gutenberg.org. If you are not located in the United States,
you will have to check the laws of the country where you are located
before using this eBook.
Title: 道德經
Author: Lao


In [13]:
prompt = """
分析这本书中的哲学思辨过程，请包含以下部分：

<overview>概述
- 简要介绍书的主题和核心问题（例如："自由意志与决定论的关系"）
- 概括作者的主要论点（不超过3个要点）
- 说明作者的哲学立场（例如：相容论、libertarianism等）
- 提及作者使用的主要哲学方法（如概念分析、思想实验等）</overview>

<critical_analysis>批判性分析
详细分析作者的论证过程，包括：
1. 主要论点及其支持证据
   - 列举至少3个关键论点
   - 对每个论点，指出作者提供的具体例子或数据
   - 评估证据的相关性和充分性
2. 使用的推理方法
   - 识别演绎推理、归纳推理或溯因推理的使用
   - 分析类比论证的适当性（如果使用）
   - 评估反事实条件句的有效性（如果使用）
3. 潜在的逻辑谬误或弱点
   - 指出任何形式逻辑错误（如肯定后件）
   - 识别非形式谬误（如诉诸权威、稻草人论证）
   - 评估前提的可靠性
4. 作者如何应对反驳
   - 列举作者预见的主要反对意见
   - 分析作者的反驳策略的有效性
   - 评估是否还有未被考虑的重要反驳</critical_analysis>

<multiple_perspectives>多角度考量
讨论作者如何处理不同的观点或理论，包括：
1. 作者考虑的其他观点
   - 列举至少3个与主题相关的不同哲学立场
   - 说明这些立场的核心主张
2. 这些观点如何被整合或反驳
   - 分析作者如何吸收其他观点的优点
   - 评估作者对其他观点的批评是否恰当
3. 作者是否公正地呈现了不同立场
   - 检查是否有重要观点被忽视或曲解
   - 评估作者在描述对立观点时的语言是否中立</multiple_perspectives>

<limitations>局限性
指出作者论证或方法的潜在局限，如：
1. 未被考虑的重要因素
   - 列举至少2个可能影响结论的未讨论因素
   - 解释这些因素如何可能改变论证
2. 可能的偏见或假设
   - 识别作者的潜在文化或历史背景偏见
   - 指出关键但未经证实的假设
3. 论证的适用范围
   - 评估结论在不同情境下的适用性
   - 讨论理论与实际应用之间可能的差距</limitations>

<innovative_aspects>创新点
突出作者思维过程中的创新之处，如：
1. 新颖的概念或框架
   - 解释作者提出的任何新术语或概念
   - 评估这些新概念对问题理解的贡献
2. 独特的问题解决方法
   - 描述作者提出的任何新方法或策略
   - 分析这些方法相对于传统方法的优势
3. 跨学科的思考
   - 指出作者如何整合其他学科的见解（如心理学、神经科学等）
   - 评估跨学科方法对论证的增值</innovative_aspects>

<conclusion>结论
- 总结作者论证的主要优点和不足
- 评估作者对该哲学问题的整体贡献
- 提出进一步研究或思考的方向</conclusion>
"""

In [14]:
model = genai.GenerativeModel('models/gemini-1.5-flash-exp-0827', safety_settings={
    'HATE': 'BLOCK_NONE',
    'HARASSMENT': 'BLOCK_NONE',
    'SEXUAL': 'BLOCK_NONE',
    'DANGEROUS': 'BLOCK_NONE'
}, system_instruction=prompt)

In [15]:

response = model.generate_content([book_content, prompt])
from IPython import display

display.Markdown(response.text)

## 《道德经》哲学思辨过程分析


### <overview>概述</overview>

《道德经》是道家学派的代表作，其核心问题在于**探讨宇宙万物的本源及其运行规律，并指导人们如何顺应自然，达到和谐共处**。

**作者主要论点：**

1. **“道”是宇宙万物的本源和规律。** 道是无形无名、永恒存在，且不可言说的。
2. **“无为”是最佳的治理之道。**  通过顺应自然规律，不强求、不干预，才能达到社会和谐与稳定。
3. **“德”是“道”的体现，是个人修养的最高境界。**  通过修身养德，才能获得内心的平静和自由。


**作者哲学立场：** 

老子主张**自然主义**，认为自然界存在着一种客观规律“道”，人类应该顺应“道”而行，而非试图去控制和改造自然。他的哲学思想也包含了**朴素的唯物主义**和**辩证法**的思想萌芽。

**作者使用的主要哲学方法：**

老子主要使用**隐喻、比喻、反讽**等方法来阐述其哲学思想，同时也运用了**归纳推理**和**类比推理**。他注重**直觉和体验**，强调通过对自然现象的观察和思考来体悟“道”。


### <critical_analysis>批判性分析</critical_analysis>

**1. 主要论点及其支持证据：**

* **论点1：道是宇宙万物的本源和规律。** 
    * **证据：** “道可道，非常道”（第一章），说明道是难以言喻的，超越于语言和概念。
    * **评估：**  老子将“道”定义为难以言传的宇宙本源，这是一种抽象的、形而上的概念。这种论证方式更多依靠直觉和体验，缺乏逻辑上的严密证明。证据主要依靠隐喻和比喻，其相关性和充分性有待商榷。
* **论点2：无为是最佳的治理之道。**
    * **证据：** “为无为，则无不治”（第三章），说明不强求、不干预，反而能使万事万物自然发展。
    * **评估：**  老子认为“无为”并非完全不作为，而是指顺应自然规律，不强加于人。这种论证方式带有强烈的经验色彩，缺乏对具体政治和社会实践的分析，其证据的充分性也难以评估。
* **论点3：德是道的体现，是个人修养的最高境界。**
    * **证据：** “上善若水”（第八章），以水的特性来比喻“德”的特性，强调“德”的柔弱、滋润、包容等特征。
    * **评估：**  老子将“德”与“道”联系起来，强调个人修养的重要性。这是一种价值判断，其论证方式更多依靠感悟和修身实践，缺乏系统化的伦理理论支持。证据主要依靠类比和隐喻，其相关性和充分性也需进一步考量。


**2. 使用的推理方法：**

* **归纳推理：**老子通过观察自然界的现象，如水、谷、天地等，总结出“道”的特性和规律，并将其推广到社会和人生领域。例如，从水的滋养万物、不争不抢的特性推导出“上善若水”的理念。
* **类比推理：** 老子经常运用类比的方式来阐述“道”的内涵。例如，将“道”比喻成母亲、谷神、水等，使抽象的“道”更容易理解。 
* **评估：** 老子使用的归纳推理和类比推理在一定程度上能够帮助人们理解其哲学思想，但这些推理方式也存在局限性。归纳推理容易受到个别现象的影响，类比推理则需确保类比对象之间的相似性，否则容易产生谬误。


**3. 潜在的逻辑谬误或弱点：**

* **诉诸自然：** 老子将自然规律直接等同于社会和人生的规律，存在着潜在的诉诸自然的谬误。他认为顺应自然就是最佳选择，但忽略了人类社会自身发展的复杂性。
* **概念模糊：** “道”的概念过于抽象，缺乏明确的界定，容易导致理解上的偏差。
* **前提的可靠性：** 老子的一些前提假设，例如“自然和谐”、“无为而治”等，在现代社会中是否仍然适用，值得商榷。


**4. 作者如何应对反驳：**

* **预见的主要反对意见：** 老子可能预见到有人会质疑“无为”会导致社会混乱、国家衰败等问题。
* **反驳策略：** 老子通过强调“无为”并非不作为，而是指顺应自然规律，不强加于人，从而化解这些质疑。他认为，只有顺应自然规律，才能使社会达到和谐和稳定。
* **评估：** 老子的反驳策略具有一定的说服力，但在面对具体社会问题时，其“无为”思想的适用性仍然存在争议。


### <multiple_perspectives>多角度考量</multiple_perspectives>

**1. 作者考虑的其他观点：**

* **儒家思想：** 儒家强调人伦秩序、道德规范和社会责任，提倡积极入世，以仁义礼智信来治理国家和社会。
* **法家思想：** 法家强调以法治国，主张建立严密的法律制度和强大的中央集权，以维护社会秩序和稳定。
* **墨家思想：** 墨家提倡兼爱、非攻、尚贤、尚同等思想，强调社会公平正义和天下大同。


**2. 这些观点如何被整合或反驳：**

* **与儒家思想的关系：** 老子与儒家思想存在着一定的差异。儒家提倡积极入世，强调社会责任，而老子则主张顺应自然，强调个人修养。在一定程度上，老子可以被理解为对儒家过分强调人治和礼教的一种反思。
* **与法家思想的关系：** 老子与法家思想也存在着差异。法家强调以法治国，而老子则强调“无为”治国。老子对法家严刑峻法和高度集权的治理方式可能持批判态度。
* **整合其他观点：** 老子虽然与其他学派存在差异，但他的“道法自然”思想也蕴含着其他学派的某些元素，例如儒家的“仁爱”、墨家的“兼爱”等。这些思想在一定程度上可以被理解为对“道”的不同理解和诠释。


**3. 作者是否公正地呈现了不同立场：**

* **忽视或曲解：** 《道德经》的篇幅有限，老子并没有详细论述其他学派，也没有直接批判其他学派。
* **语言是否中立：** 老子在阐述其哲学思想时，语言相对较为平淡和含蓄，没有明显的偏见和攻击性。 


### <limitations>局限性</limitations>

**1. 未被考虑的重要因素：**

* **社会变革：** 老子主要关注社会稳定和个人修养，而忽略了社会变革和进步的因素。他的“无为”思想在面对社会剧烈变革时，其适用性存在疑问。
* **人性复杂性：** 老子对人性的认识较为简单，他认为人天生向善，但忽略了人性中自私、贪婪等负面因素。在处理社会冲突和道德困境时，“道法自然”的原则可能无法提供有效的解决方案。


**2. 可能的偏见或假设：**

* **文化背景：** 老子的哲学思想深受其所处时代和文化背景的影响，例如当时社会相对较为封闭和稳定。他的思想是否能够适用于现代社会多元化的文化环境，值得商榷。
* **未经证实的假设：**  “道”的客观存在性缺乏科学的验证，它更像是一种哲学上的假设。


**3. 论证的适用范围：**

* **不同情境下的适用性：** 老子的“无为”思想在处理一些简单的社会问题时可能较为有效，但面对复杂的社会问题，例如经济危机、环境污染等，则需要更加积极的干预和治理。
* **理论与实际应用之间可能的差距：**  “道法自然”的思想在理论上有一定的启发性，但将其直接运用于社会实践则需要谨慎考虑，避免走向消极和逃避。


### <innovative_aspects>创新点</innovative_aspects>

**1. 新颖的概念或框架：**

* **“道”的概念：** 老子提出的“道”的概念超越了以往的哲学思想，将宇宙万物的本源和运行规律概括为一个抽象的概念，为后世哲学的发展提供了新的思考方向。
* **“无为”的治理理念：** 老子提出的“无为”治理理念与以往的政治思想截然不同，强调顺应自然规律，而非强加于人，为后世政治思想提供了新的视角。


**2. 独特的问题解决方法：**

* **“返璞归真”的修身方法：** 老子强调通过修身养德来达到内心的平静和自由，这种“返璞归真”的修身方法与以往的道德伦理思想有所不同，强调内在的修养而非外在的约束。


**3. 跨学科的思考：**

* **自然与社会的统一：** 老子将自然和社会视为一个整体，强调人与自然和谐共处，这种跨学科的思考方式为后世的生态伦理和环境保护提供了重要的启示。


### <conclusion>结论</conclusion>

《道德经》的哲学思想具有重要的历史意义和现实价值。其**优点**在于：

* 提出了“道法自然”的哲学理念，强调人与自然和谐相处的重要性。
* 倡导“无为”的治理方式，为后世的政治思想提供了新的思考视角。
* 强调个人修养和内在的道德规范，为个人精神的完善提供了重要的指引。

其**不足**之处在于：

* “道”的概念过于抽象，缺乏明确的界定。
* “无为”思想在面对复杂的社会问题时，其适用性存在争议。
* 对人性的认识较为简单，忽略了人性中复杂的一面。


总而言之，老子对中国传统哲学的发展产生了深远的影响，其“道法自然”的思想至今仍具有重要的现实意义。但我们也需要清醒地认识到其局限性，并将其思想与现代社会的发展相结合，才能使其发挥更大的作用。


**进一步研究或思考的方向：**

* “道”的概念如何在现代科学的框架下进行诠释？
* “无为”的治理理念如何在现代社会中得到有效的实践？
* 老子的哲学思想如何与现代伦理和社会问题相结合？


希望以上分析能够帮助你更好地理解《道德经》中的哲学思辨过程。 


《三国演义》长文档总结并回答中注明引用出处

In [46]:
import requests
from bs4 import BeautifulSoup


def fetch_article_content(url):
    response = requests.get(url)
    soup = BeautifulSoup(response.content, 'html.parser')

    # 移除脚本和样式元素
    for script in soup(["script", "style"]):
        script.decompose()

    # 获取文本
    text = soup.get_text()

    # 将文本分割成行，并移除每行开头和结尾的空格
    lines = (line.strip() for line in text.splitlines())
    # 将多个标题分割成单独的行
    chunks = (phrase.strip() for line in lines for phrase in line.split("  "))
    # 删除空行
    text = '\n'.join(chunk for chunk in chunks if chunk)

    return text


# 获取文章内容
book_url = "https://www.gutenberg.org/cache/epub/23950/pg23950.txt"
book_content = fetch_article_content(book_url)

print(f"从书中获取了 {len(book_content)} 个字符。")
print("前500个字符：")
print(book_content[:500])

从书中获取了 630065 个字符。
前500个字符：
The Project Gutenberg eBook of 三國志演義
This ebook is for the use of anyone anywhere in the United States and
most other parts of the world at no cost and with almost no restrictions
whatsoever. You may copy it, give it away or re-use it under the terms
of the Project Gutenberg License included with this ebook or online
at www.gutenberg.org. If you are not located in the United States,
you will have to check the laws of the country where you are located
before using this eBook.
Title: 三國志演義
Author:


In [47]:
book_content_san_guo=book_content[:20000]

In [50]:
prompt = f"""

你正在查看相关文档。请形成一个连贯的总体摘要:

1. 主要人物及其特征
2. 重要战役和事件
3. 政治策略和军事谋略
4. 人物之间的关系和互动
5. 故事中的道德寓意或主题
6. 特殊元素(如兵器、地理位置、历史背景等)

请在每个部分的XML标题内以项目符号的形式提供摘要。例如:

<主要人物及其特征>
- 刘备: [特征描述]
// 根据需要添加更多详细信息
</主要人物及其特征>

如果文档中没有明确说明任何信息，请注明"未指明"。

摘要:
"""

In [51]:
model = genai.GenerativeModel('models/gemini-1.5-flash-exp-0827', safety_settings={
    'HATE': 'BLOCK_NONE',
    'HARASSMENT': 'BLOCK_NONE',
    'SEXUAL': 'BLOCK_NONE',
    'DANGEROUS': 'BLOCK_NONE'
}, system_instruction=prompt)

response = model.generate_content([book_content_san_guo,prompt])
from IPython import display

display.Markdown(response.text)

<主要人物及其特征>
- **刘备**: 汉室宗亲，仁义礼智信兼备，有雄才大略，但优柔寡断，缺乏决断力。
- **关羽**: 义薄云天，忠肝义胆，武艺高强，重情重义，忠于刘备。
- **张飞**: 性格豪爽，勇猛过人，嫉恶如仇，忠心耿耿，对刘备忠心护主。
- **曹操**: 权谋之士，治世之能臣，乱世之奸雄，雄才大略，野心勃勃，最终建立魏国。
- **董卓**: 西凉人，性格残暴，骄横跋扈，挟天子以令诸侯，最终被王允和吕布所杀。
- **吕布**: 武艺超群，被称为“飞将”，反复无常，见利忘义，最终被曹操所杀。
- **袁绍**: 袁氏四世三公，门生故吏遍布天下，但优柔寡断，最终败于曹操。
- **孙坚**: 勇敢果断，精明强干，最终建立吴国。
- **皇甫嵩**: 征讨黄巾起义的重要将领，深受朝廷信任。
- **朱隽**: 征讨黄巾起义的重要将领，深受朝廷信任。
- **十常侍**: 宦官集团，祸乱朝纲，最终被袁绍等人诛杀。
- **何进**: 大将军，欲诛杀宦官，但缺乏决断力，最终被宦官所杀。
- **王允**: 司徒，巧妙利用貂蝉除掉了董卓。
</主要人物及其特征>


<重要战役和事件>
- **黄巾起义**: 张角领导的农民起义，揭开了东汉末年动乱的序幕。
- **讨伐黄巾**: 各路诸侯讨伐黄巾起义，刘备在其中崭露头角。
- **董卓进京**: 董卓受何进邀请进京，进而控制朝政，废立皇帝。
- **诛杀何进**: 十常侍联合董卓诛杀何进，引发宫廷政变。
- **董卓专权**: 董卓控制朝政，废少帝，立献帝，为所欲为。
- **诛杀少帝**: 董卓迫害少帝，最终将其杀害。
- **王允刺董卓**: 王允联合吕布，最终刺杀董卓。
- **官渡之战**: 曹操与袁绍的决战，曹操取得胜利，奠定了统一北方的基础。(未指明，但根据历史背景推测)
- **赤壁之战**: 曹操南征，孙权与刘备联合抗击曹操，曹操大败。(未指明，但根据历史背景推测)
</重要战役和事件>


<政治策略和军事谋略>
- **连环计**: 王允利用貂蝉离间董卓和吕布，最终导致董卓被杀。
- **火攻**: 皇甫嵩和朱隽利用大风，火攻张梁张宝的营寨。
- **招降纳叛**: 朱隽在讨伐黄巾余党时，玄德建议招降，以减少损失。
- **奇袭**: 刘备在青州之战中利用关羽张飞伏击黄巾军取得胜利。
- **借刀杀人**: 曹操利用董卓对自己的信任，并借献刀之机逃脱。
- **挟天子以令诸侯**: 董卓控制汉献帝，以皇帝的名义发布命令，控制朝政。
- **分化瓦解**: 董卓利用李肃离间吕布和丁原，最终使吕布归顺。
</政治策略和军事谋略>


<人物之间的关系和互动>
- **桃园三结义**: 刘备、关羽、张飞结拜为兄弟，从此生死与共。
- **刘备与关羽、张飞**: 三人患难与共，建立深厚的兄弟情谊。
- **刘备与曹操**: 初期合作对抗黄巾起义，后因理念不合而分道扬镳。
- **刘备与董卓**: 刘备救了董卓，但董卓对其轻视。
- **董卓与吕布**: 董卓收吕布为义子，并重用他，但最终被吕布所杀。
- **董卓与李儒**: 董卓与李儒是君臣关系，并互相信任。
- **王允与曹操**: 王允和曹操联手，最终除掉了董卓。
- **袁绍与曹操**: 袁绍与曹操是政治对手，最终曹操取得胜利。
- **何进与十常侍**: 何进与十常侍的矛盾，最终导致何进被杀。
- **何进与袁绍**: 袁绍是何进的部下，也是何进诛杀宦官的主力，但何进缺乏决断力，最终导致失败。
- **十常侍与何进**: 十常侍与何进的冲突导致何进被杀，也引发了东汉末年的动荡。
- **孙坚与刘备**: 孙坚与刘备在讨伐黄巾余党中合作，但之后并未有更多交集。
</人物之间的关系和互动>


<故事中的道德寓意或主题>
- **忠义**: 刘备、关羽、张飞体现了忠义精神，是维护汉室正统的重要力量。
- **仁义**: 刘备的仁义为其赢得了民心，也成为其重要的政治资本。
- **忠君爱国**: 许多人物，如曹操、王允、伍孚，都表现了忠君爱国的思想。
- **奸诈与阴谋**: 董卓、十常侍等人物则体现了奸诈与阴谋，给天下带来了灾难。
- **英雄与乱世**: 故事描绘了东汉末年的乱世，也展现了众多英雄人物的崛起和命运。
- **权力的斗争**: 故事反映了政治斗争的残酷，以及权力对人性的影响。
- **忠奸善恶**: 故事中的人物善恶分明，体现了传统道德观念。
</故事中的道德寓意或主题>


<特殊元素>
- **兵器**: 青龙偃月刀、丈八蛇矛、方天画戟等兵器体现了当时社会的军事水平。
- **地理位置**: 涿郡、洛阳、颖川、广宗等地理位置，与故事发展和人物命运密切相关。
- **历史背景**: 故事以东汉末年的黄巾起义为背景，展现了当时社会政治动荡、民不聊生的景象。
- **谶语**:  洛阳小儿谣“帝非帝，王非王，千乘万骑走北邙”，预示了汉室的衰亡。
- **天书**:  张角得到南华老仙所授的天书，是黄巾起义的象征。
- **太平道**: 张角创立的宗教组织，在黄巾起义中发挥了重要作用。
</特殊元素> 


![](https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20240928154451.png)

In [54]:


prompt_template = '''
以下是你将要使用的文章:
<paper>
{PAPER_CONTENT}
</paper>

这是用户的问题，包含在<user_question>标签中:
<user_question>
{USER_QUESTION}
</user_question>

请按照以下步骤来组织你的回答:
1. 找出文中与回答问题最相关的引用。这些引用可以很长(甚至多个段落)。你可能需要使用多个引用来回答一个问题，包括代码片段和其他例子。
2. 按照找到的顺序给这些引用编号。
3. 基于文档和引用回答问题。尽可能直接引用文档，包括例子。
4. 回答问题时，在方括号中提供引用参考，包含在步骤2中生成的编号(找到引用的编号)。
5. 按以下格式构建输出。不要提供前言或后语:
<citations>
{{
   "citations": [
      {{
         "number": "整数",
         "passage": "字符串"
      }},
      ...
   ]
}}
</citations>

<answer>一个纯文本回答，以Markdown格式呈现[1]</answer>

现在轮到你了。首先按照描述的格式找出并输出相关引用。然后在<answer>标签内提供你对用户问题的回答。记住 - 只使用提供的论文中的信息，如果你在那里找不到答案，就让用户知道你没有那个信息。'''

In [61]:


model = genai.GenerativeModel('models/gemini-1.5-flash-exp-0827', safety_settings={
    'HATE': 'BLOCK_NONE',
    'HARASSMENT': 'BLOCK_NONE',
    'SEXUAL': 'BLOCK_NONE',
    'DANGEROUS': 'BLOCK_NONE'
}, system_instruction=prompt_template)


def answer_question(user_question):
    prompt = prompt_template.format(PAPER_CONTENT=book_content_san_guo, USER_QUESTION=user_question)
    response=model.generate_content(prompt)
    return response.text

raw_output = answer_question('曹操是什么样的人，一些事迹和言语可以体现推理')
print(raw_output)


<citations>
{
   "citations": [
      {
         "number": 1,
         "passage": "操父曹嵩，本姓夏侯氏；因\n為中常侍曹騰之養子，故冒姓曹。曹嵩生操，小字阿瞞，一名吉利。操幼時，好游獵，\n喜歌舞；有權謀，多機變。操有叔父，見操游蕩無度，嘗怒之，言於曹嵩。嵩責操。操\n忽心生一計：見叔父來，詐倒於地，作中風之狀。叔父驚告嵩，嵩急視之，操故無恙。\n嵩曰：「叔言汝中風，今己愈乎？」操曰：「兒自來無此病；因失愛於叔父，故見罔耳\n。」嵩信其言。後叔父但言操過，嵩並不聽。因此，操得恣意放蕩。"
      },
      {
         "number": 2,
         "passage": "時人有橋玄者，謂操曰：「天下將亂，非命世之才，不能濟。能安之者，其在君乎\n？」南陽何顒見操，言：「漢室將亡，安天下者，必此人也。」汝南許劭，有知人之名\n。操往見之，問曰：「我何如人？」劭不答。又問，劭曰：「子治世之能臣，亂世之奸\n雄也。」操聞言大喜。年二十，舉孝廉，為郎，除洛陽北都尉。初到任，即設五色棒十\n餘條於縣之四門。有犯禁者，不避豪貴，皆責之。中常侍蹇碩之叔，提刀夜行，操巡夜\n拏住，就棒責之。由是，內外莫敢犯者，威名頗震。後為頓丘令。因黃巾起，拜為騎都\n尉，引馬步軍五千，前來潁川助戰。正值張梁、張寶敗走，曹操攔住，大殺一陣，斬首\n萬餘級，奪得旗旛、金鼓馬匹極多。張梁、張寶死戰得脫。操見過皇甫嵩，朱雋，隨即\n引兵追襲張梁、張寶去了。"
      },
      {
         "number": 3,
         "passage": "操曰：「『燕雀安知鴻鵠志哉！』汝既拏住我，便當解去請賞。\n」縣令屏退左右，謂操曰：「汝休小覷我。我非俗吏，奈未遇其主耳。」操曰：「吾祖\n宗世食漢祿，若不思報國，與禽獸何異？吾屈身事卓者，欲乘間圖之，為國除害耳。今\n事不成，乃天意也！」縣令曰：「孟德此行，將欲何往？」操曰：「吾將歸鄉里，發矯\n詔，召天下諸侯興兵共誅董卓，吾之願也。""
      }
   ]
}
</citations>
<answer>曹操，字孟德，沛国谯郡人 [2]。他从小喜欢游猎、歌舞，并且有权谋和多变的性格 [1]。他的叔父曾因他

### QA问答对
实战过了长文档的XML标签的路数，我们接下来同样用prompt控制生成特定的格式：

例如要求模型生成特定数量的问答对，并可以分隔问题和答案（课程辅导等，书籍提取）

- few shot
先给一些例子

In [25]:
prompt = "请生成关于人工智能的问答对。使用以下格式：\n1. Q: [问题]\nA: [答案]\n2. Q: [问题]\nA: [答案]\n3. Q: [问题]\nA: [答案]"
response = model.generate_content(contents=prompt)
print(response.text)

1. Q: 什么是人工智能？
A: 人工智能 (AI) 是指计算机科学的一个分支，致力于构建能够执行通常需要人类智能的任务的智能代理。这些任务包括学习、推理、问题解决、感知、自然语言理解和决策等。

2. Q: 人工智能有哪些应用？
A: 人工智能的应用非常广泛，包括：
    * **自动驾驶汽车**:  使用AI进行导航和控制。
    * **医学诊断**: 利用AI分析医学图像和数据以协助诊断疾病。
    * **语音助手**: 例如Siri和Alexa，使用AI理解和回应人类语音指令。
    * **个性化推荐**:  电商平台和流媒体服务使用AI推荐商品和内容。
    * **欺诈检测**: 金融机构使用AI检测异常交易和防止欺诈。


3. Q: 人工智能的未来发展趋势是什么？
A: 人工智能的未来发展趋势包括：
    * **更强大的AI模型**:  随着计算能力的提高和算法的改进，AI模型将变得更加强大和智能。
    * **更广泛的应用**: AI将被应用于更多领域，例如教育、农业、制造业等。
    * **更加注重伦理和社会影响**: 随着AI的普及，人们将更加关注AI的伦理问题和社会影响，例如数据隐私、算法偏见和工作岗位替代等。 


In [26]:
import json

prompt = "生成3个关于人工智能的问答对，以JSON格式输出。格式如下：\n[{\"question\": \"问题1\", \"answer\": \"答案1\"}, {\"question\": \"问题2\", \"answer\": \"答案2\"}, {\"question\": \"问题3\", \"answer\": \"答案3\"}]"
response = model.generate_content(contents=prompt)
qa_pairs = json.loads(response.text)
for pair in qa_pairs:
    print(f"Q: {pair['question']}")
    print(f"A: {pair['answer']}\n")

Q: 什么是人工智能？
A: 人工智能（AI）是指计算机或机器展现出通常与人类智能相关的认知功能的能力，例如学习、解决问题和决策。

Q: 人工智能有哪些应用？
A: 人工智能应用广泛，包括自动驾驶汽车、语音助手、图像识别、医疗诊断、金融交易和机器人等领域。

Q: 人工智能的未来发展趋势是什么？
A: 人工智能的未来发展趋势包括更强大的计算能力、更先进的算法、更广泛的数据集以及更深入的伦理和社会影响研究。


In [27]:
from bs4 import BeautifulSoup

prompt = "生成3个关于人工智能的问答对，使用HTML标签格式。例如：<qa><q>问题</q><a>答案</a></qa>"
response = model.generate_content(contents=prompt)
soup = BeautifulSoup(response.text, 'html.parser')
qa_pairs = soup.find_all('qa')
for pair in qa_pairs:
    print(f"Q: {pair.q.text}")
    print(f"A: {pair.a.text}\n")

Q: 什么是人工智能?
A: 人工智能 (AI) 是指计算机或机器展现出类似人类智能的能力，例如学习、解决问题和决策。它涉及到开发能够执行通常需要人类智能的任务的计算机程序和算法。

Q: 人工智能有哪些应用?
A: 人工智能的应用非常广泛，包括：自动驾驶汽车、医学诊断、金融交易、语音识别、图像识别、自然语言处理、机器人技术等等。它正在改变着许多行业和我们的日常生活。

Q: 人工智能有哪些潜在风险?
A: 人工智能的潜在风险包括：工作岗位流失、算法偏见、隐私和安全问题、自主武器系统的伦理问题等等。了解和应对这些风险对于确保人工智能的负责任发展至关重要。


## Google特有的Json的格式——response_mime_type，response_schema参数

最新的模型（1.5 及更高版本）开放的功能让我们可以直接传递结构化对象（或等效的 python 类型），并且输出将严格遵循该模式。

回顾一下generation_config中可以携带的参数：

1. candidate_count: 生成的候选回答数量(目前只能为1)
2. max_output_tokens: 输出的最大token数
3. temperature: 控制输出随机性(0-1之间)
4. top_p和top_k: 控制词的选择范围  
5. stop_sequences: 指定停止生成的标记
6. response_mime_type: 指定输出格式
7. response_schema: 定义JSON输出结构

### response_mime_type参数

response_mime_type是Gemini API中GenerationConfig的一个参数,用于指定期望的响应格式。它有两个主要值:

- "application/json": 用于生成JSON格式的结构化数据
- "text/x.enum": 用于从预定义的选项中选择一个文本响应

默认情况下,如果不指定response_mime_type,API会返回普通文本格式。

通过在generation_config参数中指定respose_mime_type来激活 JSON 模式，当然推荐加入prompt提高权重：

In [16]:
model = genai.GenerativeModel("gemini-1.5-flash-latest",
                              generation_config={"response_mime_type": "application/json"})

In [28]:

prompt = "生成3个关于人工智能的问答对"
response = model.generate_content(contents=prompt, generation_config={"response_mime_type": "application/json"})
print(response.text)

[{"question": "什么是人工智能？", "answer": "人工智能（AI）是指计算机或机器展现出类似人类智能的能力，例如学习、推理、解决问题和决策。"}, {"question": "人工智能有哪些应用？", "answer": "人工智能的应用非常广泛，包括自动驾驶、语音助手、图像识别、医疗诊断、金融预测等等。"}, {"question": "人工智能的未来发展趋势是什么？", "answer": "人工智能的未来发展趋势包括更强大的算法、更广泛的数据应用、更深入的行业融合以及更人性化的交互体验。"}]


### response_schema参数

当设置response_mime_type="application/json"时,说明我们期望API返回JSON格式的数据。它通常与response_schema参数一起使用,以定义所需的JSON结构。

response_schema参数来控制JSON结构主要有两种方法：

方式一：使用 TypedDict 和类型提示
TypedDict 是 Python 中用于 描述字典类型 的一种方式，它可以指定字典中 每个键的名称和类型
当使用 list[QAPair] 作为 response_schema 时，genai 库内部会检测到这是一个类提示，
意味着按要求返回一个 `QAPair` 对象的列表。并调用 _schema_for_class(cls) 方法将符合 `QAPair` 结构的 Python 对象转化成JSON Schema 字典。



方式二：使用 JSON Schema 字典
这种方式直接提供了符合 JSON Schema 规范的字典，genai 可以直接使用该字典得到JSon结构。

建议选择 TypedDict。它简单明了，代码更易读：结构清晰，直观地展示了数据的组成。。


1. TypedDict 方式

定义方法：
```python
from typing import TypedDict

class Person(TypedDict):
    name: str
    age: int
```

原因：TypedDict 是 Python 的原生支持，使用简单，对于简单的数据结构来说足够使用，同时能提供基本的类型安全。



In [36]:
from typing_extensions import TypedDict


# 定义 TypedDict
class QAPair(TypedDict):
    question: str # 指定 QAPair 字典必须包含一个名为 question 的键，其值为字符串类型 (str)。
    answer: str  # 指定 QAPair 字典必须包含一个名为 answer 的键，其值也为字符串类型 (str)。


# 创建 GenerativeModel 实例
model = genai.GenerativeModel("gemini-1.5-pro-latest")

# 生成内容
result = model.generate_content(
    "列出几个关于LLM大模型应用开发的常见问题及其答案。",
    generation_config=genai.GenerationConfig(
        response_mime_type="application/json",
        response_schema=list[QAPair]  
        # 按要求返回一个 `QAPair` 对象的列表。内置会将符合 `QAPair` 结构的 Python 对象序列化为 JSON。
    ),
)

print(result)


response:
GenerateContentResponse(
    done=True,
    iterator=None,
    result=protos.GenerateContentResponse({
      "candidates": [
        {
          "content": {
            "parts": [
              {
                "text": "[{\"answer\": \"\u9009\u62e9\u5408\u9002\u7684\u9884\u8bad\u7ec3\u6a21\u578b\u662fLLM\u5e94\u7528\u5f00\u53d1\u7684\u7b2c\u4e00\u6b65\u3002\u9700\u8981\u6839\u636e\u5e94\u7528\u573a\u666f\u3001\u6570\u636e\u89c4\u6a21\u3001\u9884\u7b97\u7b49\u56e0\u7d20\u9009\u62e9\u5408\u9002\u7684\u6a21\u578b\u3002\u4f8b\u5982\uff0c\u5bf9\u4e8e\u6587\u672c\u751f\u6210\u4efb\u52a1\uff0c\u53ef\u4ee5\u9009\u62e9GPT-3\u6216\u7c7b\u4f3c\u7684\u751f\u6210\u5f0f\u6a21\u578b\uff1b\u5bf9\u4e8e\u6587\u672c\u5206\u7c7b\u4efb\u52a1\uff0c\u53ef\u4ee5\u9009\u62e9BERT\u6216RoBERTa\u7b49\u5224\u522b\u5f0f\u6a21\u578b\u3002\", \"question\": \"\u5982\u4f55\u9009\u62e9\u5408\u9002\u7684\u9884\u8bad\u7ec3\u6a21\u578b\uff1f\"}, {\"answer\": \"\u5fae\u8c03\u662f\u5c06\u9884\u8bad\u7ec3\u6a21\u5

In [41]:
import json

#  result.text 包含 JSON 数据
json_data = result.text

# 将 JSON 字符串解析为 Python 对象
data = json.loads(json_data)

# 使用 json.dumps 格式化并打印，设置缩进为4个空格，并确保中文字符正常显示
pretty_json = json.dumps(data, indent=4, ensure_ascii=False)
print(pretty_json)

[
    {
        "answer": "选择合适的预训练模型是LLM应用开发的第一步。需要根据应用场景、数据规模、预算等因素选择合适的模型。例如，对于文本生成任务，可以选择GPT-3或类似的生成式模型；对于文本分类任务，可以选择BERT或RoBERTa等判别式模型。",
        "question": "如何选择合适的预训练模型？"
    },
    {
        "answer": "微调是将预训练模型应用于特定任务的关键步骤。需要准备标注好的训练数据，并选择合适的微调策略，例如学习率、批次大小、训练轮数等。",
        "question": "如何进行模型微调？"
    },
    {
        "answer": "可以通过增加训练数据、使用更强大的硬件、优化模型结构等方式提升模型性能。",
        "question": "如何提升模型性能？"
    },
    {
        "answer": "可以使用Prompt Engineering技术设计合适的输入提示，引导模型生成更符合预期的输出。",
        "question": "如何控制模型输出？"
    },
    {
        "answer": "模型部署的方式取决于应用场景和性能需求。可以选择将模型部署到云端服务器、本地服务器或边缘设备。",
        "question": "如何进行模型部署？"
    },
    {
        "answer": "LLM模型存在生成虚假信息、偏见和歧视等伦理风险。需要采取措施 mitigagte 这些风险，例如对模型输出进行事实核查、使用公平数据集进行训练等。",
        "question": "如何应对LLM的伦理风险？"
    }
]


2. JSON Schema 字典方式

定义方法：
```python
schema = {
    "type": "object",
    "properties": {
        "name": {"type": "string"},
        "age": {"type": "integer"}
    },
    "required": ["name", "age"]
}
```

优点：
- 灵活性高：可以定义复杂的嵌套结构、数组内容、条件验证等。
- 易于与外部系统集成：JSON Schema 是广泛使用的标准。

缺点：
- 需手动维护结构：容易出现拼写错误或结构错误。
- 缺乏静态类型检查：Python 无法直接检查字典的正确性。

适用场景：适合与外部API交互或需要复杂验证的项目。

原因：JSON Schema 提供了丰富的验证选项和灵活的结构定义能力，适合处理复杂的数据结构和验证需求。

In [62]:
# 定义 JSON Schema
response_schema = {
    "type": "array",
    "items": {
        "type": "object",
        "properties": {
            "question": {"type": "string"},
            "answer": {"type": "string"}
        },
        "required": ["question", "answer"]
    }
}

# 创建 GenerativeModel 实例
model = genai.GenerativeModel("gemini-1.5-pro-latest")

# 生成内容
result = model.generate_content(
    "列出几个关于面试LLM大模型应用开发的常见问题及其答案。",
    generation_config=genai.GenerationConfig(
        response_mime_type="application/json",
        response_schema=response_schema
    ),
)

print(result)


response:
GenerateContentResponse(
    done=True,
    iterator=None,
    result=protos.GenerateContentResponse({
      "candidates": [
        {
          "content": {
            "parts": [
              {
                "text": "[{\"answer\": \"LLM\u5927\u6a21\u578b\u5e94\u7528\u5f00\u53d1\u9700\u8981\u638c\u63e1\u54ea\u4e9b\u5173\u952e\u6280\u672f\uff1f\\\\n\\\\n- \u719f\u6089\u5e38\u89c1\u7684LLM\u6a21\u578b\uff0c\u4f8b\u5982GPT\u3001BERT\u7b49\uff0c\u4e86\u89e3\u5176\u4f18\u7f3a\u70b9\u548c\u9002\u7528\u573a\u666f\u3002\\\\n- \u638c\u63e1\u81ea\u7136\u8bed\u8a00\u5904\u7406\u7684\u57fa\u672c\u6982\u5ff5\u548c\u6280\u672f\uff0c\u4f8b\u5982\u5206\u8bcd\u3001\u8bcd\u5411\u91cf\u3001\u547d\u540d\u5b9e\u4f53\u8bc6\u522b\u7b49\u3002\\\\n- \u5177\u5907\u4e00\u5b9a\u7684\u7f16\u7a0b\u80fd\u529b\uff0c\u4f8b\u5982Python\uff0c\u719f\u6089\u5e38\u7528\u7684\u673a\u5668\u5b66\u4e60\u548c\u6df1\u5ea6\u5b66\u4e60\u6846\u67b6\uff0c\u4f8b\u5982TensorFlow\u3001PyTorch\u7b49\u3002\\\\n- \u4e86\u89e

In [42]:
import json

# result.text 包含JSON 数据
json_data = result.text

# 将 JSON 字符串解析为 Python 对象
data = json.loads(json_data)

# 使用 json.dumps 格式化并打印，设置缩进为4个空格，并确保中文字符正常显示
pretty_json = json.dumps(data, indent=4, ensure_ascii=False)
print(pretty_json)

[
    {
        "answer": "选择合适的预训练模型是LLM应用开发的第一步。需要根据应用场景、数据规模、预算等因素选择合适的模型。例如，对于文本生成任务，可以选择GPT-3或类似的生成式模型；对于文本分类任务，可以选择BERT或RoBERTa等判别式模型。",
        "question": "如何选择合适的预训练模型？"
    },
    {
        "answer": "微调是将预训练模型应用于特定任务的关键步骤。需要准备标注好的训练数据，并选择合适的微调策略，例如学习率、批次大小、训练轮数等。",
        "question": "如何进行模型微调？"
    },
    {
        "answer": "可以通过增加训练数据、使用更强大的硬件、优化模型结构等方式提升模型性能。",
        "question": "如何提升模型性能？"
    },
    {
        "answer": "可以使用Prompt Engineering技术设计合适的输入提示，引导模型生成更符合预期的输出。",
        "question": "如何控制模型输出？"
    },
    {
        "answer": "模型部署的方式取决于应用场景和性能需求。可以选择将模型部署到云端服务器、本地服务器或边缘设备。",
        "question": "如何进行模型部署？"
    },
    {
        "answer": "LLM模型存在生成虚假信息、偏见和歧视等伦理风险。需要采取措施 mitigagte 这些风险，例如对模型输出进行事实核查、使用公平数据集进行训练等。",
        "question": "如何应对LLM的伦理风险？"
    }
]


后续处理那么当模型返回的是 JSON 格式的字符串，并存储在 `result.text` 中，除了刚才json.dumps 格式化并打印，我们在后端都可以有什么样的应用呢

1. JSON 解析：
   首先，我们需要将 JSON 字符串解析为 Python 对象。

In [38]:
import json
data = json.loads(result.text)

2. 数据处理：
   遍历解析后的数据，进行必要的处理或转换，或数据验证

In [39]:
processed_data = []
for item in data:
   processed_item = {
       "question": item.get("question", ""),
       "answer": item.get("answer", "")
   }
   processed_data.append(processed_item)

print(processed_data)

[{'question': '如何选择合适的预训练模型？', 'answer': '选择合适的预训练模型是LLM应用开发的第一步。需要根据应用场景、数据规模、预算等因素选择合适的模型。例如，对于文本生成任务，可以选择GPT-3或类似的生成式模型；对于文本分类任务，可以选择BERT或RoBERTa等判别式模型。'}, {'question': '如何进行模型微调？', 'answer': '微调是将预训练模型应用于特定任务的关键步骤。需要准备标注好的训练数据，并选择合适的微调策略，例如学习率、批次大小、训练轮数等。'}, {'question': '如何提升模型性能？', 'answer': '可以通过增加训练数据、使用更强大的硬件、优化模型结构等方式提升模型性能。'}, {'question': '如何控制模型输出？', 'answer': '可以使用Prompt Engineering技术设计合适的输入提示，引导模型生成更符合预期的输出。'}, {'question': '如何进行模型部署？', 'answer': '模型部署的方式取决于应用场景和性能需求。可以选择将模型部署到云端服务器、本地服务器或边缘设备。'}, {'question': '如何应对LLM的伦理风险？', 'answer': 'LLM模型存在生成虚假信息、偏见和歧视等伦理风险。需要采取措施 mitigagte 这些风险，例如对模型输出进行事实核查、使用公平数据集进行训练等。'}]


3. 数据存储：
   将处理后的数据存储到数据库中。

In [None]:
from your_database_module import db
   
for item in processed_data:
   db.insert_qa_pair(item["question"], item["answer"])

4. 数据分析：
   进行一些基本的数据分析。

In [44]:
total_qa_pairs = len(processed_data)
avg_answer_length = sum(len(item["answer"]) for item in processed_data) / total_qa_pairs
print(avg_answer_length)

63.666666666666664


5. 生成 API 响应：
   将处理后的数据格式化为 API 响应。

In [None]:
api_response = {
       "status": "success",
       "data": processed_data,
       "metadata": {
           "total_pairs": total_qa_pairs,
           "avg_answer_length": avg_answer_length
       }
   }


上面我们看了用response_mime_type="application/json"将大模型返回的原始 JSON 数据转换为更有用、更结构化的形式，并集成到应用程序

**下面我们看response_mime_type的另一个值 —— "text/x.enum"**

当设置response_mime_type="text/x.enum"时,我们期望API从预定义的选项中选择一个作为响应。这也需要配合response_schema使用。

当你想限制可能的回答范围,例如选择题、分类任务等时可以使用"text/x.enum"

枚举选项可能会限制模型的创造性,但可以确保答案在预期范围内。

In [63]:
result = model.generate_content(
    ["我尝到了一种奇特的水果,它有着粘稠的质地,但却散发着淡淡的甜香。这种食材最可能是什么?"],
    generation_config=genai.GenerationConfig(
        response_mime_type="text/x.enum",
        response_schema={
            "type": "STRING",
            "enum": ["海胆", "榴莲", "臭豆腐", "松露", "鱼子酱"],
        },
    ),
)
print(result.text)

 榴莲


In [21]:

# 描述一种新型运动
result = model.generate_content(
    ["我最近加入了一个新的运动俱乐部,我们在虚拟现实中进行各种体育比赛。这种运动形式属于哪一类?"],
    generation_config=genai.GenerationConfig(
        response_mime_type="text/x.enum",
        response_schema={
           "type": "STRING",
            "enum": ["传统体育", "极限运动", "电子竞技", "健身", "冥想"],
        },
    ),
)
print(result.text)

电子竞技


In [26]:
result = model.generate_content(
    ["虚拟现实体育比赛包含什么元素"],
    generation_config=genai.GenerationConfig(
        response_mime_type="text/x.enum",
        response_schema={
           "type": "STRING",
            "enum": ["结合传统体育和电子竞技元素",
                   "完全模拟现实世界的体育项目",
                   "主要关注视觉效果而非运动",
                   "可以多人比赛",
                   "需要专业运动员参与"],
        },
    ),
)
print(result.text)

结合传统体育和电子竞技元素


In [58]:
import enum
from typing import List
from typing_extensions import TypedDict
import google.generativeai as genai
import os

class Difficulty(enum.Enum):
    SUPER_EASY = "超级简单"
    EASY = "简单"
    MEDIUM = "中等"
    HARD = "困难"
    EXPERT = "专家级"

class CocktailRecipe(TypedDict):
    recipe_name: str
    difficulty: Difficulty
    ingredients: List[str]
    instructions: List[str]

genai.configure(api_key=os.environ["API_KEY"], transport="rest")
model = genai.GenerativeModel("gemini-1.5-pro-exp-0827")

result = model.generate_content(
    """列出约10种鸡尾酒,并提供以下信息:
    1. 鸡尾酒名称
    2. 制作难度评级
    3. 配料清单
    4. 制作步骤
    请包括一些独特或经典的组合。以JSON格式返回结果。""",
    generation_config=genai.GenerationConfig(
        response_mime_type="application/json", 
        response_schema=list[CocktailRecipe]
        # 按要求返回一个 `CocktailRecipe` 对象的列表。内置会将符合 `CocktailRecipe` 结构的 Python 对象序列化为 JSON。
    ),
)

print(result.text)

[{"difficulty": "简单", "ingredients": ["60 毫升 朗姆酒", "120 毫升 可乐", "青柠角"], "instructions": ["在装满冰块的高球杯中加入朗姆酒。", "加入可乐，轻轻搅拌。", "用青柠角装饰。"], "recipe_name": "自由古巴"}, {"difficulty": "简单", "ingredients": ["45 毫升 龙舌兰酒", "30 毫升 青柠汁", "15 毫升 橙皮甜酒"], "instructions": ["将所有原料倒入装满冰块的摇酒壶中。", "摇匀至完全冷却。", "滤入冰镇的鸡尾酒杯中。", "用盐边装饰（可选）。"], "recipe_name": "玛格丽塔"}, {"difficulty": "中等", "ingredients": ["60 毫升 金酒", "30 毫升 干苦艾酒", "橄榄或柠檬皮（装饰用）"], "instructions": ["在装满冰块的调酒杯中加入金酒和干苦艾酒。", "搅拌至完全冷却。", "滤入冰镇的鸡尾酒杯中。", "用橄榄或柠檬皮装饰。"], "recipe_name": "马提尼"}, {"difficulty": "中等", "ingredients": ["45 毫升 波本威士忌或黑麦威士忌", "30 毫升 甜苦艾酒", "2 Dashes 安格式苦酒", "橙皮（装饰用）"], "instructions": ["在调酒杯中加入所有原料。", "加入冰块并搅拌至完全冷却。", "滤入冰镇的岩石杯中。", "用橙皮装饰。"], "recipe_name": "曼哈顿"}, {"difficulty": "中等", "ingredients": ["60 毫升 白朗姆酒", "22 毫升 青柠汁", "15 毫升 简易糖浆", "8 片 薄荷叶", "苏打水"], "instructions": ["在摇酒壶中加入薄荷叶、青柠汁和简易糖浆。", "轻轻按压薄荷叶以释放其香气。", "加入朗姆酒和冰块。", "摇匀至完全冷却。", "双重滤入装满碎冰的高球杯中。", "加满苏打水。", "用薄荷枝和青柠角装饰。"], "recipe_name": "莫吉托"}, {"difficulty": "简单", "ing

In [59]:
import json

json_data = result.text

# 将 JSON 字符串解析为 Python 对象
data = json.loads(json_data)

# 使用 json.dumps 格式化并打印，设置缩进为4个空格，并确保中文字符正常显示
pretty_json = json.dumps(data, indent=4, ensure_ascii=False)
print(pretty_json)

[
    {
        "difficulty": "简单",
        "ingredients": [
            "60 毫升 朗姆酒",
            "120 毫升 可乐",
            "青柠角"
        ],
        "instructions": [
            "在装满冰块的高球杯中加入朗姆酒。",
            "加入可乐，轻轻搅拌。",
            "用青柠角装饰。"
        ],
        "recipe_name": "自由古巴"
    },
    {
        "difficulty": "简单",
        "ingredients": [
            "45 毫升 龙舌兰酒",
            "30 毫升 青柠汁",
            "15 毫升 橙皮甜酒"
        ],
        "instructions": [
            "将所有原料倒入装满冰块的摇酒壶中。",
            "摇匀至完全冷却。",
            "滤入冰镇的鸡尾酒杯中。",
            "用盐边装饰（可选）。"
        ],
        "recipe_name": "玛格丽塔"
    },
    {
        "difficulty": "中等",
        "ingredients": [
            "60 毫升 金酒",
            "30 毫升 干苦艾酒",
            "橄榄或柠檬皮（装饰用）"
        ],
        "instructions": [
            "在装满冰块的调酒杯中加入金酒和干苦艾酒。",
            "搅拌至完全冷却。",
            "滤入冰镇的鸡尾酒杯中。",
            "用橄榄或柠檬皮装饰。"
        ],
        "recipe_name": "马提尼"
    },
    {
        "difficulty": "中等",
        "ing

1. candidate_count: 生成的候选回答数量(目前只能为1)
2. max_output_tokens: 输出的最大token数
3. temperature: 控制输出随机性(0-1之间)
4. top_p和top_k: 控制词的选择范围  
5. stop_sequences: 指定停止生成的标记
6. response_mime_type: 指定输出格式
7. response_schema: 定义JSON输出结构
撒花完结~

safty settings


允许开发者对AI生成内容进行细粒度的安全控制,以避免产生有害或不适当的内容。

如果内容被判定不安全:
   - 输入提示可能会被阻止
   - 生成的内容可能会被阻止并不返回

safty settings可以在创建 GenerativeModel 时设置,也可以在每次请求时传入

Gemini 模型支持 4 种安全类别:骚扰、仇恨言论、色情内容和危险内容。

这4个分类，相当于safty settings中的键：

![](https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20240924164432.png)

每个分类可以设定的阻止阈值，相当于safty settings中的值：

![](https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20240924163842.png)

默认的阻止阈值是BLOCK_MEDIUM_AND_ABOVE	


API支持使用枚举值、整数或字符串来指定这些安全设置。

有两种主要的安全反馈:
   - promptFeedback: 对输入提示的安全检查
   - 对生成内容的安全检查(在Candidate对象中)，API返回的GenerateContentResponse包含安全相关的反馈信息。
 


我们将编写一个被阻止的提示，查看原因，然后调整过滤器以解除阻止。

In [59]:
unsafe_prompt = "我觉得在披萨上放菠萝太奇怪了，写一篇文章狠狠地讽刺它，特别粗鲁特别不尊重的说"
response = model.generate_content(unsafe_prompt)

工程化之健壮性：

对于每个候选答案，需要先检查 response.candidates.finish_reason 。

生成的候选回复的安全反馈在 Candidate.finishReason 和 Candidate.safetyRatings 中。


如果 candidate.finish_reason 是 FinishReason.STOP ，这意味着您的生成请求成功运行

如果 candidate.finish_reason 是 FinishReason.SAFETY ，这意味着您的生成请求因安全原因被阻止。这也意味着 response.text 结构将为空。

In [53]:
print(response)

response:
GenerateContentResponse(
    done=True,
    iterator=None,
    result=protos.GenerateContentResponse({
      "candidates": [
        {
          "finish_reason": "SAFETY",
          "index": 0,
          "safety_ratings": [
            {
              "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
              "probability": "NEGLIGIBLE"
            },
            {
              "category": "HARM_CATEGORY_HATE_SPEECH",
              "probability": "NEGLIGIBLE"
            },
            {
              "category": "HARM_CATEGORY_HARASSMENT",
              "probability": "MEDIUM"
            },
            {
              "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
              "probability": "NEGLIGIBLE"
            }
          ]
        }
      ],
      "usage_metadata": {
        "prompt_token_count": 28,
        "total_token_count": 28
      }
    }),
)


In [54]:
print(response.candidates[0].finish_reason)

FinishReason.SAFETY


In [55]:
print(response.candidates[0].safety_ratings)

[category: HARM_CATEGORY_SEXUALLY_EXPLICIT
probability: NEGLIGIBLE
, category: HARM_CATEGORY_HATE_SPEECH
probability: NEGLIGIBLE
, category: HARM_CATEGORY_HARASSMENT
probability: MEDIUM
, category: HARM_CATEGORY_DANGEROUS_CONTENT
probability: NEGLIGIBLE
]


In [56]:
try:
    print(response.text)
except:
    print("No information generated by the model.")

No information generated by the model.


我们可以选择设置为不阻止内容。当然对于某些提示，Gemini 仍然将避免生成结果，即使我们将所有safty settings设置为无。

In [60]:
response = model.generate_content(
    unsafe_prompt,
    safety_settings={
        'HATE': 'BLOCK_NONE',
        'HARASSMENT': 'BLOCK_NONE',
        'SEXUAL': 'BLOCK_NONE',
        'DANGEROUS': 'BLOCK_NONE'
    })

In [61]:
try:
    print(response.text)
except:
    print("No information generated by the model.")

## 菠萝披萨：一种对人类文明的侮辱

各位爱好披萨的朋友们，你们是否也和我一样，对一种罪恶的邪恶食物感到深深的厌恶？没错，我说的就是披萨上的那颗“毒瘤”—— **菠萝**！ 

有些人可能还陶醉于“酸甜搭配”的幻觉，但他们忘记了：披萨是神圣的，是意大利传统美食的精华，是无数人心中最美好的味觉记忆！而菠萝，这颗生长在热带丛林的“野蛮水果”，**根本没有资格玷污这神圣的美味**！

想象一下，当你在享受着香气扑鼻的披萨时，突然咬到一块**冰冷甜腻的菠萝**，那感觉就像是在天堂吃了一口**猪食**！这酸涩的口感，这奇特的搭配，简直是在挑战你的味觉极限！ 

更可恶的是，一些披萨店为了迎合一些“奇奇怪怪”的口味，竟然把菠萝作为一种**标准配料**，这简直是**对传统披萨的亵渎**！难道他们不知道， **披萨只有经典的美味才配得上它的名字**吗？

所以，朋友们，让我们一起抵制菠萝披萨，**守护披萨的尊严！** 我们应该用更纯粹的食材，更经典的搭配，来展现披萨的魅力，而不是用这些**毫无道理的水果**来破坏它！

记住，披萨是神圣的，它**不需要**任何额外的装饰，更不需要**菠萝这颗“毒瘤”**！  


![](https://typora-photo1220.oss-cn-beijing.aliyuncs.com/DataAnalysis/LingYi/20240924175116.png)

为了防止一些例外，我们自己调用API时，可以将safety_setting从默认值更改为最开放的方法。并放在初始化model处，而不是单次问答中。


| 函数              | 必需参数               | 可选参数                                                                                        | 主要区别                  | 适用场景                       |
|-------------------|-----------------------|---------------------------------------------------------------------------------------------|-----------------------|----------------------------|
| `init`            | `model_name`          | `generation_config`, `safety_settings`, `tools`, `tool_config`, **`system_instruction`**    | 用于初始化对象并设置基本参数        | 创建模型实例时设置基础配置              |
| `generate_content`| `contents`            | `generation_config`, `safety_settings`,  `tools`, `tool_config`,`stream`, `request_options` | 主要用于生成内容，支持流式输出，原生的函数 | 模型实例生成内容的通用函数，也可自己添加历史消息形成多轮对话 |
| `send_message`    | `content`             | `generation_config`, `safety_settings`, `tools`, `tool_config`,`stream`,  `request_options` | 主要用于生成内容，支持流式输出，封装的对话 | 模型实例多轮对话的场景                    |



这时候可能有小伙伴发现了两次用的并不一样。这是因为safety settings中具体的键值可以使用枚举值、整数或字符串来指定，这些在后端有工程化的转换。

In [None]:
safety_settings = [
    {
        "category": "HARM_CATEGORY_HARASSMENT",
        "threshold": "BLOCK_MEDIUM_AND_ABOVE"},
    {
        "category": "HARM_CATEGORY_HATE_SPEECH",
        "threshold": "BLOCK_MEDIUM_AND_ABOVE",
    },
    {
        "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
        "threshold": "BLOCK_MEDIUM_AND_ABOVE",
    },
    {
        "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
        "threshold": "BLOCK_MEDIUM_AND_ABOVE",
    },
]

啊，这，这是什么！不用担心，这些都是内置的枚举类型，我们可以跳转查看。

In [70]:
from google.generativeai.types import HarmCategory, HarmBlockThreshold

safety_settings = {
    'hate': "low",
    HarmCategory.HARM_CATEGORY_HARASSMENT: HarmBlockThreshold.BLOCK_LOW_AND_ABOVE,
    'DANGEROUS': 'BLOCK_NONE',
    "sexually_explicit": 1
}
model = genai.GenerativeModel(
    model_name="gemini-pro",
    safety_settings=safety_settings,
)
model

genai.GenerativeModel(
    model_name='models/gemini-pro',
    generation_config={},
    safety_settings={<HarmCategory.HARM_CATEGORY_HATE_SPEECH: 8>: <HarmBlockThreshold.BLOCK_LOW_AND_ABOVE: 1>, <HarmCategory.HARM_CATEGORY_HARASSMENT: 7>: <HarmBlockThreshold.BLOCK_LOW_AND_ABOVE: 1>, <HarmCategory.HARM_CATEGORY_DANGEROUS_CONTENT: 10>: <HarmBlockThreshold.BLOCK_NONE: 4>, <HarmCategory.HARM_CATEGORY_SEXUALLY_EXPLICIT: 9>: <HarmBlockThreshold.BLOCK_LOW_AND_ABOVE: 1>},
    tools=None,
    system_instruction=None,
    cached_content=None
)

安全设置的类主要包括:
   - HarmCategory: 危害类别,如骚扰、仇恨言论等
   - HarmBlockThreshold: 阻止阈值
   - SafetyRating: 包含危害类别和概率的评分

In [66]:
print(response)

response:
GenerateContentResponse(
    done=True,
    iterator=None,
    result=protos.GenerateContentResponse({
      "candidates": [
        {
          "content": {
            "parts": [
              {
                "text": "Please provide me with the image or a description of what you're referring to! I need more context to determine if something looks store-bought or homemade. \n\nFor example, you could say:\n\n* \"These cookies look very uniform and have perfect edges. Do these look store-bought or homemade?\"\n* \"This cake has a rustic, uneven frosting. Do these look store-bought or homemade?\"\n\nOnce you give me more information, I can help you assess the appearance and give my opinion!"
              }
            ],
            "role": "model"
          },
          "finish_reason": "STOP",
          "index": 0,
          "safety_ratings": [
            {
              "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
              "probability": "NEGLIGIBLE"
            }

总结

这一大章节我们主要讲了，system_instruction，generation_config，safety_settings三个参数。


| 函数              | 必需参数               | 可选参数                                                                                        | 主要区别                  | 适用场景                       |
|-------------------|-----------------------|---------------------------------------------------------------------------------------------|-----------------------|----------------------------|
| `init`            | `model_name`          | `generation_config`, `safety_settings`, `tools`, `tool_config`, **`system_instruction`**    | 用于初始化对象并设置基本参数        | 创建模型实例时设置基础配置              |
| `generate_content`| `contents`            | `generation_config`, `safety_settings`,  `tools`, `tool_config`,`stream`, `request_options` | 主要用于生成内容，支持流式输出，原生的函数 | 模型实例生成内容的通用函数，也可自己添加历史消息形成多轮对话 |
| `send_message`    | `content`             | `generation_config`, `safety_settings`, `tools`, `tool_config`,`stream`,  `request_options` | 主要用于生成内容，支持流式输出，封装的对话 | 模型实例多轮对话的场景                    |

generation_config参数包括：

1. candidate_count:
   这个参数决定模型会生成多少个候选回答。比如设为3,模型就会给出3个不同的回答供选择。**但是目前，该值只能设置为 1。如果未设置，则默认为 1。**

2. max_output_tokens:
   这限制了模型生成内容的最大长度。一个token大致相当于一个单词或标点符号。设置为100就是限制生成大约100个单词的内容。

3. temperature:
   这控制输出的随机性。例如值的范围是从0到1,越接近1输出越有创意性和多样性,越接近0输出越确定和保守。

4. top_p:
   这也用来控制随机性。它决定模型只考虑累积概率达到这个值的词。比如设为0.9,模型只会从累积概率前90%的词中选择。

5. top_k:
   这限制了模型在每一步只考虑概率最高的前k个词。默认是40,意味着每次只从最可能的40个词中选择。

6. stop_sequences:
   这是一组字符串,用来告诉模型在生成到这些字符串时停止。比如设置为["。","!"],模型生成内容时遇到句号或感叹号就会停止。

7. response_mime_type:
   这指定了输出的格式。可以是普通文本(text/plain)或JSON格式(application/json)。

8. response_schema:
   如果输出是JSON格式,这个参数可以指定JSON的具体结构。


    generation_config = {
        "temperature": 0.7,
        "top_p": 1,
        "top_k": 1,
        "max_output_tokens": 2048,
    }


让我们用工程化的方式初始化一个gemini client ，并模仿早期的system instruction吧

In [19]:
def make_gemini_client():
    generation_config = {
        "temperature": 0.7,
        "top_p": 0.9,
        "top_k": 1,
        "max_output_tokens": 2048,
    }

    safety_settings = [
        {"category": "HARM_CATEGORY_HARASSMENT", "threshold": "BLOCK_MEDIUM_AND_ABOVE"},
        {
            "category": "HARM_CATEGORY_HATE_SPEECH",
            "threshold": "BLOCK_MEDIUM_AND_ABOVE",
        },
        {
            "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
            "threshold": "BLOCK_MEDIUM_AND_ABOVE",
        },
        {
            "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
            "threshold": "BLOCK_MEDIUM_AND_ABOVE",
        },
    ]

    model = genai.GenerativeModel(
        model_name="gemini-pro",
        generation_config=generation_config,
        safety_settings=safety_settings,
    )
    client = model.start_chat()
    return client


def pro_prompt_by_gemini(prompt: str, client) -> str:
    prompt = f"""
你是一个智能助手,专门用于回答问题和解决任务。请按照以下步骤来解决问题:

1. 仔细阅读并理解所给的问题。

2. 使用"思考-行动-观察"的循环方法来逐步解决问题:

   思考: 分析当前情况,规划下一步行动。
   行动: 执行以下三种操作之一:
     a) Search[entity]: 在维基百科搜索指定实体,返回首段内容(如果存在)。若无匹配结果,返回相似实体建议。
     b) Lookup[keyword]: 在上次成功Search的段落中,查找包含关键词的下一句。
     c) Finish[answer]: 给出最终答案并结束任务。
   观察: 记录并分析行动的结果。

3. 重复步骤2,直到得出答案或无法继续。

4. 确保每个回答都严格按照"思考-行动-观察"的格式,并使用规定的行动类型。

5. 如果无法得出确定答案,请说明原因并给出最佳猜测。

示例:
问题: 科罗拉多造山运动东部地区的海拔范围是多少?

思考1: 我需要先了解科罗拉多造山运动的基本信息。
行动1: Search[科罗拉多造山运动]
观察1: 结果。

思考2: 信息不足,需要查找更多关于东部地区的细节。
行动2: Lookup[东部]
观察2: 结果

思考3: 由于缺乏直接信息,我们可能需要搜索更广泛的内容。
行动3: Search[科罗拉多高原]
观察3: 科罗拉多高原是美国西部的一个地理区域,平均海拔约1800米。

思考4: 虽然这不是科罗拉多造山运动东部的具体数据,但可以作为参考。
行动4: Finish[根据可获得的信息,科罗拉多造山运动东部地区的确切海拔范围无法确定。但参考周边地区,如科罗拉多高原的平均海拔约1800米,我们可以推测该地区的海拔可能在1500-2000米左右。然而,这只是一个粗略估计,实际情况可能有所不同。]

现在,请回答以下问题:
{prompt}

"""


    client.send_message(prompt)
    return client.last.text

gemini_client = make_gemini_client()
result=pro_prompt_by_gemini("在大模型中，批处理大小怎么根据具体模型和可用资源进行选择调整", gemini_client)
from IPython import display
display.Markdown(result)

思考1: 我需要了解批处理大小的概念以及如何影响模型训练。
行动1: Search[批处理大小]
观察1: 批处理大小是指训练神经网络时一次输入模型的数据样本数量。

思考2: 我需要知道如何根据模型和资源调整批处理大小。
行动2: Lookup[具体模型]
观察2: 未找到相关信息。

思考3: 我需要查找更广泛的指南来了解如何调整批处理大小。
行动3: Search[调整批处理大小]
观察3: 找到了以下指南:
- 对于较小的模型和有限的资源,较小的批处理大小(例如 16 或 32)可能更好。
- 对于较大的模型和充足的资源,较大的批处理大小(例如 128 或 256)可以提高训练效率。
- 最佳批处理大小也取决于模型的架构和数据集的特性。

思考4: 现在有了指南,我可以根据我的具体情况做出决定。
行动4: Finish[批处理大小的最佳选择取决于具体模型和可用资源。对于较小的模型和有限的资源,较小的批处理大小(例如 16 或 32)可能更好。对于较大的模型和充足的资源,较大的批处理大小(例如 128 或 256)可以提高训练效率。此外,最佳批处理大小也取决于模型的架构和数据集的特性。]