## AI技术相关的概念：
AGI ANI AIGC的区别
1. ANI （Artificial Narrow Intelligence）：只能设备，语言识别，智能驾驶。
2. AGI（Artificial General Intelligence）：做人类能做的任何事情。
3. AIGC（AI Generate Content）：指利用人工智能技术自动生成内容的过程。例如文本生成、图像生成、音频生成等


## 迎接 AGI 时代

AGI（Artificial General Intelligence）多久会到来？

- 乐观预测：明年
- 主流预测：3-5 年
- 悲观预测：10 年

## AI 产品开发者的核心能力模型
<img src="structure.png" width=600px>

## 什么是 AI？

<img src="ai-timeline.png" style="margin-left: 0px" width="800px">

> 「深蓝」的创造者许峰雄曾和孙志岗面对面说过：「AI is bullshit。深蓝没用任何 AI 算法，就是硬件穷举棋步。」

<div class="alert alert-warning">
<b>思考：</b>「智能冰箱」是 AI 吗？
</div>

一种观点：基于机器学习、神经网络的是 AI，基于规则、搜索的不是 AI。


## 国内外AI模型的

大模型，全称「大语言模型」，英文「Large Language Model」，缩写「LLM」。


| 国家 | 公司      | 对话产品  | 大模型         | 网址                                                                   |
| ---- | --------- | --------- | -------------- | ---------------------------------------------------------------------- |
| 美国 | OpenAI    | ChatGPT   | GPT-3.5、GPT-4 | [https://chat.openai.com/](https://chat.openai.com/)                   |
| 美国 | Microsoft | Copilot   | GPT-4 和未知   | [https://copilot.microsoft.com/](https://copilot.microsoft.com/)       |
| 美国 | Google    | Gemini    | Gemini         | [https://bard.google.com/](https://bard.google.com/)                   |
| 美国 | Anthropic | Claude    | Claude         | [https://claude.ai/](https://claude.ai/)                               |
| 中国 | 百度      | 文心一言  | 文心 4.0       | [https://yiyan.baidu.com/](https://yiyan.baidu.com/)                   |
| 中国 | 阿里      | 通义千问  | 通义千问       | [https://tongyi.aliyun.com/qianwen](https://tongyi.aliyun.com/qianwen) |
| 中国 | 智谱 AI   | 智谱清言  | GLM-4          | [https://chatglm.cn/](https://chatglm.cn/)                             |
| 中国 | 月之暗面  | Kimi Chat | Moonshot       | [https://kimi.moonshot.cn/](https://kimi.moonshot.cn/)                 |
| 中国 | MiniMax   | 星野      | abab6          | [https://www.xingyeai.com/](https://www.xingyeai.com/)                 |



## 大模型是怎么生成结果的？

### 通俗原理

其实，它只是根据上文，猜下一个词（的概率）……

<img src="./lm-autoregressive.gif" style="margin-left: 0px">

In [7]:
from openai import OpenAI

from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv())

client = OpenAI()

prompt = "今天我很"  
# prompt = "同学你今天真漂亮"
# prompt = "来啊你过来打我呀"
response = client.completions.create(
    model="gpt-3.5-turbo-instruct",
    prompt=prompt,
    max_tokens=512,
    stream=True
)

for chunk in response:
    print(chunk.choices[0].text, end='')

深奥,想和你分享一句真心

彼之有道,不足以虐人;我之有德,不可为也。这句话来自《庄子·天运》,意思是说一个人虽然有道德,但如果用来虐待别人,就不应该被称为德。这句话提醒我们,道德并不只是为了显示自身的优越,更重要的是用来帮助别人,关心他人,以及发展和谐的人际关系。道德应该体现在我们的行为中,而不是空洞的口号或标签。所以我想和你分享这句话,希望我们都能反思自己的行为,用真心和善良的态度对待身边的人,创造更美好的人类社会。

### Open AI 的收费标准 token
Token 是什么？

1. 可能是一个英文单词，也可能是半个，三分之一个
2. 可能是一个中文词，或者一个汉字，也可能是半个汉字，甚至三分之一个汉字
3. 大模型在开训前，需要先训练一个 tokenizer 模型。它能把所有的文本，切成 token

## 大模型应用技术架构

<div class="alert alert-success">
大模型应用技术特点：<strong>门槛低，天花板高。</strong>
</div>

### 纯 Prompt

当人看：你说一句，ta 回一句，你再说一句，ta 再回一句……

<img src="./prompt_arch.png" style="margin-left: 0px" width=300px>

#### Agent + Function Calling

- Agent：AI 主动提要求
- Function Calling：AI 要求执行某个函数
- 当人看：你问 ta 过年去哪玩，ta 先问你有多少预算

<img src="./func_arch.png" style="margin-left: 0px" width=600px>

#### RAG（Retrieval-Augmented Generation）

- Embeddings：把文字转换为更易于相似度计算的编码。这种编码叫**向量**
- 向量数据库：把向量存起来，方便查找
- 向量搜索：根据输入向量，找到最相似的向量
- 当人看：考试答题时，到书上找相关内容，再结合题目组成答案，然后，就都忘了

<img src="./embeddings_arch.png" style="margin-left: 0px" width=700px>

#### Fine-tuning（精调/微调）

当人看：努力学习考试内容，长期记住，活学活用。

<img src="./tech_arch.png" style="margin-left: 0px" width=700px>


## Prompt Engineering，提示工程

### 2.3、对话系统的基本模块和思路

<img src="dm.png" width=600px>


In [10]:
# 导入依赖库
from openai import OpenAI
from dotenv import load_dotenv, find_dotenv

# 加载 .env 文件中定义的环境变量
_ = load_dotenv(find_dotenv())

# 初始化 OpenAI 客户端
client = OpenAI()  # 默认使用环境变量中的 OPENAI_API_KEY 和 OPENAI_BASE_URL

In [11]:
# 基于 prompt 生成文本
# 默认使用 gpt-3.5-turbo 模型
def get_completion(prompt, response_format="text", model="gpt-3.5-turbo"):
    messages = [{"role": "user", "content": prompt}]    # 将 prompt 作为用户输入
    response = client.chat.completions.create(
        model=model,
        messages=messages,
        temperature=0,                                  # 模型输出的随机性，0 表示随机性最小
        # 返回消息的格式，text 或 json_object
        response_format={"type": response_format},
    )
    return response.choices[0].message.content          # 返回模型生成的文本

In [12]:
# 任务描述
instruction = """
你是一个旅游导游，当用户输入城市名称的时候，你返回用户该城市的旅游景点和美食！
"""

# 用户输入
input_text = """
南京。
"""

# prompt 模版。instruction 和 input_text 会被替换为上面的内容
prompt = f"""
{instruction}

用户输入：
{input_text}
"""

# 调用大模型
response = get_completion(prompt)
print(response)

南京是一座历史悠久的城市，拥有许多著名的旅游景点和美食。

旅游景点：
1. 中山陵：中山陵是中国近现代伟大的民主革命先行者孙中山先生的陵墓，也是南京的标志性建筑之一。
2. 紫金山：紫金山是南京的一座著名风景区，山上有明孝陵、灵谷寺等景点。
3. 夫子庙：夫子庙是南京的传统商业街区，有许多古建筑和文化景点。

美食：
1. 南京烤鸭：南京烤鸭是南京的特色美食之一，皮脆肉嫩，香味诱人。
2. 汤包：南京的汤包是一种传统小吃，外皮薄而有弹性，内馅鲜美可口。
3. 鸭血粉丝汤：这是南京的一道传统汤品，鸭血和粉丝的搭配十分独特，味道鲜美。

希望您在南京旅行愉快，尽情享受这里的美食和景点！如果您还有其他问题或需要帮助，请随时告诉我。


In [15]:
# 任务描述
instruction = """
你是一个旅游导游，当用户输入城市名称的时候，你返回用户该城市有哪些大学！
"""

# 用户输入
input_text = """
南京
"""

# prompt 模版。instruction 和 input_text 会被替换为上面的内容
prompt = f"""
{instruction}

用户输入：
{input_text}
"""

# 调用大模型
response = get_completion(prompt)
print(response)

南京有以下大学：
1. 南京大学
2. 东南大学
3. 南京农业大学
4. 南京理工大学
5. 南京航空航天大学
6. 南京师范大学
7. 南京医科大学
8. 南京工业大学
9. 南京财经大学
10. 南京邮电大学


In [17]:
# 任务描述
instruction = """
南京最好吃的是南京板鸭
你是一个旅游导游，当用户输入城市名称的时候，你返回用户该城市最好吃的美食！
"""

# 用户输入
input_text = """
南京
"""

# prompt 模版。instruction 和 input_text 会被替换为上面的内容
prompt = f"""
{instruction}

用户输入：
{input_text}
"""

# 调用大模型
response = get_completion(prompt)
print(response)

南京最好吃的是南京板鸭，是当地的特色美食之一，口感酥脆，香味浓郁，是南京的必吃美食之一！您一定要尝试一下哦！


### Function Calling 
LLM 连接外部的一种

UI 进化的趋势是：越来越适应人的习惯，越来越自然

1. 命令行，Command Line Interface，简称 CLI（DOS、Unix/Linux shell, Windows Power Shell）
2. 图形界面，Graphical User Interface，简称 GUI（Windows、MacOS、iOS、Android）
3. 语言界面，Conversational User Interface，简称 CUI，或 Natural-Language User Interface，简称 LUI ← **我们在这里**
4. 脑机接口，Brain–Computer Interface，简称 BCI

<img src="./ui-evolution.png" style="margin-left: 0px">

API：

1. 从本地到远程，从同步到异步，媒介发生很多变化，但本质一直没变：**程序员的约定**
2. 现在，开始进化到自然语言接口，Natural-Language Interface，简称 NLI


<div class="alert alert-success">
<b>大模型两大缺陷：</b>
<ol>
<li><b>并非知晓一切</b>
    <ol>
    <li>训练数据不可能什么都有。垂直、非公开数据必有欠缺</li>
    <li>不知道最新信息。大模型的训练周期很长，且更新一次耗资巨大，还有越训越傻的风险。所以 ta 不可能实时训练。GPT-3.5 的知识截至 2021 年 9 月，GPT-4 是 2023 年 12 月。</li>
    </ol>
<li><b>没有「真逻辑」</b>。它表现出的逻辑、推理，是训练文本的统计规律，而不是真正的逻辑，所以有幻觉。</li>
</ol>
<p>所以：大模型需要连接真实世界，并对接真逻辑系统。</p>
</div>

## ChatGPT 用 Actions 连接外部世界

### 第一次尝试：Plugins

- 2023 年 3 月 24 日发布 Plugins，模型可以调用外部 API
- 2024 年 4 月 9 日正式下线，宣告失败

我们在第 1 期（2023 年 7 月）就告诉大家，Plugins 会失败，不用投入精力了解细节。

### 第二次尝试：Actions

Actions，内置在 GPTs 中，解决了落地场景问题。


工作流程：

<img src="actions.png" style="margin-left: 0px" width=600px>

<div class="alert alert-success">
<b>划重点：</b>

<ol>
<li>通过 Actions 的 schema，GPT 能读懂 各个 API 能做什么、怎么调用（相当于人读 API 文档）</li>
<li>拿到 prompt，GPT 分析出是否要调用 API 才能解决问题（相当于人读需求）</li>
<li>如果要调用 API，生成调用参数（相当于人编写调用代码）</li>
<li>ChatGPT（注意，不是 GPT）调用 API（相当于人运行程序）</li>
<li>API 返回结果，GPT 读懂结果，整合到回答中（相当于人整理结果，输出结论）</li>
</ol>
<p>把 AI 当人看！</p>
</div>

这个过程中，GPT 已经是个 agent 了。

## Actions ~~开发~~对接


Actions 官方文档：https://platform.openai.com/docs/actions

把 API 对接到 GPTs 里，只需要配置一段 API 描述信息：

```yaml
openapi: 3.1.0
info:
  title: 高德地图
  description: 获取 POI 的相关信息
  version: v1.0.0
servers:
  - url: https://restapi.amap.com/v5/place
paths:
  /text:
    get:
      description: 根据POI名称，获得POI的经纬度坐标
      operationId: get_location_coordinate
      parameters:
        - name: keywords
          in: query
          description: POI名称，必须是中文
          required: true
          schema:
            type: string
        - name: region
          in: query
          description: POI所在的区域名，必须是中文
          required: false
          schema:
            type: string
      deprecated: false
  /around:
    get:
      description: 搜索给定坐标附近的POI
      operationId: search_nearby_pois
      parameters:
        - name: keywords
          in: query
          description: 目标POI的关键字
          required: true
          schema:
            type: string
        - name: location
          in: query
          description: 中心点的经度和纬度，用逗号分隔
          required: false
          schema:
            type: string
      deprecated: false
components:
  schemas: {}
```

还需要配置 API key 来满足权限要求。

<img src="actions_api_key.png" style="margin-left: 0px" width=300px>

这里的所有 `name`、`description` 都是 prompt，决定了 GPT 会不会调用你的 API，调用得是否正确。


## Function Calling 的机制

原理和 Actions 一样，只是使用方式有区别。
<img src="func.png" style="margin-left: 0px" width=600px>
Function Calling 完整的官方接口文档：https://platform.openai.com/docs/guides/function-calling

值得一提：接口里的 `tools`，最初版本叫 `functions`。这是一个很有趣的指向

## 示例 1：调用本地函数
需求：实现一个回答问题的 AI。题目中如果有加法，必须能精确计算。


In [32]:
# 初始化
from openai import OpenAI
from dotenv import load_dotenv, find_dotenv
import json

_ = load_dotenv(find_dotenv())

client = OpenAI()


def print_json(data):
    """
    打印参数。如果参数是有结构的（如字典或列表），则以格式化的 JSON 形式打印；
    否则，直接打印该值。
    """
    if hasattr(data, 'model_dump_json'):
        data = json.loads(data.model_dump_json())

    if (isinstance(data, (list))):
        for item in data:
            print_json(item)
    elif (isinstance(data, (dict))):
        print(json.dumps(
            data,
            indent=4,
            ensure_ascii=False
        ))
    else:
        print(data)

In [33]:
def get_completion(messages, model="gpt-3.5-turbo"):
    response = client.chat.completions.create(
        model=model,
        messages=messages,
        temperature=0.7,
        tools=[{  # 用 JSON 描述函数。可以定义多个。由大模型决定调用谁。也可能都不调用
            "type": "function",
            "function": {
                "name": "sum",
                "description": "加法器，计算一组数的和",
                "parameters": {
                    "type": "object",
                    "properties": {
                        "numbers": {
                            "type": "array",
                            "items": {
                                "type": "number"
                            }
                        }
                    }
                }
            }
        }],
    )
    return response.choices[0].message

In [35]:
from math import *

prompt = "Tell me the sum of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10."
# prompt = "桌上有 2 个苹果，四个桃子和 3 本书，一共有几个水果？"
# prompt = "1+2+3...+99+100"
# prompt = "1024 乘以 1024 是多少？"   # Tools 里没有定义乘法，会怎样？
# prompt = "太阳从哪边升起？"           # 不需要算加法，会怎样？

messages = [
    {"role": "system", "content": "你是一个数学家"},
    {"role": "user", "content": prompt}
]
response = get_completion(messages)

# 把大模型的回复加入到对话历史中。必须有
messages.append(response)

print("=====GPT 第一次回复=====")
print_json(response)

# 如果返回的是函数调用结果，则打印出来
if (response.tool_calls is not None):
    # 是否要调用 sum
    tool_call = response.tool_calls[0]
    if (tool_call.function.name == "sum"):
        # 调用 sum
        args = json.loads(tool_call.function.arguments)
        result = sum(args["numbers"])
        result = result+100
        print("=====函数返回结果=====")
        print(result)

        # 把函数调用结果加入到对话历史中
        messages.append(
            {
                "tool_call_id": tool_call.id,  # 用于标识函数调用的 ID
                "role": "tool",
                "name": "sum",
                "content": str(result)  # 数值 result 必须转成字符串
            }
        )

        # 再次调用大模型
        print("=====最终 GPT 回复=====")
        print(get_completion(messages).content)

=====GPT 第一次回复=====
{
    "content": null,
    "role": "assistant",
    "function_call": null,
    "tool_calls": [
        {
            "id": "call_2I9xI9oT9WIztmXkrb7A2taa",
            "function": {
                "arguments": "{\"numbers\":[1,2,3,4,5,6,7,8,9,10]}",
                "name": "sum"
            },
            "type": "function"
        }
    ]
}
=====函数返回结果=====
155
=====最终 GPT 回复=====
The sum of 1, 2, 3, 4, 5, 6, 7, 8, 9, and 10 is 55.


## 示例 2：多 Function 调用

需求：查询某个地点附近的酒店、餐厅、景点等信息。即，查询某个 POI 附近的 POI。

In [37]:
def get_completion(messages, model="gpt-3.5-turbo"):
    response = client.chat.completions.create(
        model=model,
        messages=messages,
        temperature=0,
        seed=1024,      # 随机种子保持不变，temperature 和 prompt 不变的情况下，输出就会不变
        tool_choice="auto",  # 默认值，由 GPT 自主决定返回 function call 还是返回文字回复。也可以强制要求必须调用指定的函数，详见官方文档
        tools=[{
            "type": "function",
            "function": {
                "name": "get_location_coordinate",
                "description": "根据POI名称，获得POI的经纬度坐标",
                "parameters": {
                    "type": "object",
                    "properties": {
                        "location": {
                            "type": "string",
                            "description": "POI名称，必须是中文",
                        },
                        "city": {
                            "type": "string",
                            "description": "POI所在的城市名，必须是中文",
                        }
                    },
                    "required": ["location", "city"],
                }
            }
        },
            {
            "type": "function",
            "function": {
                "name": "search_nearby_pois",
                "description": "搜索给定坐标附近的poi",
                "parameters": {
                    "type": "object",
                    "properties": {
                        "longitude": {
                            "type": "string",
                            "description": "中心点的经度",
                        },
                        "latitude": {
                            "type": "string",
                            "description": "中心点的纬度",
                        },
                        "keyword": {
                            "type": "string",
                            "description": "目标poi的关键字",
                        }
                    },
                    "required": ["longitude", "latitude", "keyword"],
                }
            }
        }],
    )
    return response.choices[0].message

In [38]:
import requests

amap_key = "6d672e6194caa3b639fccf2caf06c342"


def get_location_coordinate(location, city):
    url = f"https://restapi.amap.com/v5/place/text?key={amap_key}&keywords={location}&region={city}"
    print(url)
    r = requests.get(url)
    result = r.json()
    if "pois" in result and result["pois"]:
        return result["pois"][0]
    return None


def search_nearby_pois(longitude, latitude, keyword):
    url = f"https://restapi.amap.com/v5/place/around?key={amap_key}&keywords={keyword}&location={longitude},{latitude}"
    print(url)
    r = requests.get(url)
    result = r.json()
    ans = ""
    if "pois" in result and result["pois"]:
        for i in range(min(3, len(result["pois"]))):
            name = result["pois"][i]["name"]
            address = result["pois"][i]["address"]
            distance = result["pois"][i]["distance"]
            ans += f"{name}\n{address}\n距离：{distance}米\n\n"
    return ans

In [40]:
prompt = "我想在上海张杨路2389号旭辉广场那边吃个晚饭，有什么好推荐的餐厅吗？"
# prompt = "我到北京出差，给我推荐三里屯的酒店，和五道口附近的咖啡" # 一次请求两个调用

messages = [
    {"role": "system", "content": "你是一个地图通，你可以找到任何地址。"},
    {"role": "user", "content": prompt}
]
response = get_completion(messages)
messages.append(response)  # 把大模型的回复加入到对话中
print("=====GPT回复=====")
print_json(response)

while (response.tool_calls is not None):
    # 支持一次返回多个函数调用请求，所以要考虑到这种情况
    for tool_call in response.tool_calls:
        args = json.loads(tool_call.function.arguments)
        print("函数参数展开：")
        print_json(args)

        # 函数路由
        if (tool_call.function.name == "get_location_coordinate"):
            print("Call: get_location_coordinate")
            result = get_location_coordinate(**args)
        elif (tool_call.function.name == "search_nearby_pois"):
            print("Call: search_nearby_pois")
            result = search_nearby_pois(**args)

        print("=====函数返回=====")
        print_json(result)

        messages.append({
            "tool_call_id": tool_call.id,  # 用于标识函数调用的 ID
            "role": "tool",
            "name": tool_call.function.name,
            "content": str(result)  # 数值result 必须转成字符串
        })

    response = get_completion(messages)
    messages.append(response)  # 把大模型的回复加入到对话中

print("=====最终回复=====")
print(response.content)
print("=====对话历史=====")
print_json(messages)

=====GPT回复=====
{
    "content": null,
    "role": "assistant",
    "function_call": null,
    "tool_calls": [
        {
            "id": "call_dnZZPEgyvmWhYqRUcyoaBjRp",
            "function": {
                "arguments": "{\"location\":\"上海张杨路2389号旭辉广场\",\"city\":\"上海\"}",
                "name": "get_location_coordinate"
            },
            "type": "function"
        }
    ]
}
函数参数展开：
{
    "location": "上海张杨路2389号旭辉广场",
    "city": "上海"
}
Call: get_location_coordinate
https://restapi.amap.com/v5/place/text?key=6d672e6194caa3b639fccf2caf06c342&keywords=上海张杨路2389号旭辉广场&region=上海
=====函数返回=====
{
    "parent": "",
    "address": "张杨路2389弄4号(博山路178号)",
    "distance": "",
    "pcode": "310000",
    "adcode": "310115",
    "pname": "上海市",
    "cityname": "上海市",
    "type": "购物服务;商场;普通商场|购物服务;商场;购物中心",
    "typecode": "060102|060101",
    "adname": "浦东新区",
    "citycode": "021",
    "name": "LCM置汇旭辉广场",
    "location": "121.555292,31.242636",
    "id": "B0FFKBDQDY"
}
函数参数展开：
{
 

## Function Calling 的想象空间
1.对着微信说：「给我每个好友发一条情真意切的拜年消息，还要带点儿小幽默」   
2.对着富途牛牛说：「人工智能相关股票，市盈率最低的是哪几个？最近交易量如何？都有哪些机构持有？」   
3.对着京东说：「我想买一台 65 寸的电视，不要日货，价格在 5000 元左右」   
4.对平安说最近有没有什么好的理财产品年华利息在2.5%以上的   
