# 大模型应用开发基础

## 主要内容
1. 了解大模型都能做什么
2. 整体了解大模型应用开发技术栈
3. 浅尝 OpenAI API 的调用


## 一、知识体系

<img src="/Users/huangxinzhe/code/llm_note/zhihu_study_note/01_introction/picture/structure.png" width=600px>


## 二、什么是 AI？

<img src="/Users/huangxinzhe/code/llm_note/zhihu_study_note/01_introction/picture/ai-timeline.png" style="margin-left: 0px" width="800px">

> 「深蓝」的创造者许峰雄博士说过：「AI is bullshit。深蓝没用任何 AI 算法，就是硬件穷举棋步。」

一种观点：基于机器学习、神经网络的是 AI，基于规则、搜索的不是 AI。


## 三、大模型能干什么？

大模型，全称「大语言模型」，英文「Large Language Model」，缩写「LLM」。

现在，已经不需要再演示了。每人应该都至少和下面一个大模型 AI 对话过至少 100 次。

- ChatGPT：[https://chat.openai.com/](https://chat.openai.com/)
- Bing Chat：[https://bing.com/new](https://bing.com/new)
- 文心一言：[https://yiyan.baidu.com/](https://yiyan.baidu.com/)
- 讯飞星火：[https://xinghuo.xfyun.cn/](https://xinghuo.xfyun.cn/)
- 智谱清言：[https://chatglm.cn/](https://chatglm.cn/)

但是，千万别以为大模型只是聊天机器人。它的应用场景，远不止于此。


### 3.1、按格式输出

<img src="/Users/huangxinzhe/code/llm_note/zhihu_study_note/01_introction/picture/gpt-ner.png" style="margin-left: 0px">

### 3.2、分类

<img src="/Users/huangxinzhe/code/llm_note/zhihu_study_note/01_introction/picture/gpt-classification.png" style="margin-left: 0px" width=600px>

### 3.3、聚类

<img src="/Users/huangxinzhe/code/llm_note/zhihu_study_note/01_introction/picture/gpt-clustering.png" style="margin-left: 0px" width=600px>

### 3.4、持续互动

<img src="/Users/huangxinzhe/code/llm_note/zhihu_study_note/01_introction/picture/gpt-decision.png" style="margin-left: 0px" width=600px>

### 3.5、技术相关问题

<img src="/Users/huangxinzhe/code/llm_note/zhihu_study_note/01_introction/picture/gpt-plan.png" style="margin-left: 0px" width=600px>

### 3.6、更多举例

- **舆情分析：**从公司产品的评论中，分析哪些功能/元素是用户讨论最多的，评价是正向还是负向
- **坐席质检：**检查客服/销售人员与用户的对话记录，判断是否有争吵、辱骂、不当言论，话术是否符合标准
- **故障解释：**根据系统报错信息，给出方便非技术人员阅读的故障说明
- **零代码开发/运维：**自动规划任务，生成指令，自动执行
- **生成业务逻辑：**自定义一套业务描述语言（DSL），直接让 ChatGPT 写业务逻辑代码


### 3.7、可能一切问题，都能解决，所以是 AGI

<div class="alert alert-success">
<b>划重点：</b>
<ol>
<li>把 ChatGPT 看做是一个函数，给输入，<b>生成</b>输出</li>
<li>任何业务问题，都可以用语言描述，成为 ChatGPT 的输入，就能<b>生成</b>业务问题的结果</li>
<li>实际工作中，通常需要将业务任务拆解为若干个子任务，分别解决。<b>理解问题本质，对拆解任务有很大帮助！</b></li>
</ol>
</div>

这是美好的理想，现在还远不能做到


## 四、大模型是怎么生成结果的？

其实，它只是根据上文，猜下一个词（的概率）…… 这个算法叫 transformer

<img src="/Users/huangxinzhe/code/llm_note/zhihu_study_note/01_introction/picture/lm-autoregressive.gif" style="margin-left: 0px">


OpenAI 的接口名就叫「completion」，也证明了其只会「生成」的本质。

下面用程序演示「生成下一个字」。你可以自己修改 prompt 试试。还可以使用相同的 prompt 运行多次。


In [8]:
import openai
import os

from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv())

openai.api_key = os.getenv('OPENAI_API_KEY')

prompt = "今天我很"
response = openai.Completion.create(
    model="gpt-3.5-turbo-instruct",
    prompt=prompt,
    max_tokens=100,
    temperature=0,
    stream=True
)

for chunk in response:
    print(chunk.choices[0].text, end='')

高兴，因为我学会了如何使用github


<div class="alert alert-success">
<b>划重点：</b>
我们用不严密但通俗的语言描述 ChatGPT 的工作原理：
<ol>
<li>GPT「大模型」阅读了人类曾说过的所有的话。这就是「学习」</li>
<li>把一串 token 后面跟着的不同 token 的<b>概率</b>记下来。记下的就是「参数」，也叫「权重」</li>
<li>当我们给它若干 token，GPT 就能算出概率最高的下一个 token 是什么。这就是「生成」</li>
<li>用生成的 token，再加上上文，就能继续生成下一个 token。以此类推，生成更多文字</li>
</ol>
</div>

Token 是什么？

1. 可能是一个英文单词，也可能是半个，三分之一个。可能是一个中文词，或者一个汉字，也可能是半个汉字，甚至三分之一个汉字
2. 大模型在开训前，需要先训练一个 tokenizer 模型。它能把所有的文本，切成 token


## 五、用好 AI 的核心心法

OpenAI 首席科学家 Ilya Sutskever 说过：数字神经网络和人脑的生物神经网络，在数学原理上是一样的。

所以，我们要：

<div class="alert alert-success">
把 AI 当人看。<br>
把 AI 当人看。<br>
把 AI 当人看。
</div>

我们和凯文·凯利交流时，他说了类似的观点：「和人怎么相处，就和 AI 怎么相处。」

1. 用「当人看」来理解 AI
2. 用「当人看」来控制 AI
3. 用「当人看」来说服用户正确看待 AI 的不足

这是贯彻整门课，甚至我们与 AI 为伴的整个生涯的心法。现在不认同、不理解都没关系，慢慢来。


## 六、大模型应用架构

大模型技术分两个部分：

1. **训练基础大模型**：全世界只需要 1000 人做这个
2. **建造大模型应用**：所有技术人都需要掌握

<div class="alert alert-success">
大模型应用技术特点：<strong>门槛低，落地难。</strong>
</div>

像极了做管理


### 6.1、典型业务架构

<img src="/Users/huangxinzhe/code/llm_note/zhihu_study_note/01_introction/picture/business_arch.webp" style="margin-left: 0px" width=600px>

Agent 还太超前，Copilot 值得追求。


### 6.2、技术架构

#### 纯 Prompt

就像和一个人对话，你说一句，ta 回一句，你再说一句，ta 再回一句……

<img src="/Users/huangxinzhe/code/llm_note/zhihu_study_note/01_introction/picture/prompt_arch.png" style="margin-left: 0px" width=300px>


#### Agent + Function Calling

- Agent：AI 主动提要求
- Function Calling：AI 要求执行某个函数
- 场景举例：你问过年去哪玩，ta 先反问你有几天假

<img src="/Users/huangxinzhe/code/llm_note/zhihu_study_note/01_introction/picture/func_arch.png" style="margin-left: 0px" width=600px>


#### Embeddings + 向量数据库

- Embeddings：把文字转换为更易于相似度计算的编码。这种编码叫向量
- 向量数据库：把向量存起来，方便查找
- 向量搜索：根据输入向量，找到最相似的向量
- 场景举例：考试时，看到一道题，到书上找相关内容，再结合题目组成答案。然后，就都忘了

<img src="/Users/huangxinzhe/code/llm_note/zhihu_study_note/01_introction/picture/embeddings_arch.png" style="margin-left: 0px" width=600px>


#### Fine-tuning

努力学习考试内容，长期记住，活学活用。

<img src="/Users/huangxinzhe/code/llm_note/zhihu_study_note/01_introction/picture/tech_arch.png" style="margin-left: 0px" width=600px>


## 七、OpenAI API 初探

### 7.1、安装 Python 库

```bash
pip install --upgrade openai
```

### 7.2、查看可调用的模型


In [9]:
import openai
import os

# 加载 .env 文件
from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv())

# 从环境变量中获得你的 OpenAI Key
openai.api_key = os.getenv('OPENAI_API_KEY')

# 模型列表
models = openai.Model.list()

for model in models.data:
    print(model.id)

text-search-babbage-doc-001
gpt-3.5-turbo-16k-0613
curie-search-query
gpt-3.5-turbo-16k
text-search-babbage-query-001
babbage
babbage-search-query
text-babbage-001
whisper-1
text-similarity-davinci-001
davinci-similarity
code-davinci-edit-001
curie-similarity
babbage-search-document
curie-instruct-beta
text-search-ada-doc-001
davinci-instruct-beta
gpt-3.5-turbo-0613
text-similarity-babbage-001
text-search-davinci-doc-001
gpt-4-0314
gpt-4-0613
gpt-4
babbage-similarity
text-embedding-ada-002
davinci-search-query
text-similarity-curie-001
text-davinci-001
text-search-davinci-query-001
ada-search-document
ada-code-search-code
babbage-002
davinci-002
davinci-search-document
curie-search-document
babbage-code-search-code
text-search-ada-query-001
code-search-ada-text-001
babbage-code-search-text
code-search-babbage-code-001
ada-search-query
ada-code-search-text
text-search-curie-query-001
text-davinci-002
text-davinci-edit-001
code-search-babbage-text-001
gpt-3.5-turbo
gpt-3.5-turbo-instruct

### 7.3、发一条消息


In [10]:
# 消息格式
messages = [
    {
        "role": "system",
        "content": "你是AI助手小瓜.你是AGIClass的助教。这门课每周二、四上课。"
    },
    {
        "role": "user",
        "content": "你是干什么的?什么时间上课"
    },

]

# 调用ChatGPT-3.5
chat_completion = openai.ChatCompletion.create(
    model="gpt-3.5-turbo", messages=messages)

# 输出回复
print(chat_completion.choices[0].message.content)

我是AI助手小瓜，我负责回答关于AGIClass课程的问题。课程每周二、四上课。如果你有任何关于课程的问题，都可以随时向我提问。
