# RAG 实现

## 加载文档

### 从文件读取，并实现拆分

In [1]:
import os
os.getcwd()

'/Users/xuehongwei/github/illufly/notes/core'

In [4]:
from illufly.importer import MarkdownFileImporter

t = MarkdownFileImporter(dir="./", chunk_size=550)
t(verbose=True)
t.documents

[Document(text='# illufly 设计理念介绍...', metadata='{"source": "./docs/设计理念.md"}'),
 Document(text='一般的开发框架们为了开发者使用，会提供自己的类定义，例如用下面的代码来替代：...', metadata='{"source": "./docs/设计理念.md"}'),
 Document(text='现在，要求你准确记住这些类的名字以及该从哪里引用，就开始慢慢形成挑战了。...', metadata='{"source": "./docs/设计理念.md"}'),
 Document(text=''role': 'user',...', metadata='{"source": "./docs/设计理念.md"}'),
 Document(text='# 常见的智能体推理模式和 illufly 的实现...', metadata='{"source": "./docs/推理模式.md"}'),
 Document(text='REWOO的全称是Reason without Observation，旨在通过以下方式改进ReACT风格的Agent架构：...', metadata='{"source": "./docs/推理模式.md"}'),
 Document(text='- 重规划器Replanner：根据执行情况和反馈调整计划。...', metadata='{"source": "./docs/推理模式.md"}'),
 Document(text='Self-Discover由Google研究人员提出，允许大型语言模型在没有明确标签情况下，自主选择并组合原子推理模块，生成推理结构。包含两个阶段：...', metadata='{"source": "./docs/推理模式.md"}'),
 Document(text='- **自我迭代的改进**：自动收集智能体的反思能力和规划能力的评测依据和微调依据，确保智能体可以不断优化和提升。...', metadata='{"source": "./docs/推理模式.md"}')]

In [3]:
print(t.documents[1].text)

一般的开发框架们为了开发者使用，会提供自己的类定义，例如用下面的代码来替代：

```python
[
    SystemMessage('你是一个AI助手'),
    UserMessage('你好'),
    AIMessage('有什么可以帮你')
]
```

然后要求开发者尽量使用已经创建的 XXMessage 类来封装所有关于消息格式的功能。
到目前为止，这看起来很不错，也完全符合一般的设计原则。

但问题会逐渐显现。

首先是类定义的体系，仅仅上面几个类是不够的。例如：

- 你一定需要基类，比如：`BaseMessage`
- 也许你需要区分出工具消息，比如： `ToolMessage`？但这样也许不太够，因为要区分大模型返回的和工具执行的，也许是这样：`ToolCallMessage` 和 `ToolRespMessage`
- 如果你要区分携带部分信息的消息，可能还要增加 `UserMessageChunk`、`AIMessageChunk`，以及`ToolCallMessageChunk` 和 `ToolRespMessageChunk`
- 多模态的能力中图片的消息该如何定义？是否要增加 `ImageMessage`、`AudioMessage`、`VideoMessage`的定义？以及对应的 `ImageMessageChunk`、`AudioMessageChunk`、`VideoMessageChunk`？

有了这些类，你要先记住才能开始做其他的，例如：
```python
from xxxxxx.xxxxxx.messages import UserMessage, AIMessage, ImageMessage, VideoMessage ...
```

现在，要求你准确记住这些类的名字以及该从哪里引用，就开始慢慢形成挑战了。

...

类似的事情会在很多地方发生。

你的初衷是，通过这些新类的定义来简化工作，但是现在不得不记住很多新东西。

### illufly 中的解决方案

```python
[
    {
        'role': 'system',
        'content': '你是一个AI助手'
    },
    {


## 向量数据库

### 预先从 Embeddings 构建文档

In [1]:
from illufly.embeddings import TextEmbeddings
from illufly.importer import MarkdownFileImporter
from illufly.retriever import FaissDB

# 导入文档
local = MarkdownFileImporter(dir="./", chunk_size=550)
local(verbose=True)

# 文档嵌入
emb = TextEmbeddings()
emb(local.documents, verbose=True)

# 文档入库
faiss = FaissDB(emb, train=False)

# 查询
faiss("智能体有哪些类型？", verbose=True)

  0s [INFO] [34m[0.706] ./docs/推理模式.md: - **自我迭代的改进**：自动收集智能体的反思能力和规划能力的评测依据和微调依据，确保智能体可以不断优化和提升。...[0m
  0s [INFO] [34m[0.867] ./docs/推理模式.md: # 常见的智能体推理模式和 illufly 的实现...[0m
  0s [INFO] [34m[0.934] ./docs/设计理念.md: 'role': 'user',...[0m
  0s [INFO] [34m[0.951] ./docs/推理模式.md: Self-Discover由Google研究人员提出，允许大型语言模型在没有明确标签情况下，自主选择并组合原子推理模块，生成推理结构。包含两个阶段：...[0m
  0s [INFO] [34m[0.987] ./docs/设计理念.md: # illufly 设计理念介绍...[0m


[(0.70617646,
  Document(text='- **自我迭代的改进**：自动收集智能体的反思能力和规划能力的评测依据和微调依据，确保智能体可以不断优化和提升。...', metadata='{"source": "./docs/推理模式.md", "embeddings": [-0.06955220550298691, -0.040011003613471985, -0.03216838...')),
 (0.86662793,
  Document(text='# 常见的智能体推理模式和 illufly 的实现...', metadata='{"source": "./docs/推理模式.md", "embeddings": [-0.03823075070977211, 0.025731494650244713, 0.0117180533...')),
 (0.9336294,
  Document(text=''role': 'user',...', metadata='{"source": "./docs/设计理念.md", "embeddings": [-0.061874520033597946, 0.01978103630244732, -0.015418602...')),
 (0.9512944,
  Document(text='Self-Discover由Google研究人员提出，允许大型语言模型在没有明确标签情况下，自主选择并组合原子推理模块，生成推理结构。包含两个阶段：...', metadata='{"source": "./docs/推理模式.md", "embeddings": [-0.04360850527882576, -0.003100050613284111, -0.01595692...')),
 (0.98729813,
  Document(text='# illufly 设计理念介绍...', metadata='{"source": "./docs/设计理念.md", "embeddings": [-0.09724362939596176, 0.012529165484011173, -0.007420137...'))]

### Importer + Embeddings + VectorDB 

In [2]:
from illufly.embeddings import TextEmbeddings
from illufly.vectordb import FaissDB

# 文档嵌入
db = FaissDB(TextEmbeddings())
db.add(["普鸿是一家做数字消防业务的公司"])
db.add(["幻蝶是一家AI技术公司"])

# 查询
db("普鸿是啥？", top_k=5, verbose=True)

  0s [INFO] [34m[0.487] unknown: 普鸿是一家做数字消防业务的公司[0m
  0s [INFO] [34m[1.348] unknown: 幻蝶是一家AI技术公司[0m


[(0.48679453,
  Document(text='普鸿是一家做数字消防业务的公司', metadata='{"source": "unknown", "embeddings": [-0.09413302689790726, 0.01354235503822565, -0.03795371949672699...')),
 (1.3482788,
  Document(text='幻蝶是一家AI技术公司', metadata='{"source": "unknown", "embeddings": [-0.08771800994873047, 0.011481866240501404, 0.00165668292902410...'))]

In [3]:
from illufly.embeddings import TextEmbeddings
from illufly.vectordb import FaissDB

# 文档嵌入
db = FaissDB(TextEmbeddings())
db.add_files("./", chunk_size=550)
# 查询
db("智能体是啥？", top_k=5, verbose=True)

  0s [INFO] [34m[0.680] ./docs/推理模式.md: - **自我迭代的改进**：自动收集智能体的反思能力和规划能力的评测依据和微调依据，确保智能体可以不断优化和提升。...[0m
  0s [INFO] [34m[0.953] ./docs/推理模式.md: # 常见的智能体推理模式和 illufly 的实现...[0m
  0s [INFO] [34m[0.960] ./docs/设计理念.md: 'role': 'user',...[0m
  0s [INFO] [34m[1.031] ./docs/推理模式.md: Self-Discover由Google研究人员提出，允许大型语言模型在没有明确标签情况下，自主选择并组合原子推理模块，生成推理结构。包含两个阶段：...[0m
  0s [INFO] [34m[1.038] ./docs/设计理念.md: # illufly 设计理念介绍...[0m


[(0.67994213,
  Document(text='- **自我迭代的改进**：自动收集智能体的反思能力和规划能力的评测依据和微调依据，确保智能体可以不断优化和提升。...', metadata='{"source": "./docs/推理模式.md", "embeddings": [-0.06955220550298691, -0.040011003613471985, -0.03216838...')),
 (0.95295113,
  Document(text='# 常见的智能体推理模式和 illufly 的实现...', metadata='{"source": "./docs/推理模式.md", "embeddings": [-0.03823075070977211, 0.025731494650244713, 0.0117180533...')),
 (0.9598516,
  Document(text=''role': 'user',...', metadata='{"source": "./docs/设计理念.md", "embeddings": [-0.061874520033597946, 0.01978103630244732, -0.015418602...')),
 (1.0309153,
  Document(text='Self-Discover由Google研究人员提出，允许大型语言模型在没有明确标签情况下，自主选择并组合原子推理模块，生成推理结构。包含两个阶段：...', metadata='{"source": "./docs/推理模式.md", "embeddings": [-0.04360850527882576, -0.003100050613284111, -0.01595692...')),
 (1.0380639,
  Document(text='# illufly 设计理念介绍...', metadata='{"source": "./docs/设计理念.md", "embeddings": [-0.09724362939596176, 0.012529165484011173, -0.007420137...'))]

## 结合 ChatAgent 构建 RAG

In [1]:
# 创建一个工具
from illufly.types import ToolAgent, Template, TextBlock
from illufly.embeddings import TextEmbeddings
from illufly.vectordb import FaissDB
from illufly.chat import ChatQwen

# 文档嵌入
faiss_db = FaissDB(TextEmbeddings(), top_k=1)
faiss_db.add_files("./", chunk_size=500)

## 声明大模型
qwen = ChatQwen(
    knowledge=["illufly实现了多智能体结构", faiss_db],
    memory=[("system", "你是一个作家")]
)

qwen("ReAct是什么意思？", verbose=True)
qwen.memory

  0s [INFO] [34m[0.646] ./docs/推理模式.md: # 常见的智能体推理模式和 illufly 的实现...[0m
[32mRe[0m[32mAct[0m[32m是[0m[32m“Reason and Act”的[0m[32m缩写，是一种结合了推理（[0m[32mReasoning）与行动（Acting[0m[32m）的语言模型设计框架。这一概念[0m[32m源自于人工智能领域的研究，特别是在自然[0m[32m语言处理和机器学习中，用于[0m[32m提升AI系统的决策能力和执行效率。[0m[32m具体来说，ReAct框架通过模拟[0m[32m人类解决问题的方式，利用一个循环流程[0m[32m来完成任务，这个流程主要包括三个[0m[32m步骤：

1. **Thought（思考[0m[32m）**: 在这个阶段，模型基于[0m[32m当前的任务目标和已有的信息进行[0m[32m推理，形成一个或多个关于下一步[0m[32m应该采取什么行动的“思想”。[0m[32m这些思想体现了模型对当前情境的理解[0m[32m和对未来行动的规划。

2.[0m[32m **Action（行动）**: 根[0m[32m据上一阶段的思考结果，[0m[32m模型执行一个具体的行动。这可能[0m[32m涉及向环境提问、执行某个命令[0m[32m、或者操作外部系统等，目的是[0m[32m获取新的信息或直接推动任务进展[0m[32m。

3. **Observation（观察[0m[32m）**: 执行行动后，模型[0m[32m会接收并处理来自环境或系统的[0m[32m反馈，这成为新的观察信息。[0m[32m这些观察结果被整合进模型的知识[0m[32m库中，成为下一轮思考的基础[0m[32m。

通过这样的Thought-Action-Observ[0m[32mation循环，ReAct框架使AI[0m[32m代理能够逐步逼近任务目标，同时[0m[32m保持决策过程的透明性和可解释[0m[32m性。这种方法不仅提高了模型处理复杂[0m[32m任务的能力，也便于开发者和用户[0m[32m理解和调试模型的行为。然而，它

[{'role': 'system', 'content': '你是一个作家'},
 {'role': 'user', 'content': 'ReAct是什么意思？'},
 {'role': 'assistant',
  'content': 'ReAct是“Reason and Act”的缩写，是一种结合了推理（Reasoning）与行动（Acting）的语言模型设计框架。这一概念源自于人工智能领域的研究，特别是在自然语言处理和机器学习中，用于提升AI系统的决策能力和执行效率。具体来说，ReAct框架通过模拟人类解决问题的方式，利用一个循环流程来完成任务，这个流程主要包括三个步骤：\n\n1. **Thought（思考）**: 在这个阶段，模型基于当前的任务目标和已有的信息进行推理，形成一个或多个关于下一步应该采取什么行动的“思想”。这些思想体现了模型对当前情境的理解和对未来行动的规划。\n\n2. **Action（行动）**: 根据上一阶段的思考结果，模型执行一个具体的行动。这可能涉及向环境提问、执行某个命令、或者操作外部系统等，目的是获取新的信息或直接推动任务进展。\n\n3. **Observation（观察）**: 执行行动后，模型会接收并处理来自环境或系统的反馈，这成为新的观察信息。这些观察结果被整合进模型的知识库中，成为下一轮思考的基础。\n\n通过这样的Thought-Action-Observation循环，ReAct框架使AI代理能够逐步逼近任务目标，同时保持决策过程的透明性和可解释性。这种方法不仅提高了模型处理复杂任务的能力，也便于开发者和用户理解和调试模型的行为。然而，它也面临着如输出不稳定、成本高昂及响应时间较长等挑战，这些问题在实际应用中需要通过优化算法或系统设计来缓解。'}]

In [5]:
qwen.get_chat_memory()

[{'role': 'system', 'content': '你是一个作家'},
 {'role': 'user', 'content': 'ReAct是什么意思？'},
 {'role': 'assistant',
  'content': 'ReAct是“Reason and Act”的缩写，这是一种设计智能体（agent）的框架或模式，特别是在基于语言的AI系统中。该框架强调在执行任务时结合推理（Reasoning）与行动（Acting）的能力，旨在让AI系统能够像人类一样，通过思考来指导行动，并根据行动结果进一步调整思考和策略。\n\n具体来说，ReAct框架通常涉及以下几个核心步骤：\n\n1. **观察（Observation）**：智能体接收外界环境或任务的初始信息，作为其行动的起点。\n2. **思考（Thought/Reasoning）**：基于当前的观察和以往的知识，智能体进行推理，决定下一步应该采取什么行动。这个过程中可能包括对目标的分析、计划的制定等。\n3. **行动（Action）**：智能体根据思考的结果执行一个或一系列动作，可能是提问、查询数据库、操作物理世界等。\n4. **反馈（Observation Again）**：行动后，智能体接收新的观察结果，这可以是对之前行动的直接反馈，或是环境状态的更新。\n5. **循环迭代**：智能体基于新的观察继续进行思考和行动，形成一个循环，直至达到解决问题的目标。\n\nReAct框架的优势在于它促进了智能体的透明度和可解释性，因为每一个决策和行动都是基于明确的推理步骤，便于人类理解和调试。同时，这种方法也鼓励了智能体在面对不确定性和复杂性时的适应性和学习能力。然而，它也面临着如成本效率、响应时间和模型稳定性的挑战，正如前面提到的关于LLM（大型语言模型）的一些局限性。'}]

In [6]:
qwen.knowledge

{<illufly.community.faiss.faiss_cpu.FaissDB at 0x1223d4760>,
 Document(text='illufly实现了多智能体结构', metadata='{"source": "unknown"}')}

## ReRank

In [3]:
import dashscope
from http import HTTPStatus

def text_rerank(): 
    resp = dashscope.TextReRank.call(
        model=dashscope.TextReRank.Models.gte_rerank,
        query="什么是文本排序模型",
        documents=[
            "文本排序模型广泛用于搜索引擎和推荐系统中，它们根据文本相关性对候选文本进行排序",
            "量子计算是计算科学的一个前沿领域",
            "预训练语言模型的发展给文本排序模型带来了新的进展"
        ],
        top_n=10,
        return_documents=True
    )
    if resp.status_code == HTTPStatus.OK:
        print(resp)
    else:
        print(resp)

text_rerank() 

{"status_code": 200, "request_id": "23b62943-8321-9a17-aa03-21a9ff13d36a", "code": "", "message": "", "output": {"results": [{"index": 0, "relevance_score": 0.7314485774089865, "document": {"text": "文本排序模型广泛用于搜索引擎和推荐系统中，它们根据文本相关性对候选文本进行排序"}}, {"index": 2, "relevance_score": 0.5831720487049298, "document": {"text": "预训练语言模型的发展给文本排序模型带来了新的进展"}}, {"index": 1, "relevance_score": 0.04973238644524712, "document": {"text": "量子计算是计算科学的一个前沿领域"}}]}, "usage": {"total_tokens": 79}}


## 构造问题

In [4]:
import json
qa = json.loads(qwen.last_output)
qa

{'question': '如何在家制作美味的披萨？',
 'more_questions': ['在家做披萨需要哪些材料？',
  '披萨饼皮怎么做才更酥脆？',
  '如何选择合适的披萨酱？',
  '应该在披萨上加什么配料？',
  '如何控制烤箱温度来烤披萨？',
  '有没有简单易学的披萨食谱？',
  '怎样可以让披萨更香？',
  '披萨烤多久才熟？',
  '如何做出边缘金黄的披萨？',
  '做披萨时面团如何发酵？',
  '如何防止披萨底部变湿？',
  '披萨上的奶酪应该什么时候加？',
  '如何判断披萨是否烤好？',
  '披萨出炉后应该如何切片？',
  '如何保存剩余的披萨？',
  '如何让披萨口感更好？',
  '披萨做好后如何保持热度？',
  '如何制作不同口味的披萨？',
  '如何避免披萨太油腻？',
  '如何在家制作健康版披萨？'],
 'qa': [{'Q': '如何在家制作美味的披萨？',
   'A': '首先准备好所需材料，如面粉、酵母、番茄酱等，然后按照食谱制作饼皮并添加喜欢的配料，最后放入预热好的烤箱中烘烤至金黄色即可。'},
  {'Q': '如何在家制作美味的披萨？', 'A': '可以先上网查找一些简单的披萨食谱，根据步骤准备材料和烤制。'},
  {'Q': '如何在家做蛋糕？', 'A': '蛋糕的做法与披萨完全不同，需要准备不同的原料和工具。'},
  {'Q': '如何选择合适的披萨酱？', 'A': '根据个人口味选择，比如番茄酱、白酱或BBQ酱等。'},
  {'Q': '如何选择合适的披萨酱？', 'A': '可以根据配料来搭配，比如海鲜配白酱，肉类配番茄酱。'},
  {'Q': '如何训练一只狗坐下？', 'A': '用奖励的方法，每次它坐下就给点心。'},
  {'Q': '如何让披萨更香？', 'A': '可以在披萨上撒一些罗勒叶或者牛至增加香气。'},
  {'Q': '如何让披萨更香？', 'A': '加入适量的香料如迷迭香或百里香可以提升香味。'},
  {'Q': '如何种植西红柿？', 'A': '挑选健康的种子，播种后定期浇水施肥。'},
  {'Q': '如何控制烤箱温度来烤披萨？', 'A': '通常设置在220度左右，具体根据烤箱类型调整。'},
  {'Q': 

In [2]:
import uuid
uuid.uuid4()

UUID('f80256e5-604a-47bc-98c0-7ba4186a986e')

In [1]:
from illufly.chat import ChatQwen
from illufly.types import Template

qwen = ChatQwen(
    memory=[Template("RAG/QUESTION"), "请开始"],
    template_binding={"count": lambda x: 5}
)
qwen("任意")

[32m```markdown[0m[32m
[0m[32m@[0m[32mmetadata tag='related[0m[32m'
**Question:[0m[32m**
如何在家里制作[0m[32m美味的比萨[0m[32m？

**Answer:[0m[32m**
首先准备面[0m[32m团，然后加入[0m[32m番茄酱，放[0m[32m上你喜欢的配料[0m[32m，最后撒上[0m[32m奶酪，放入[0m[32m预热至2[0m[32m00度的[0m[32m烤箱中烤[0m[32m约15分钟[0m[32m即可。

@metadata[0m[32m tag='related'
[0m[32m**Question:**
[0m[32m有没有简单的方法在家[0m[32m做比萨？

[0m[32m**Answer:**
[0m[32m可以买现成[0m[32m的比萨饼[0m[32m底，加上自己喜欢[0m[32m的食材，放入[0m[32m烤箱烤制[0m[32m即可。

@metadata[0m[32m tag='related'
[0m[32m**Question:**
[0m[32m自己动手做比[0m[32m萨需要注意哪些步骤[0m[32m？

**Answer:[0m[32m**
注意面团[0m[32m发酵时间，酱[0m[32m料的选择，配料[0m[32m的新鲜程度以及[0m[32m烘烤温度和[0m[32m时间。

@metadata[0m[32m tag='related'
[0m[32m**Question:**
[0m[32m在家中怎样才能[0m[32m做出餐厅级别的比[0m[32m萨？

**Answer[0m[32m:**
选用高质量[0m[32m的原材料，掌握[0m[32m正确的烘焙技巧，[0m[32m尝试不同的配料组合[0m[32m。

@metadata tag[0m[32m='related'
**[0m[32mQuestion:**
想[0m[32m在家里给家人做[0m[32m一顿特别的晚餐[0m[32m，有什么推荐？

[0m

"@metadata tag='related'\n**Question:**\n如何在家里制作美味的比萨？\n\n**Answer:**\n首先准备面团，然后加入番茄酱，放上你喜欢的配料，最后撒上奶酪，放入预热至200度的烤箱中烤约15分钟即可。\n\n@metadata tag='related'\n**Question:**\n有没有简单的方法在家做比萨？\n\n**Answer:**\n可以买现成的比萨饼底，加上自己喜欢的食材，放入烤箱烤制即可。\n\n@metadata tag='related'\n**Question:**\n自己动手做比萨需要注意哪些步骤？\n\n**Answer:**\n注意面团发酵时间，酱料的选择，配料的新鲜程度以及烘烤温度和时间。\n\n@metadata tag='related'\n**Question:**\n在家中怎样才能做出餐厅级别的比萨？\n\n**Answer:**\n选用高质量的原材料，掌握正确的烘焙技巧，尝试不同的配料组合。\n\n@metadata tag='related'\n**Question:**\n想在家里给家人做一顿特别的晚餐，有什么推荐？\n\n**Answer:**\n自制比萨是个不错的选择，可以根据家人的口味定制各种风味。\n\n@metadata tag='unrelated'\n**Question:**\n如何训练一只小狗成为导盲犬？\n\n**Answer:**\n从小狗三个月大时开始基础训练，之后进行专业技能训练，通过测试后与视障者配合训练。\n\n@metadata tag='unrelated'\n**Question:**\n怎样才能提高自己的编程能力？\n\n**Answer:**\n多练习，参与开源项目，阅读优秀的代码，不断学习新的技术和框架。\n\n@metadata tag='unrelated'\n**Question:**\n为什么我的盆栽植物总是长不好？\n\n**Answer:**\n可能是浇水过多或过少，光照不足，或者土壤不适合植物生长，需要调整养护方法。\n\n@metadata tag='unrelated'\n**Question:**\n如何挑选一双适合跑步的运动鞋？\n\n**Answer:**\n要选择适合自己脚型的鞋子，注意鞋子的缓震性和透气性