# RAG新手上路
## 概述与目的
这个仓库包含了我对检索增强生成（RAG）系统的学习笔记。RAG系统结合了检索和生成技术来有效回答问题。RAG系统从知识库中检索相关文档，并利用这些文档生成答案，类似于人类处理信息的方式。

这个笔记的设计理念是对新手极其友好，为像我这样完全不了解这个主题的人提供对RAG系统及其组件的清晰理解。

## 人类如何回答问题？
1. 从知识库中收集信息
2. 对信息进行推理，找到相关文档
3. 将检索到的文档与原始查询结合
4. 使用组合信息生成最终答案

## RAG与人类的对比
| 步骤 | RAG系统 | 人类 |
|------|---------|------|
| 1    | **[检索]** 从知识库收集文档 | 从各种来源收集信息 |
| 2    | **[检索]** 使用检索器找到相关文档 | 对信息进行推理，找到相关文档 |
| 3    | **[生成]** 将检索到的文档与原始查询结合 | 将信息与原始问题结合 |
| 4    | **[生成]** 使用生成器模型生成答案 | 使用推理和知识生成答案 |

## 传统大语言模型的知识缺陷
传统的大语言模型（LLMs）在大量文本数据上训练，但无法访问实时或外部知识库。它们可以基于训练期间学到的模式生成文本，但可能无法为特定查询提供准确或最新的信息。

### 私有知识库
公司特定的文档或专有数据不包含在传统LLMs的训练数据中。这意味着它们无法有效检索或利用这些信息。

### 实时信息
传统LLMs没有从互联网访问或检索实时信息的能力。LLMs在静态数据集上训练，不会动态更新其知识库。这限制了它们回答需要当前或实时数据问题的能力。

### 难以获取的信息
离线信息或专门数据库中的信息不属于传统LLMs训练数据的一部分。这限制了它们回答需要特定或小众知识问题的能力。

## 快速解决方案
把答案直接放到提示词里！

这基本上就是RAG的做法。它检索相关文档并将它们与原始查询结合，生成更准确的答案。RAG是检索增强生成的缩写，这是一种通过集成检索机制来增强传统LLMs能力的技术。

## RAG的优势
1. **访问实时知识**：RAG系统可以从外部知识库检索和利用实时信息，使其比传统LLMs更准确和最新。
2. **私有知识库**：RAG系统可以访问私有知识库，如公司特定文档或专有数据，使其能够提供更相关和具体的答案。
3. **增强准确性**：通过结合检索和生成技术，RAG系统可以生成更准确和上下文相关的答案，提高响应的整体质量。
4. **减少幻觉**：RAG系统可以通过在检索到的文档中找到答案依据来减少幻觉（错误或虚构信息）的发生，从而产生更可靠的输出。
5. **来源引用**：RAG系统可以提供对检索文档的引用或参考，允许用户验证信息并了解答案的上下文。

## RAG系统组件
1. **检索器**：基于输入查询从知识库检索相关文档的组件。
2. **生成器**：使用检索到的文档和原始查询生成答案的组件。
3. **知识库**：检索器用于查找相关信息的文档或数据集合。
4. **查询**：RAG系统处理以检索和生成答案的输入问题或信息请求。

![RAG系统架构](./resource/basic_flow_deepLearningAI.jpg)
*图：RAG系统架构 - DeepLearning.AI截图*

## RAG应用示例
代码生成是RAG系统的常见应用。例如，当开发人员询问如何实现特定功能时，RAG系统从知识库检索相关代码片段，并生成包含必要代码的答案。此外，LLMs或智能体可以访问用户的代码，因此可以提供更定制和准确的响应。在这种情况下，知识是知识库中的代码片段，查询是开发人员关于实现功能的问题。

客户服务是RAG系统可以从知识库检索相关信息以有效回答客户查询的另一个应用。例如，如果客户询问退货政策，RAG系统检索相关政策文档并基于该信息生成响应。在这种情况下，知识是公司的退货政策文档，查询是客户关于退货政策的问题。

问答系统也是RAG的常见用例。当用户提出问题时，RAG系统从知识库检索相关文档，并生成将检索信息与原始查询结合的答案。

AI辅助网络搜索是RAG系统可以通过从知识库检索相关文档并生成比传统搜索引擎提供更多上下文和信息的答案来增强搜索结果的另一个应用。

## 要点总结
1. RAG通过集成检索机制增强传统LLMs。
2. 它能够访问实时和私有知识库。
3. RAG适用于各种领域，包括代码生成、客户服务、问答系统和AI辅助网络搜索。
4. RAG系统的组件包括检索器、生成器、知识库和查询。

In [None]:
# RAG的简单示例代码

# 步骤1：定义一个简单的知识库
knowledge_base = [
    "Python是一种流行的编程语言。",
    "RAG代表检索增强生成。",
    "大语言模型可以生成文本。"
]

# 步骤2：检索器 - 查找相关文档
def retrieve(query, kb):
    return [doc for doc in kb if query.lower() in doc.lower()]

# 步骤3：生成器 - 结合查询和检索文档生成答案
def generate_answer(query, docs):
    context = " ".join(docs)
    return f"问：{query}\n答：{context}"

# 步骤4：使用示例
query = "什么是RAG？"
retrieved_docs = retrieve("RAG", knowledge_base)
answer = generate_answer(query, retrieved_docs)
print(answer)