# RAG实战教程：HR制度问答系统

本Notebook将带你逐步理解RAG的核心概念和实现。


## 1. 环境准备


In [None]:
import os
import sys

# 添加项目路径
project_root = os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath('__file__'))))
sys.path.append(project_root)

from dotenv import load_dotenv
load_dotenv()

# 检查API密钥
if not os.getenv("OPENAI_API_KEY"):
    print("⚠️ 请设置OPENAI_API_KEY环境变量")
else:
    print("✅ API密钥已配置")


## 2. 文档加载与分块

### 2.1 为什么需要分块？

- LLM有上下文长度限制
- 长文档直接向量化会丢失细节
- 分块后可以精确检索到相关片段


In [None]:
from document_loader import DocumentLoader

# 创建文档加载器
loader = DocumentLoader(chunk_size=500, chunk_overlap=75)

# 加载文档
data_dir = os.path.join(os.path.dirname(os.path.dirname(__file__)), "data")
file_path = os.path.join(data_dir, "hr_policy.txt")

chunks = loader.load_and_split(file_path)

print(f"\n总共生成 {len(chunks)} 个文本块")
print(f"\n第一个文本块预览：")
print(chunks[0].page_content[:300])


## 3. 向量化与存储

### 3.1 理解Embedding向量化

Embedding将文本转换为高维向量，使语义相似的文本在向量空间中距离更近。


In [None]:
from vector_store import VectorStoreManager

# 创建向量存储管理器
vector_manager = VectorStoreManager(embedding_model="text-embedding-3-small")

# 创建向量存储
vector_store = vector_manager.create_vector_store(chunks)

print("\n✅ 向量存储创建完成！")


## 4. RAG链实现

### 4.1 完整的RAG流程


In [None]:
from rag_chain import RAGChain

# 创建RAG链
rag = RAGChain(vector_manager, model_name="gpt-3.5-turbo")

# 测试问题
question = "年假如何申请？需要提前几天？"

print(f"问题: {question}")
print("\n执行RAG流程...")

result = rag.invoke(question, k=3)

print(f"\n回答:")
print(result['answer'])
print(f"\n参考文档数量: {len(result['retrieved_docs'])}")


## 5. 总结

通过这个项目，你学会了：

1. ✅ **文档处理**：加载、分块、预处理
2. ✅ **向量化**：Embedding模型的使用
3. ✅ **向量存储**：FAISS的使用
4. ✅ **检索**：相似度搜索
5. ✅ **生成**：Prompt工程和LLM调用
6. ✅ **RAG流程**：端到端的实现
