加载环境变量

In [7]:
from dotenv import load_dotenv
import os
load_dotenv()
# 配置 DeepSeek API 密钥
DEEPSEEK_API_KEY = os.getenv("DEEPSEEK_API_KEY")
if not DEEPSEEK_API_KEY:
    raise ValueError("请设置 DEEPSEEK_API_KEY 环境变量")

1. 初始化模型 

In [8]:
# 加载本地嵌入模型（使用 HuggingFace 的嵌入模型）
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
embed_model = HuggingFaceEmbedding(model_name="BAAI/bge-small-zh-v1.5")

# 创建 DeepSeek LLM
from llama_index.llms.deepseek import DeepSeek
llm = DeepSeek(
    api_key=DEEPSEEK_API_KEY,
    model="deepseek-chat",
    temperature=0.1
)

2. 加载和读取文档

In [9]:
from llama_index.core import SimpleDirectoryReader
documents = SimpleDirectoryReader(input_files=["Data/RAG.txt"]).load_data()

3. 构建向量存储索引

In [10]:
from llama_index.core import VectorStoreIndex
index = VectorStoreIndex.from_documents(
    documents,
    embed_model=embed_model
)

4. 创建查询引擎

In [11]:
query_engine = index.as_query_engine(
    llm=llm,
    similarity_top_k=3
)

5. 生成答案

In [12]:
question = "什么是RAG？";
print(f"问题: {question}")
print("-"*50)
response = query_engine.query(question)
print(f"回答: {response}")

问题: 什么是RAG？
--------------------------------------------------
回答: RAG（检索增强生成）是一种融合信息检索与文本生成技术的AI框架，主要用于提升生成内容的准确性和事实性。它通过实时检索外部知识库获取相关信息，为文本生成提供事实依据，从而解决传统大语言模型中可能出现的虚构信息或知识陈旧等问题。该技术从用户查询出发，利用检索模型从各类数据源获取相关内容，经向量化处理后存储于向量数据库，最终通过相关性排序筛选出最匹配的信息辅助生成过程。
