加载环境变量

In [1]:
from dotenv import load_dotenv
import os
load_dotenv()
# 配置 DeepSeek API 密钥
DEEPSEEK_API_KEY = os.getenv("DEEPSEEK_API_KEY")
if not DEEPSEEK_API_KEY:
    raise ValueError("请设置 DEEPSEEK_API_KEY 环境变量")

1. 初始化模型 

In [2]:
# 加载本地嵌入模型（使用 HuggingFace 的嵌入模型）
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
embed_model = HuggingFaceEmbedding(model_name="BAAI/bge-small-zh-v1.5")

# 创建 DeepSeek LLM
from llama_index.llms.deepseek import DeepSeek
llm = DeepSeek(
    api_key=DEEPSEEK_API_KEY,
    model="deepseek-chat",
    temperature=0.1
)

  from .autonotebook import tqdm as notebook_tqdm


2. 加载和读取文档

In [3]:
from llama_index.core import SimpleDirectoryReader
documents = SimpleDirectoryReader(input_files=["Data/RAG.txt"]).load_data()

3. 构建向量存储索引

In [4]:
from llama_index.core import VectorStoreIndex
index = VectorStoreIndex.from_documents(
    documents,
    embed_model=embed_model
)

4. 创建查询引擎

In [5]:
query_engine = index.as_query_engine(
    llm=llm,
    similarity_top_k=3
)

5. 生成答案

In [6]:
question = "什么是RAG？";
print(f"问题: {question}")
print("-"*50)
response = query_engine.query(question)
print(f"回答: {response}")

问题: 什么是RAG？
--------------------------------------------------
回答: RAG（检索增强生成）是一种先进的AI框架，它通过整合信息检索和文本生成技术来提高生成内容的准确性和可靠性。这种方法能够动态地从外部知识库中检索相关信息，为文本生成提供事实依据，从而有效解决传统大语言模型可能产生的虚构信息或知识过时等问题。RAG的工作流程包括从查询输入开始，检索相关数据，将其转化为向量形式并进行排序，最终选取最相关的信息用于生成回答。
