In [None]:
"""
RAG的基本流程和方法
1、使用langchain的document_load来加载文本
2、使用text_split来分割文本
3、加载为document类型数据
4、embedding成向量
5、使用chorma和fassio来存储向量（非持久性，存在内存中）
6、可以将向量存在splite中做永久性储存
7、检索策略
"""
%run model.ipynb
%run utils.ipynb
%run retriever_methods.ipynb
%run deal_data.ipynb

In [None]:
'''stored embedding'''
import os
import torch
from tqdm.notebook import tqdm
from time import sleep
from langchain_core.documents.base import Document

# 文件列表
file_list = acq_filenames("group_txt_file")

# 读取并分割内容
docs_list = []
for file in tqdm(file_list):
    
    if file.split("/")[1] == "payloads.jsonl":
        docs = payload_deal(file)
        for item in docs:
            docs_list.append(item)
    elif file.endswith(".jsonl"):
        docs = jsonl2doc(file)
        # 将分割的文本进行处理
        for item in docs:
            docs_list.append(item)
    elif file.endswith(".json"):
        docs = json2doc(file)
        for item in docs:
            docs_list.append(item)
    elif file.endswith(".pdf"):
        docs = pdf2doc(file)
        for item in docs:
            docs_list.append(item)
    elif file.endswith(".txt"):
        docs = txt2doc(file) 
        for item in docs:
            docs_list.append(item)

In [None]:
formatted_documents = SentenceWindow().metadata_format(docs_list, split_count=2)

In [None]:
# 将处理好的文本储存进数据库
vector_store = permanent_stored(docs_list)

In [None]:
'''查询'''
import time
from langchain.prompts import PromptTemplate
import sentence_transformers
from langchain.vectorstores.chroma import Chroma
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_core.runnables import RunnablePassthrough,RunnableLambda
s = time.time()
# 获取Retriever
def retriever_res(query):
    embedding_model = ""
    embeddings = HuggingFaceEmbeddings(model_name=embedding_model, model_kwargs={'device': "cuda:1"})
    embeddings.client = sentence_transformers.SentenceTransformer(embeddings.model_name, device="cuda:1")
    vector_store = Chroma(persist_directory='chroma_db_demo', embedding_function=embeddings)
    
    rag_retriver = vector_store.as_retriever(search_type="mmr", search_kwargs={'k': 2})
    top_documents = SentenceWindow().search_and_format(rag_retriver, query)
    return top_documents

prompt_template = PromptTemplate.from_template("""
        你是一名对答如流的专家，请根据如下的内容回答问题
        {context}
        请如实地回答用户所提出的问题:{question}，如果遇到你不知道的（包含在上述内容中也没有提到的），请回复“我不知道”。
        """)

# 使用句子窗口进行召回
rag_chain = {"context": RunnableLambda(retriever_res), "question": RunnablePassthrough()} | prompt_template | local_model()

# 提问&回答
response = rag_chain.invoke("admin@338是什么")
 
print(response)
e = time.time()
print(e-s)