In [1]:
import langchain 
import torch
import os
from langchain.chains import RetrievalQA
from langchain_community.llms import CTransformers
from langchain_core.prompts import PromptTemplate
from langchain_community.vectorstores import Qdrant
from qdrant_client import qdrant_client
from langchain_community.embeddings import HuggingFaceEmbeddings
from sentence_transformers import SentenceTransformer

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
os.environ["QDRANT_HOST"] = "https://ef3d190d-4471-4044-b8a5-6aba8c656aa8.us-east4-0.gcp.cloud.qdrant.io:6333"
os.environ["QDRANT_API_KEY"] = "EPOl1GIG9WTr2joExRzwjRkk5LuLWNvImfgU4y2GPaN_Nu5kWcs51w"
os.environ["HUGGINGFACEHUB_API_TOKEN"] = "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"

In [3]:
model_file = "./models/vinallama-7b-chat_q5_0.gguf"

In [4]:
client = qdrant_client.QdrantClient(
        url=os.getenv("QDRANT_HOST"),
        api_key=os.getenv("QDRANT_API_KEY")
    )

embeddings = HuggingFaceEmbeddings(model_name='keepitreal/vietnamese-sbert')
doc_store = Qdrant(
    client=client, collection_name="Pengi-Doc",
    embeddings=embeddings,
)

In [5]:
def load_llm(model_file):
    config = {'context_length' : 2048}
    llm = CTransformers(model = model_file,model_type ="llama", max_new_token=1024,temperature = 0.01,config= config)
    return llm

In [6]:
def create_prompt(templates: None):
    qa_chain_prompt = PromptTemplate.from_template(templates)
    return qa_chain_prompt

In [7]:
def create_qa_chain(llm: any, database_vector: any, prompt: any):
    # memory = ConversationBufferMemory(
    #         memory_key='chat_history', return_messages=True)
    
    qa_chain = RetrievalQA.from_chain_type(
        llm=llm,
        chain_type='stuff',  # Change 'stuff' to a valid chain type
        retriever=  database_vector.as_retriever(search_kwargs={"k": 3}),
        return_source_documents = False, #trả về src trả lời
        # memory = memory,
        chain_type_kwargs={
            "verbose": True,
            "prompt": prompt
        }
    )
    return qa_chain

In [8]:
llm = load_llm(model_file)

In [9]:
template = """<|im_start|>system\nBạn là một trợ lý AI hữu ích. Bạn chỉ sử dụng những thông tin mà bạn được cung cấp để trả lời các câu hỏi,
    hãy trả lời câu hỏi một cách ngắn gọn, trung thực và chính xác. Tránh trả lời các câu hỏi không có trong thông tin mà bạn được cung cấp.
    Nếu câu hỏi không liên quan đến nội dung mà bạn được cung cấp, bạn hãy trả lời rằng bạn không biết câu trả lời.Tuyệt đối không được bịa ra
    câu trả lời.\n{context}<|im_end|>\n<|im_start|>user\n{question}<|im_end|>\n<|im_start|>assitant"""
prompt=create_prompt(template)
llm_chain = create_qa_chain(llm,doc_store,prompt)

In [10]:
questions = "Khánh Dương là ai?"
print(llm_chain.invoke({"query":questions}))



[1m> Entering new StuffDocumentsChain chain...[0m


[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m<|im_start|>system
Bạn là một trợ lý AI hữu ích. Bạn chỉ sử dụng những thông tin mà bạn được cung cấp để trả lời các câu hỏi,
    hãy trả lời câu hỏi một cách ngắn gọn, trung thực và chính xác. Tránh trả lời các câu hỏi không có trong thông tin mà bạn được cung cấp.
    Nếu câu hỏi không liên quan đến nội dung mà bạn được cung cấp, bạn hãy trả lời rằng bạn không biết câu trả lời.Tuyệt đối không được bịa ra
    câu trả lời.
quốc tế AACSB (The Association to Advance Collegiate Schools of Business), và

ACBSP (Accreditation Council for Business Schools and Programs). Tập trung

vào kiến thức chuyên môn về kinh doanh hiện đại ở phạm vi quốc tế, các vấn đề

tổng quan và chuyên sâu về thương mại quốc tế, các chính sách kinh tế đối ngoại,

đặc điểm phát triển kinh tế thế giới trong xu hướng toàn cầu hóa, đặc biệt là

những vấn đề về hội nhập kinh tế, chiến lượ