In [1]:
from langchain_community.llms import CTransformers
from langchain.chains import RetrievalQA
from langchain.prompts import PromptTemplate
from langchain_community.embeddings import GPT4AllEmbeddings
from langchain_community.vectorstores import FAISS
from pprint import pprint

model_file = "models/vinallama-7b-chat_q5_0.gguf"
vector_db_path = "vectorstores/db_faiss"

def load_llm(model_file):
    llm = CTransformers(
        model=model_file,
        model_type="llama",
        max_new_tokens=1024,
        temperature=0.01
    )
    return llm

def creat_prompt(template):
    prompt = PromptTemplate(template = template, input_variables=["context", "question"])
    return prompt


def create_qa_chain(prompt, llm, db):
    llm_chain = RetrievalQA.from_chain_type(
        llm = llm,
        chain_type= "stuff",
        retriever = db.as_retriever(search_kwargs = {"k":3}, max_tokens_limit=1024),
        return_source_documents = False,
        chain_type_kwargs= {'prompt': prompt}

    )
    return llm_chain

def read_vectors_db():
    embedding_model = GPT4AllEmbeddings(model_file="models/all-MiniLM-L6-v2-f16.gguf")
    db = FAISS.load_local(vector_db_path, embedding_model, allow_dangerous_deserialization=True)
    return db


db = read_vectors_db()
llm = load_llm(model_file)

template = """<|im_start|>system\nSử dụng thông tin sau đây để trả lời câu hỏi. Nếu bạn không biết câu trả lời, hãy nói không biết, đừng cố tạo ra câu trả lời\n
    {context}<|im_end|>\n<|im_start|>user\n{question}<|im_end|>\n<|im_start|>assistant"""
prompt = creat_prompt(template)

llm_chain  =create_qa_chain(prompt, llm, db)


  from .autonotebook import tqdm as notebook_tqdm


In [10]:
question = "Yêu cầu kỹ năng để ứng tuyển là gì"
skills = llm_chain.invoke({"query": question})
pprint(skills)

Number of tokens (513) exceeded maximum context length (512).
Number of tokens (514) exceeded maximum context length (512).
Number of tokens (515) exceeded maximum context length (512).
Number of tokens (516) exceeded maximum context length (512).
Number of tokens (517) exceeded maximum context length (512).
Number of tokens (518) exceeded maximum context length (512).
Number of tokens (519) exceeded maximum context length (512).
Number of tokens (520) exceeded maximum context length (512).
Number of tokens (521) exceeded maximum context length (512).
Number of tokens (522) exceeded maximum context length (512).
Number of tokens (523) exceeded maximum context length (512).
Number of tokens (524) exceeded maximum context length (512).
Number of tokens (525) exceeded maximum context length (512).
Number of tokens (526) exceeded maximum context length (512).
Number of tokens (527) exceeded maximum context length (512).
Number of tokens (528) exceeded maximum context length (512).
Number o

{'query': 'Yêu cầu kỹ năng để ứng tuyển là gì',
 'result': '\n'
           'Yêu cầu kỹ năng để ứng tuyển bao gồm các điều sau đây :\n'
           '- Trình độ chuyên môn: Bằng đại học.\n'
           '- Kinh nghiệm trong lĩnh vực Process Software, ML mô hình và Quản '
           'lý dự án.\n'
           '- Kỹ năng giao tiếp bằng lời nói và chữ viết.\n'
           '- Kiến thức về tài nguyên phần cứng và tài nguyên GPU.\n'
           '- Kiến thức về phần mềm và công nghệ tự động hóa thay thế lao động '
           'lực lượng lớn bằng người.\n'
           '-con người máy móc hoặc tương lai với con người.\n'
           '-đốivới những nhiệm vụ án mạng lưới cho con người bằng con người '
           'bằng con người làm việc làm công việc sử dụng cụ thể chất lỏng lẻo '
           'người.\n'
           '-con người bằng con người.\n'
           '-người lao động cơ giới của con người.\n'
           '-labor động vật lý do con người bằng con người bằng con người.\n'
           '-con người.\n'
        

In [11]:
print(skills["result"])


Yêu cầu kỹ năng để ứng tuyển bao gồm các điều sau đây :
- Trình độ chuyên môn: Bằng đại học.
- Kinh nghiệm trong lĩnh vực Process Software, ML mô hình và Quản lý dự án.
- Kỹ năng giao tiếp bằng lời nói và chữ viết.
- Kiến thức về tài nguyên phần cứng và tài nguyên GPU.
- Kiến thức về phần mềm và công nghệ tự động hóa thay thế lao động lực lượng lớn bằng người.
-con người máy móc hoặc tương lai với con người.
-đốivới những nhiệm vụ án mạng lưới cho con người bằng con người bằng con người làm việc làm công việc sử dụng cụ thể chất lỏng lẻo người.
-con người bằng con người.
-người lao động cơ giới của con người.
-labor động vật lý do con người bằng con người bằng con người.
-con người.
-người.
-người.
-người lao động lực lượng tử thần kinh nghiệm nhân viên chức năng suất xám.
-con người.
-người lao động vật liệu pháp lý thuy lao động cơ giới trong lĩnh vực nhân công việc làm việc sử dụng cụ thể chất lỏng lẻo tay cho con người bằng robot.
-con người làm bằng


In [3]:
question = "yêu cầu về kinh nghiệm của công ty là gì"
experience = llm_chain.invoke({"query": question})
pprint(experience)

Number of tokens (513) exceeded maximum context length (512).
Number of tokens (514) exceeded maximum context length (512).
Number of tokens (515) exceeded maximum context length (512).
Number of tokens (516) exceeded maximum context length (512).
Number of tokens (517) exceeded maximum context length (512).
Number of tokens (518) exceeded maximum context length (512).
Number of tokens (519) exceeded maximum context length (512).
Number of tokens (520) exceeded maximum context length (512).
Number of tokens (521) exceeded maximum context length (512).
Number of tokens (522) exceeded maximum context length (512).
Number of tokens (523) exceeded maximum context length (512).
Number of tokens (524) exceeded maximum context length (512).
Number of tokens (525) exceeded maximum context length (512).
Number of tokens (526) exceeded maximum context length (512).
Number of tokens (527) exceeded maximum context length (512).
Number of tokens (528) exceeded maximum context length (512).
Number o

{'query': 'yêu cầu về kinh nghiệm của công ty là gì',
 'result': '\n'
           'Công ty yêu cầu các nhân viên đáp ứng những điều kiện sau đây :\n'
           '- Tốt nghiệp đại học về Công nghệ thông tin, Trí tuệ, Trí tuệ, Trí '
           'tuệ, Trí tuệ nhân, Trí tuệ nhân, Trí tuệ, Trí tuệ, Trí tuệ nhân, '
           'Trí tuệ, Trí tuệ, Trí tuệ nhân, Trí tuệ nhân, Trí tuệ nhân, Trí '
           'tuệ nhân, Trí tuệ, Trí tuệ, Trí tuệ nhân, Trí tuệ nhân, Trí tuệ, '
           'Trí tuệ, Trí tuệ, Trí tuệ (Thông tin, Tin, Trí tuệ, Trí tuệ, Trí '
           'tuệ, Trí tuệ nhân, Trí tuệ nhân, Truyền, Trí tuệ nhân, Trí tuệ '
           'nhân, Trí tuệ, Trí tuệ, Trí tuệ, Trí tuệ, Trí tuệ, Trí tuệ, Trí '
           'tuệ, Trí tuệ, Trí tuệ, Trí tuệ nhân, Trí tuệ nhân, Trí tuệ, Trí '
           'tuệ, Trí tuệ, Trí tuệ, Trí tuệ, Trí tuệ, Trí tuệ, Trí tuệ nhân, '
           'Trí tuệ nhân, Trí tuệ, Trí tuệ, Trí tuệ, Trí tuệ, Trí tuệ, Trí '
           'tuệ, Trí tuệ, Trí tuệ, Trí tuệ, Trí tuệ, Trí tuệ, Trí t

In [8]:
print(type(skills["result"]))

<class 'str'>
