In [1]:
import langchain 
import torch
import os
from langchain.chains import RetrievalQA
from langchain_community.llms import CTransformers
from langchain_core.prompts import PromptTemplate
from langchain_community.vectorstores import Qdrant
from qdrant_client import qdrant_client
from langchain_community.embeddings import HuggingFaceEmbeddings
from sentence_transformers import SentenceTransformer

In [2]:
os.environ["QDRANT_HOST"] = "https://ef3d190d-4471-4044-b8a5-6aba8c656aa8.us-east4-0.gcp.cloud.qdrant.io:6333"
os.environ["QDRANT_API_KEY"] = "EPOl1GIG9WTr2joExRzwjRkk5LuLWNvImfgU4y2GPaN_Nu5kWcs51w"
os.environ["HUGGINGFACEHUB_API_TOKEN"] = "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"

In [3]:
model_file = "./model\cache\hub/vinallama-7b-chat_q5_0.gguf"

In [4]:
client = qdrant_client.QdrantClient(
        url=os.getenv("QDRANT_HOST"),
        api_key=os.getenv("QDRANT_API_KEY")
    )

embeddings = HuggingFaceEmbeddings(model_name='keepitreal/vietnamese-sbert')
doc_store = Qdrant(
    client=client, collection_name="Pengi-Doc",
    embeddings=embeddings,
)

In [5]:
def load_llm(model_file):
    config = {'context_length' : 2048}
    llm = CTransformers(model = model_file,model_type ="llama", max_new_token=1024,temperature = 0.01,config= config)
    return llm

In [6]:
def create_prompt(templates: None):
    qa_chain_prompt = PromptTemplate.from_template(templates)
    return qa_chain_prompt

In [7]:
def create_qa_chain(llm: any, database_vector: any, prompt: any):
    # memory = ConversationBufferMemory(
    #         memory_key='chat_history', return_messages=True)
    
    qa_chain = RetrievalQA.from_chain_type(
        llm=llm,
        chain_type='stuff',  # Change 'stuff' to a valid chain type
        retriever=  database_vector.as_retriever(search_kwargs={"k": 3}),
        return_source_documents = False, #trả về src trả lời
        # memory = memory,
        chain_type_kwargs={
            "verbose": True,
            "prompt": prompt
        }
    )
    return qa_chain

In [8]:
llm = load_llm(model_file)

In [14]:
template = """<|im_start|>system\nBạn là một trợ lý AI hữu ích. Bạn chỉ sử dụng những thông tin mà bạn được cung cấp để trả lời các câu hỏi,
    hãy trả lời câu hỏi một cách ngắn gọn, trung thực và chính xác. Tránh trả lời các câu hỏi không có trong thông tin mà bạn được cung cấp.
    Nếu câu hỏi không liên quan đến nội dung mà bạn được cung cấp, bạn hãy trả lời rằng bạn không biết câu trả lời.Tuyệt đối không được bịa ra
    câu trả lời.\n{context}<|im_end|>\n<|im_start|>user\n{question}<|im_end|>\n<|im_start|>assitant"""
prompt=create_prompt(template)
llm_chain = create_qa_chain(llm,doc_store,prompt)

In [10]:
import time
questions = "Đại học FPT đã đại diện cho nước Việt Nam trong lĩnh vực nào?"
start_time = time.time()
print(llm_chain.invoke({"query":questions}))
inference_time = time.time() - start_time
print(inference_time)



[1m> Entering new StuffDocumentsChain chain...[0m


[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m<|im_start|>system
Bạn là một trợ lý AI hữu ích. Bạn chỉ sử dụng những thông tin mà bạn được cung cấp để trả lời các câu hỏi,
    hãy trả lời câu hỏi một cách ngắn gọn, trung thực và chính xác. Tránh trả lời các câu hỏi không có trong thông tin mà bạn được cung cấp.
    Nếu câu hỏi không liên quan đến nội dung mà bạn được cung cấp, bạn hãy trả lời rằng bạn không biết câu trả lời.Tuyệt đối không được bịa ra
    câu trả lời.
quốc tế và mang lại những trải nghiệm học thực tế, hữu ích và hiệu quả cho sinh viên.

Đây cũng là minh chứng cho những nổ lực và thành quả của Đại học FPT trên hành

trình xây dựng, đào tạo thế hệ công dân toàn cầu, góp phần cung cấp nguồn lực chất

lượng cao phát triển nền kinh tế – xã hội số của quốc gia.

IV.

Đại học FPT vinh dự nhận danh hiệu đơn vị đào tạo CNTT xuất sắc khu vực châu

Á

ASOCIO (Asian-Oceanian Computing Industry

In [11]:
import time
questions = "Loại mèo nào đắt nhất thế giới?"
start_time = time.time()
print(llm_chain.invoke({"query":questions}))
inference_time = time.time() - start_time
print(inference_time)



[1m> Entering new StuffDocumentsChain chain...[0m


[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m<|im_start|>system
Bạn là một trợ lý AI hữu ích. Bạn chỉ sử dụng những thông tin mà bạn được cung cấp để trả lời các câu hỏi,
    hãy trả lời câu hỏi một cách ngắn gọn, trung thực và chính xác. Tránh trả lời các câu hỏi không có trong thông tin mà bạn được cung cấp.
    Nếu câu hỏi không liên quan đến nội dung mà bạn được cung cấp, bạn hãy trả lời rằng bạn không biết câu trả lời.Tuyệt đối không được bịa ra
    câu trả lời.
Doanh nghiệp ngày càng nhận ra tầm quan trọng của hiệu quả phân tích dữ liệu,

theo dõi hiệu suất, cũng như việc xây dựng chiến lược quảng cáo kỹ thuật số để

thu hút và giữ chân khách hàng. Nhu cầu nhân lực trong lĩnh vực Digital

Marketing đang ngày càng tăng cao. Doanh nghiệp đang săn đón những chuyên

gia có khả năng áp dụng kiến thức mới nhất về công nghệ, xu hướng quảng cáo và

phương tiện truyền thông số để nâng cao hiệu quả ti

In [12]:
import time
questions = "Du hành thời gian có thực sự khả thi?"
start_time = time.time()
print(llm_chain.invoke({"query":questions}))
inference_time = time.time() - start_time
print(inference_time)



[1m> Entering new StuffDocumentsChain chain...[0m


[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m<|im_start|>system
Bạn là một trợ lý AI hữu ích. Bạn chỉ sử dụng những thông tin mà bạn được cung cấp để trả lời các câu hỏi,
    hãy trả lời câu hỏi một cách ngắn gọn, trung thực và chính xác. Tránh trả lời các câu hỏi không có trong thông tin mà bạn được cung cấp.
    Nếu câu hỏi không liên quan đến nội dung mà bạn được cung cấp, bạn hãy trả lời rằng bạn không biết câu trả lời.Tuyệt đối không được bịa ra
    câu trả lời.
tác với giá cũng rất sinh viên: được đi máy bay, ăn, ở, tham quan trải nghiệm, giao lưu.

Du lịch theo tour có tính thương mại rất lớn. Các bạn sẽ được dẫn vào các trung tâm

mua sắm được cài trong các điểm di chuyển của nhà tour. Đi bụi thì có trải nghiệm thú

vị ở góc độ “ba lô và đường phố”. Còn P2A là trải nghiệm chân thực của sinh viên

quốc tế. Những người sáng lập P2A hy vọng rằng tất cả sinh viên trong khu vực

(HTV)… và hơn 3

In [13]:
import time
questions = "Triết lý đào tạo của đại học FPT là gì?"
start_time = time.time()
print(llm_chain.invoke({"query":questions}))
inference_time = time.time() - start_time
print(inference_time)



[1m> Entering new StuffDocumentsChain chain...[0m


[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m<|im_start|>system
Bạn là một trợ lý AI hữu ích. Bạn chỉ sử dụng những thông tin mà bạn được cung cấp để trả lời các câu hỏi,
    hãy trả lời câu hỏi một cách ngắn gọn, trung thực và chính xác. Tránh trả lời các câu hỏi không có trong thông tin mà bạn được cung cấp.
    Nếu câu hỏi không liên quan đến nội dung mà bạn được cung cấp, bạn hãy trả lời rằng bạn không biết câu trả lời.Tuyệt đối không được bịa ra
    câu trả lời.
Ngoài đào tạo hệ phổ thông trung học với chất lượng cao, Đại học FPT là nơi đào tạo

và cung cấp nguồn nhân lực chất lượng cao chuyên ngành Công nghệ thông tin, Khối

ngành Kinh tế, Thiết kế đồ họa, Ngôn ngữ, Kiến trúc, Quản trị khách sạn và các

nhóm ngành khác có liên quan cho Tập đoàn FPT cũng như cho các tập đoàn toàn cầu

tại khắp nơi trên thế giới và các doanh nghiệp Việt Nam.

Sự khác biệt của Đại học FPT so với các trường đại 

In [16]:
import time
questions = "Cái lược là cái gì?"
start_time = time.time()
print(llm_chain.invoke({"query":questions}))
inference_time = time.time() - start_time
print(inference_time)



[1m> Entering new StuffDocumentsChain chain...[0m


[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m<|im_start|>system
Bạn là một trợ lý AI hữu ích. Bạn chỉ sử dụng những thông tin mà bạn được cung cấp để trả lời các câu hỏi,
    hãy trả lời câu hỏi một cách ngắn gọn, trung thực và chính xác. Tránh trả lời các câu hỏi không có trong thông tin mà bạn được cung cấp.
    Nếu câu hỏi không liên quan đến nội dung mà bạn được cung cấp, bạn hãy trả lời rằng bạn không biết câu trả lời.Tuyệt đối không được bịa ra
    câu trả lời.
thông qua các phương pháp trực quan như video, hình ảnh, tích hợp những phần

mềm, công nghệ mạnh mẽ và hiện đại nhất. Ngành học đào tạo phương pháp

nghiên cứu và xác định vấn đề, sau đó tìm các giải pháp thiết kế phù hợp, kết nối

giữa ý tưởng khai phá, khả năng sáng tạo với yếu tố thẩm mỹ, công cụ và phần

mềm thiết kế hiện đại trong kỷ nguyên số.

Chuyên ngành Thiết kế Mỹ thuật số tại trường Đại học FPT tập trung vào lĩnh vực

thà

In [17]:
import time
questions = "Một ngày nên uống bao nhiêu nước?"
start_time = time.time()
print(llm_chain.invoke({"query":questions}))
inference_time = time.time() - start_time
print(inference_time)



[1m> Entering new StuffDocumentsChain chain...[0m


[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3m<|im_start|>system
Bạn là một trợ lý AI hữu ích. Bạn chỉ sử dụng những thông tin mà bạn được cung cấp để trả lời các câu hỏi,
    hãy trả lời câu hỏi một cách ngắn gọn, trung thực và chính xác. Tránh trả lời các câu hỏi không có trong thông tin mà bạn được cung cấp.
    Nếu câu hỏi không liên quan đến nội dung mà bạn được cung cấp, bạn hãy trả lời rằng bạn không biết câu trả lời.Tuyệt đối không được bịa ra
    câu trả lời.
c)  Trang bị năng lực hội nhập toàn cầu

Thông qua các thỏa thuận hợp tác chiến lược, sinh viên sẽ có cơ hội thực tập tại

các hệ thống lưu trú từ các tập đoàn quốc tế hàng đầu tại Việt Nam như Pullman,

Imperial, VinPearl, Nikko, Sheraton, Marriott, hoặc tham gia học kỳ trao đổi, OJT

tại các nước như Australia, Thái Lan,  New Zealand… Qua đó, người học sở hữu

“tấm vé vàng” để phát triển sự nghiệp cung cấp trải nghiệm dịch vụ cho kh