In [2]:
import pickle

# Giả sử bạn có file data.pkl
with open("indexed_data.pkl", "rb") as f:
    data = pickle.load(f)


In [3]:
data

[{'header_index': 0,
  'header': 'By Role',
  'text': 'Business Leaders\nData Leaders\nData Analysts\nBusiness Teams',
  'embedding': array([-4.98659238e-02,  3.10595091e-02, -2.92343777e-02,  3.15452106e-02,
         -5.78082092e-02, -3.76238748e-02, -4.04698215e-02, -2.92058047e-02,
         -4.24458180e-03,  3.16419005e-02, -4.37931940e-02, -6.22427044e-03,
          4.23868783e-02,  2.68292855e-02,  2.53762323e-02,  4.73678894e-02,
         -2.97282506e-02, -2.89978199e-02, -6.19135648e-02, -1.30815595e-01,
         -1.30559444e-01, -1.11972399e-01, -7.10488409e-02, -1.58539377e-02,
         -3.43180681e-03,  2.45350730e-02,  3.68789001e-03, -9.93291475e-03,
         -1.09567139e-02, -6.52891472e-02, -9.55274776e-02, -9.92179066e-02,
          9.22232568e-02,  6.24293946e-02, -2.08570100e-02,  2.26053819e-02,
          1.81855373e-02,  6.39930591e-02,  3.06040030e-02,  5.37736788e-02,
         -6.09537549e-02, -2.11176183e-02, -5.13167195e-02, -2.28437316e-02,
         -6.58433065e

In [5]:
from sentence_transformers import SentenceTransformer
import numpy as np
import google.generativeai as genai

In [9]:
#####################################
# 2) TÍNH ĐỘ TƯƠNG ĐỒNG COSINE
#####################################
def cosine_similarity(vec1, vec2):
    """
    vec1, vec2 là numpy array (hoặc torch tensor).
    Nếu là torch tensor, bạn phải chuyển .numpy() hoặc dùng hàm dot tương tự.
    """
    return np.dot(vec1, vec2) / (np.linalg.norm(vec1) * np.linalg.norm(vec2))

#####################################
# 3) TÌM CHUNK PHÙ HỢP NHẤT
#####################################
def search_chunk(question_embedding, indexed_data):
    best_score = -1
    best_chunk = None

    for chunk in indexed_data:
        score = cosine_similarity(question_embedding, chunk["embedding"])
        if score > best_score:
            best_score = score
            best_chunk = chunk

    return best_chunk, best_score

#####################################
# 4) GỌI GEMINI ĐỂ SINH CÂU TRẢ LỜI
#####################################
def generate_answer_gemini(question, relevant_text):
    """
    Hàm này mô phỏng việc gọi LLM nội bộ (Gemini).
    Tuỳ vào cách triển khai thực tế (REST API, SDK nội bộ), 
    bạn sẽ thay thế phần dưới thành lệnh gọi thật.
    """
    prompt = f"""
    You are an AI assistant. Use the context below to answer the question.
    Context:
    {relevant_text}

    Question:
    {question}

    Answer in natural language:
    """
    # Ví dụ pseudo:
    # Tạo phiên hội thoại với model Gemini (thay tên model nếu cần)
    genai.configure(api_key="AIzaSyCrCawEwgg2bVJxBgGNq42uvhVmw4VyUf8")
    chat_session = genai.GenerativeModel(model_name="gemini-2.0-flash-exp").start_chat()

    # Gửi nội dung (text) tới Gemini
    response = chat_session.send_message(prompt)

    # Trả về phần text của phản hồi
    return response.text.strip()


#####################################
# 5) HÀM CHÍNH: CHATBOT TRẢ LỜI CÂU HỎI
#####################################
def answer_question(user_question, embed_model, indexed_data):
    """
    user_question: Chuỗi câu hỏi.
    embed_model  : Mô hình embedding đã load (nếu cần).
    indexed_data : Dữ liệu index sẵn (có sẵn embedding).
    """

    # a) Tạo embedding cho câu hỏi (nếu chưa có sẵn).
    question_embedding = embed_model.encode([user_question])[0] 
    #   - Nếu bạn đã có code embed_text(...) thì thay thế ở đây.

    # b) Tìm chunk khớp nhất
    best_chunk, best_score = search_chunk(question_embedding, indexed_data)
    
    # c) Gửi chunk + question sang Gemini để sinh câu trả lời
    relevant_text = best_chunk["text"] if best_chunk else ""
    answer = generate_answer_gemini(user_question, relevant_text)
    
    return answer, best_score

In [11]:
#####################################
# 6) DEMO
#####################################
if __name__ == "__main__":
    # 1. Giả sử ta load model (đoạn này tuỳ vào framework, code bên dưới chỉ mang tính ví dụ):
    embed_model = SentenceTransformer("all-MiniLM-L6-v2")
    
    # 2. Load indexed_data (đã tạo ở 2.1)
    indexed_data = data  
    
    # 3. Người dùng nhập câu hỏi
    user_question = "When is the latest update?"
    # user_question = "What is policy?"

    # 4. Chatbot trả lời
    final_answer, sim_score = answer_question(user_question, embed_model, indexed_data)
    
    print("Similarity Score:", sim_score)
    print("Answer from Gemini:", final_answer)


Similarity Score: 0.30943826
Answer from Gemini: The latest update was on September 15, 2023.
