In [1]:
# Cài đặt các thư viện cần thiết
!pip install -U langchain-community
!pip install unstructured
!pip install pymongo
!pip install sentence-transformers
!pip install beautifulsoup4
!pip install rank-bm25
!pip install langchain-ollama



In [2]:
import os
import re
import json
import numpy as np
import requests
from bs4 import BeautifulSoup
from pymongo import MongoClient
from rank_bm25 import BM25Okapi
import torch
import torch.nn.functional as F
from transformers import AutoTokenizer, AutoModel
from langchain_ollama import ChatOllama
from langchain.document_loaders import UnstructuredURLLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter

  from .autonotebook import tqdm as notebook_tqdm


In [10]:
def advanced_clean_text(raw_html: str) -> str:
    """
    Làm sạch HTML, sau đó loại bỏ các ký tự Unicode control, zero-width, BOM,
    và các ký tự lạ không nằm trong bảng chữ cái tiếng Việt mở rộng.
    """
    # 1) Dùng BeautifulSoup để loại bỏ thẻ HTML, lấy text thuần
    text = BeautifulSoup(raw_html, "html.parser").get_text(separator=" ", strip=True)
    
    # 2) Loại bỏ các ký tự control (ASCII 0-31, 127-159)
    text = re.sub(r'[\u0000-\u001F\u007F-\u009F]', ' ', text)
    
    # 3) Loại bỏ các ký tự zero-width (vd: \u200B, \u200C, \u200D, \uFEFF)
    text = re.sub(r'[\u200B-\u200F\uFEFF]', '', text)
    
    # 4) Loại bỏ các ký tự BOM (Byte Order Mark)
    text = re.sub(r'\ufeff', '', text)
    
    # 5) Tuỳ chọn: Loại bỏ các ký tự “ngoài vùng” (chỉ giữ lại: 
    #    - ASCII cơ bản
    #    - các ký tự tiếng Việt có dấu (U+00C0–U+024F, U+1E00–U+1EFF)
    #    - các dấu câu cơ bản . , ; : - ? ! ( ) / v.v.
    #    - khoảng trắng
    text = re.sub(r'[^a-zA-Z0-9\u00C0-\u024F\u1E00-\u1EFF\s\.\,\;\:\-\?\!\(\)/…]', '', text)
    
    # 6) Xoá khoảng trắng thừa
    text = ' '.join(text.split())
    
    return text

In [11]:
def advanced_clean_text(raw_html: str) -> str:
    """
    Làm sạch HTML và loại bỏ:
      - Các ký tự control (ASCII 0-31, 127-159)
      - Các ký tự zero-width (ví dụ: \u200B, \u200C, \u200D, \uFEFF)
      - Ký tự BOM (\ufeff)
      - Các ký tự không mong muốn (chỉ giữ lại chữ, số, khoảng trắng và một số dấu câu cơ bản)
    """
    # 1) Loại bỏ thẻ HTML bằng BeautifulSoup
    text = BeautifulSoup(raw_html, "html.parser").get_text(separator=" ", strip=True)
    
    # 2) Loại bỏ các ký tự điều khiển (control characters)
    text = re.sub(r'[\u0000-\u001F\u007F-\u009F]', ' ', text)
    
    # 3) Loại bỏ các ký tự zero-width và BOM
    text = re.sub(r'[\u200B-\u200F\uFEFF]', '', text)
    text = re.sub(r'\ufeff', '', text)
    
    # 4) Loại bỏ các ký tự không mong muốn, giữ lại chữ cái (cả tiếng Việt), số, khoảng trắng và dấu câu cơ bản
    text = re.sub(r'[^a-zA-Z0-9À-ỹà-ỹ\s\.\,\;\:\-\?\!\(\)]', ' ', text)
    
    # 5) Loại bỏ khoảng trắng thừa
    text = ' '.join(text.split())
    return text

In [3]:
# --- Khởi tạo PhoBERT ---
tokenizer = AutoTokenizer.from_pretrained("vinai/phobert-base-v2", use_fast=False)
model = AutoModel.from_pretrained("vinai/phobert-base-v2")
device = "cuda" if torch.cuda.is_available() else "cpu"
model = model.to(device)
model.eval()

def get_phobert_embedding(text):
    """
    Tính embedding với PhoBERT, áp dụng advanced_clean_text để giảm lỗi "index out of range".
    """
    # Bước 1: Làm sạch nâng cao
    cleaned_text = advanced_clean_text(text)
    
    # Nếu sau khi làm sạch mà chuỗi rỗng thì bỏ qua
    if not cleaned_text.strip():
        raise ValueError("Text rỗng sau khi làm sạch!")
    
    try:
        # 2) Tokenize với PhoBERT
        inputs = tokenizer(
            cleaned_text,
            return_tensors="pt",
            padding="max_length",
            truncation=True,
            max_length=512
        )
        inputs = {k: v.to(device) for k, v in inputs.items()}
        
        # 3) Lấy output, mean pooling, v.v.
        with torch.no_grad():
            outputs = model(**inputs)
        embeddings = outputs.last_hidden_state  # [1, seq_len, hidden_dim]
        attention_mask = inputs["attention_mask"]
        
        mask = attention_mask.unsqueeze(-1).expand(embeddings.size()).float()
        pooled = torch.sum(embeddings * mask, dim=1) / torch.clamp(mask.sum(dim=1), min=1e-9)
        
        # L2 normalize
        pooled = F.normalize(pooled, p=2, dim=1)
        return pooled[0].cpu().numpy().tolist()
    
    except Exception as e:
        print("Error in get_phobert_embedding:", e, "for text snippet:", cleaned_text[:100])
        # Trả về vector zero thay vì crash
        return [0.0] * 768


def ingest_urls_to_mongo(urls, connection_string, db_name, collection_name):
    """
    Tải nội dung từ các URL, làm sạch bằng BeautifulSoup, chia nhỏ (chunk),
    tính embedding bằng PhoBERT (521 chiều) và lưu vào MongoDB.
    """
    text_splitter = RecursiveCharacterTextSplitter(chunk_size=512, chunk_overlap=50)
    client = MongoClient(connection_string)
    db = client[db_name]
    collection = db[collection_name]

    for url in urls:
        try:
            loader = UnstructuredURLLoader(urls=[url])
            docs = loader.load()
            if not docs:
                print(f"Không load được nội dung từ {url}")
                continue

            for doc in docs:
                # Làm sạch HTML để lấy nội dung text thuần
                content = BeautifulSoup(doc.page_content, "html.parser").get_text(separator=" ", strip=True)
                content = content.encode("utf-8", "ignore").decode("utf-8")
                chunks = text_splitter.split_text(content)
                if not chunks:
                    print(f"Không có chunk nào ở {url}")
                    continue

                for idx, chunk in enumerate(chunks):
                    if not chunk.strip():
                        print(f"Bỏ qua chunk rỗng (chunk {idx}) ở {url}")
                        continue

                    try:
                        embedding = get_phobert_embedding(chunk)
                        doc_dict = {
                            "url": url,
                            "chunk_index": idx,
                            "page_content": chunk,
                            "metadata": doc.metadata,
                            "embedding": embedding
                        }
                        collection.insert_one(doc_dict)
                        print(f"Đã chèn chunk {idx} từ {url}")
                    except Exception as embed_err:
                        print(f"Lỗi tạo embedding chunk {idx} từ {url}: {embed_err}")

        except Exception as e:
            print(f"Lỗi khi ingest {url}: {e}")

    client.close()
    print("Hoàn thành ingest dữ liệu vào MongoDB.")

Some weights of RobertaModel were not initialized from the model checkpoint at vinai/phobert-base-v2 and are newly initialized: ['roberta.pooler.dense.bias', 'roberta.pooler.dense.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


In [77]:
# Danh sách các URL cần ingest
urls = [
    "https://www.vinmec.com/vie/benh/ung-thu-hac-to-da-4723",
    "https://www.vinmec.com/vie/bai-viet/u-hac-lanh-tinh-cua-da-vi",
    "https://www.fvhospital.com/tin-suc-khoe/ung-thu-sac-to-la-gi-hieu-dung-ve-ung-thu-hac-to-va-benh-ly-sac-to-da/",
    "https://www.vinmec.com/vie/bai-viet/ung-thu-bieu-mo-te-bao-day-chan-doan-va-dieu-tri-vi#:~:text=Ung%20th%C6%B0%20bi%E1%BB%83u%20m%C3%B4%20t%E1%BA%BF%20b%C3%A0o%20%C4%91%C3%A1y%20(Basal%20cell%20carcinoma,s%C3%A2u%20nh%E1%BA%A5t%20c%E1%BB%A7a%20bi%E1%BB%83u%20m%C3%B4.",
    "https://www.vinmec.com/vie/benh/ung-thu-bieu-mo-te-bao-day-4315",
    "https://tamanhhospital.vn/ung-thu-bieu-mo-te-bao-day/",
    "https://suckhoedoisong.vn/ung-thu-bieu-mo-te-bao-day-tai-phat-va-phuong-phap-chua-hieu-qua-16923011211073782.htm",
    "https://www.vinmec.com/vie/bai-viet/dau-hieu-da-bi-day-sung-anh-nang-vi",
    "https://www.nhathuocankhang.com/benh/benh-day-sung-quang-hoa",
    "https://nhathuoclongchau.com.vn/benh/day-sung-anh-sang-520.html",
    "https://www.vinmec.com/vie/bai-viet/nhung-dieu-can-biet-ve-chung-day-sung-tiet-ba-vi",
    "https://www.vinmec.com/vie/bai-viet/day-sung-da-dau-nguyen-nhan-va-trieu-chung-vi",
    "https://nhathuoclongchau.com.vn/bai-viet/benh-day-sung-da-dau-nguyen-nhan-trieu-chung-va-cach-dieu-tri.html",
    "https://www.vinmec.com/vie/bai-viet/tim-hieu-ve-u-xo-kinh-mun-thit-vi",
    "https://www.vinmec.com/vie/bai-viet/noi-u-va-buou-bieu-hien-dieu-gi-tren-da-cua-ban-vi",
    "https://www.vinmec.com/vie/bai-viet/tim-hieu-not-ruoi-la-gi-va-cac-loai-not-ruoi-vi",
    "https://www.vinmec.com/vie/bai-viet/not-ruoi-hinh-thanh-nhu-the-nao-vi",
    "https://tamanhhospital.vn/not-ruoi/",
    "https://medlatec.vn/tin-tuc/vet-thuong-mach-mau-la-gi-nguyen-tac-va-ky-thuat-so-cuu-dung-cach",
    "https://nhathuoclongchau.com.vn/bai-viet/vo-mach-mau-duoi-da-nguyen-nhan-va-cach-dieu-tri-72683.html",
    "https://www.vinmec.com/vie/bai-viet/viem-mach-ngoai-da-nhung-dieu-can-biet-vi",
    "https://hellobacsi.com/suc-khoe/trieu-chung/vo-mach-mau-duoi-da/"
]

In [4]:
connection_string = (
        "mongodb+srv://nguyendoantienanh2302:HTwtQDQKssuDlLzb@rag4llm.hsreq.mongodb.net/?retryWrites=true&w=majority&appName=RAG4LLM"
    )

db_name = "rag_database"
collection_name = "documents"

client = MongoClient(connection_string)
db = client[db_name]
collection = db[collection_name]

In [78]:
ingest_urls_to_mongo(urls, connection_string, db_name, collection_name)

Đã chèn chunk 0 từ https://www.vinmec.com/vie/benh/ung-thu-hac-to-da-4723
Đã chèn chunk 1 từ https://www.vinmec.com/vie/benh/ung-thu-hac-to-da-4723
Đã chèn chunk 2 từ https://www.vinmec.com/vie/benh/ung-thu-hac-to-da-4723
Đã chèn chunk 3 từ https://www.vinmec.com/vie/benh/ung-thu-hac-to-da-4723
Đã chèn chunk 4 từ https://www.vinmec.com/vie/benh/ung-thu-hac-to-da-4723
Đã chèn chunk 5 từ https://www.vinmec.com/vie/benh/ung-thu-hac-to-da-4723
Đã chèn chunk 6 từ https://www.vinmec.com/vie/benh/ung-thu-hac-to-da-4723
Đã chèn chunk 7 từ https://www.vinmec.com/vie/benh/ung-thu-hac-to-da-4723
Đã chèn chunk 8 từ https://www.vinmec.com/vie/benh/ung-thu-hac-to-da-4723
Đã chèn chunk 9 từ https://www.vinmec.com/vie/benh/ung-thu-hac-to-da-4723
Đã chèn chunk 10 từ https://www.vinmec.com/vie/benh/ung-thu-hac-to-da-4723
Đã chèn chunk 11 từ https://www.vinmec.com/vie/benh/ung-thu-hac-to-da-4723
Đã chèn chunk 12 từ https://www.vinmec.com/vie/benh/ung-thu-hac-to-da-4723
Đã chèn chunk 13 từ https://www.vin

KeyboardInterrupt: 

In [5]:
def self_reflection_ollama(query: str) -> str:
    """
    Sử dụng ChatOllama để tinh chỉnh query.
    Nếu chưa cấu hình Ollama, có thể trả về query gốc.
    """
    # Nếu bạn có endpoint thực, uncomment và điều chỉnh phần dưới:
    """
    prompt = f"Refine the following medical query to be more specific and clear:\nQuery: {query}"
    url = "http://localhost:11434/generate"
    payload = {"prompt": prompt, "model": "llama2", "temperature": 0.0}
    try:
        response = requests.post(url, json=payload)
        response.raise_for_status()
        data = response.json()
        refined = data.get("generated_text", "").strip()
        return refined if refined else query
    except Exception as e:
        print("Lỗi Self Reflection:", e)
        return query
    """
    # Placeholder: trả về query gốc
    return query

In [21]:
# 20 câu liên quan đến chủ đề y học (giả lập)
medical_queries = [
    "Ung thư hắc tố da là gì?",
    "Triệu chứng ung thư biểu mô tế bào đáy",
    "Cách điều trị u hắc lành tính",
    "Dấu hiệu da bị tổn thương do tia UV",
    "Nguyên nhân gây ung thư hắc tố da",
    "Phòng ngừa ung thư da hiệu quả",
    "Tác động của tia UV đến sức khỏe da",
    "Biểu hiện của ung thư da sớm",
    "Phương pháp chẩn đoán ung thư hắc tố da",
    "Cách điều trị ung thư biểu mô tế bào đáy",
    "Phẫu thuật ung thư da",
    "Liệu pháp điều trị ung thư da",
    "Tầm quan trọng của kem chống nắng",
    "Rủi ro khi tiếp xúc nhiều với tia UV",
    "Cách chăm sóc da sau điều trị ung thư",
    "Các bước chẩn đoán bệnh da liễu",
    "Phòng tránh các bệnh về da",
    "Tầm quan trọng của kiểm tra da định kỳ",
    "Các dấu hiệu cần gặp bác sĩ da liễu",
    "Phương pháp điều trị bệnh da hiện đại"
]

# Tính embedding cho 20 câu y học
medical_queries_embeddings = []
for q in medical_queries:
    emb = get_phobert_embedding(q)
    medical_queries_embeddings.append((q, emb))
print("Đã tính embedding cho 20 câu y học.")

Đã tính embedding cho 20 câu y học.


In [13]:
def calc_cosine_similarity(vec1, vec2):
    v1 = np.array(vec1, dtype=float)
    v2 = np.array(vec2, dtype=float)
    dot = np.dot(v1, v2)
    norm1 = np.linalg.norm(v1)
    norm2 = np.linalg.norm(v2)
    if norm1 * norm2 == 0:
        return 0.0
    return dot / (norm1 * norm2)

def check_need_rag(query_emb, threshold=0.9):
    """
    So sánh query_emb với 20 câu y học.
    Nếu bất kỳ similarity nào >= threshold, trả về True.
    """
    best_sim = 0
    for (q_text, q_emb) in medical_queries_embeddings:
        sim = calc_cosine_similarity(query_emb, q_emb)
        if sim > best_sim:
            best_sim = sim
    print(f"[check_need_rag] Best similarity = {best_sim:.3f}")
    return best_sim >= threshold

In [23]:
def get_query_results(query, limit=10):
    query_embedding = get_phobert_embedding(query)
    pipeline_vector = [
        {
            "$vectorSearch": {
                "index": "vector_index",
                "queryVector": query_embedding,
                "path": "embedding",
                "exact": True,
                "limit": limit
            }
        },
        {
            "$project": {
                "_id": 0,
                "url": 1,
                "page_content": 1,
                "score": {"$meta": "searchScore"}
            }
        }
    ]
    results_cursor = collection.aggregate(pipeline_vector)  # Dùng biến collection
    results = [doc for doc in results_cursor]
    return results

def bm25_rerank(query: str, docs: list, top_n=5):
    corpus = [doc["page_content"] for doc in docs]
    tokenized_corpus = [c.split() for c in corpus]
    bm25 = BM25Okapi(tokenized_corpus)
    query_tokens = query.split()
    scores = bm25.get_scores(query_tokens)
    scored_docs = []
    for doc, s in zip(docs, scores):
        doc["bm25_score"] = float(s)
        scored_docs.append(doc)
    scored_docs = sorted(scored_docs, key=lambda x: x["bm25_score"], reverse=True)
    return scored_docs[:top_n]

In [None]:

# from typing import List
# from langchain_core.tools import tool
# from langchain_ollama import ChatOllama

# # Tool cho model Classification
# @tool
# def classify_text(text: str) -> str:
#     """
#     Phân loại văn bản thành các nhãn cụ thể.
#     Ví dụ: "Tin tức", "Giải trí", "Thể thao", v.v.
#     """
#     # Ở đây bạn có thể gọi model classification thực tế của mình.
#     # Ví dụ: result = classification_model.predict(text)
#     # Giả lập kết quả:
#     result = "Classification result: Category A"
#     return result

# # Tool cho model Segmentation
# @tool
# def segment_image(image_path: str) -> str:
#     """
#     Phân đoạn hình ảnh và trả về kết quả phân đoạn.
#     Ví dụ: xác định các vùng trong ảnh, như "foreground", "background", ...
#     """
#     # Ở đây bạn có thể gọi model segmentation thực tế của mình.
#     # Ví dụ: mask = segmentation_model.predict(image_path)
#     # Giả lập kết quả:
#     result = "Segmentation result: Detected objects and regions"
#     return result

# # Khởi tạo ChatOllama (ví dụ sử dụng model "llama2")
# llm = ChatOllama(
#     model="llama2",  # hoặc model khác theo yêu cầu
#     temperature=0,
#     streaming=False  # Tắt streaming để tránh lỗi định dạng message
# )

# # Bind các tool vào model LLM
# llm = llm.bind_tools([classify_text, segment_image])
llm = ChatOllama(
    model="phi3",      # Tên model bạn đang load
    base_url="http://localhost:11434",  # Nếu Ollama chạy cổng 11434
    temperature=0.7,
    streaming=False
)

def llm_answer_with_ollama(prompt: str) -> str:
    try:
        # Sử dụng phương thức predict() để gọi model, tránh phải định dạng message thủ công
        response = llm.predict(prompt)
        return response
    except Exception as e:
        print("Lỗi khi gọi llm.predict:", e)
        return "[Lỗi] Không thể gọi model."


def normal_model_answer(query: str) -> str:
    """
    Sử dụng ChatOllama cho câu trả lời khi không cần RAG.
    """
    prompt = f"Trả lời câu hỏi sau một cách ngắn gọn và rõ ràng:\nQuery: {query}"
    return llm_answer_with_ollama(prompt)

def rag_llm_answer(query: str, docs: list) -> str:
    """
    Sử dụng ChatOllama để trả lời dựa trên query và các tài liệu liên quan.
    """
    combined_text = "\n\n".join([f"URL: {doc['url']}\nContent: {doc['page_content']}" for doc in docs])
    prompt = (f"Bạn là chuyên gia y tế hàng đầu trong lĩnh vực da liễu hãy giúp tôi trả lời những câu hỏi liên quan."
              f"Câu hỏi: {query}\n\n"
              f"Tài liệu:\n{combined_text}\n\n"
              f"Trả lời một ách ngắn gọn dễ hiểu từ tài liệu được cung cấp")
    return llm_answer_with_ollama(prompt)

In [24]:
# ---------------------------
# 7. Ghép Pipeline
# ---------------------------
def pipeline(query_text: str):
    # B1: Self Reflection (với Ollama)
    refined_query = self_reflection_ollama(query_text)
    print(f"[Self Reflection] refined_query = {refined_query}")
    
    # B2: Tính embedding cho query
    query_emb = get_phobert_embedding(refined_query)
    
    # B3: Kiểm tra xem cần dùng RAG không (so sánh với 20 câu y học)
    need_rag = check_need_rag(query_emb, threshold=0.9)
    if not need_rag:
        print("[INFO] Similarity < 0.9 => Dùng model bình thường")
        return normal_model_answer(refined_query)
    else:
        print("[INFO] Similarity >= 0.9 => Dùng RAG pipeline")
        vec_docs = get_query_results(refined_query, limit=10)
        if not vec_docs:
            return "[RAG] Không tìm thấy tài liệu phù hợp."
        top_docs = bm25_rerank(refined_query, vec_docs, top_n=5)
        if not top_docs:
            return "[RAG] Không có tài liệu sau BM25."
        answer = rag_llm_answer(refined_query, top_docs)
        return answer


In [37]:
!pip install openai==0.28

Collecting openai==0.28
  Downloading openai-0.28.0-py3-none-any.whl.metadata (13 kB)
Downloading openai-0.28.0-py3-none-any.whl (76 kB)
Installing collected packages: openai
  Attempting uninstall: openai
    Found existing installation: openai 1.66.5
    Uninstalling openai-1.66.5:
      Successfully uninstalled openai-1.66.5
Successfully installed openai-0.28.0


In [None]:
import openai
openai.api_key = "YOUR_API_KEY_HERE"

In [34]:
import openai

def llm_answer_with_openai(query: str, docs: list = None) -> str:
    """
    Nếu có danh sách tài liệu docs, xây dựng prompt theo RAG.
    Nếu không có, xây dựng prompt đơn giản chỉ chứa query.
    """
    if docs:
        combined_text = "\n\n".join([f"URL: {doc['url']}\nContent: {doc['page_content']}" for doc in docs])
        prompt = (
            f"Bạn là chuyên gia y tế hàng đầu trong lĩnh vực da liễu. Hãy trả lời câu hỏi dưới đây dựa trên các tài liệu được cung cấp.\n\n"
            f"Câu hỏi: {query}\n\n"
            f"Tài liệu:\n{combined_text}\n\n"
            f"Trả lời một cách ngắn gọn và dễ hiểu."
        )
    else:
        prompt = f"Trả lời câu hỏi sau một cách ngắn gọn và rõ ràng:\nQuery: {query}"

    try:
        # Gọi API với giao diện mới của openai (sau migrate)
        response = openai.ChatCompletion.create(
            model="gpt-3.5-turbo",  # Hoặc model khác mà bạn cần
            messages=[
                {"role": "system", "content": "You are a helpful medical assistant."},
                {"role": "user", "content": prompt}
            ],
            temperature=0.7
        )
        # Truy cập nội dung câu trả lời theo giao diện mới
        return response['choices'][0]['message']['content'].strip()
    except Exception as e:
        print("Lỗi khi gọi OpenAI:", e)
        return "[Lỗi] Không thể gọi model OpenAI."


In [35]:
# ---------------------------
# 7. Ghép Pipeline
# ---------------------------
def pipeline1(query_text: str):
    # B1: Self Reflection (với Ollama)
    # refined_query = self_reflection_ollama(query_text)
    # print(f"[Self Reflection] refined_query = {refined_query}")
    
    # B2: Tính embedding cho query
    query_emb = get_phobert_embedding(query_text)
    
    # B3: Kiểm tra xem cần dùng RAG không (so sánh với 20 câu y học)
    need_rag = check_need_rag(query_emb, threshold=0.9)
    if not need_rag:
        print("[INFO] Similarity < 0.9 => Dùng model bình thường")
        return llm_answer_with_openai(query_text)
    else:
        print("[INFO] Similarity >= 0.9 => Dùng RAG pipeline")
        vec_docs = get_query_results(query_text, limit=10)
        if not vec_docs:
            return "[RAG] Không tìm thấy tài liệu phù hợp."
        top_docs = bm25_rerank(query_text, vec_docs, top_n=5)
        if not top_docs:
            return "[RAG] Không có tài liệu sau BM25."
        answer = llm_answer_with_openai(query_text, top_docs)
        return answer


In [38]:
query_text = ("Cách điều trị ung thư hắc tố da")
result = pipeline1(query_text)
print("=== KẾT QUẢ CUỐI ===")
print(result)

[check_need_rag] Best similarity = 0.906
[INFO] Similarity >= 0.9 => Dùng RAG pipeline
Lỗi khi gọi OpenAI: 

You tried to access openai.ChatCompletion, but this is no longer supported in openai>=1.0.0 - see the README at https://github.com/openai/openai-python for the API.

You can run `openai migrate` to automatically upgrade your codebase to use the 1.0.0 interface. 

Alternatively, you can pin your installation to the old version, e.g. `pip install openai==0.28`

A detailed migration guide is available here: https://github.com/openai/openai-python/discussions/742

=== KẾT QUẢ CUỐI ===
[Lỗi] Không thể gọi model OpenAI.


In [25]:
# ---------------------------
# 8. Chạy thử pipeline với query mẫu
# ---------------------------
query_text = ("Cách điều trị ung thư hắc tố da")
result = pipeline(query_text)
print("=== KẾT QUẢ CUỐI ===")
print(result)

[Self Reflection] refined_query = Cách điều trị ung thư hắc tố da
[check_need_rag] Best similarity = 0.906
[INFO] Similarity >= 0.9 => Dùng RAG pipeline


KeyboardInterrupt: 