# Đánh giá mô hình RAG với RAGAS
Notebook này hướng dẫn cách sử dụng thư viện RAGAS để đánh giá chất lượng truy xuất và sinh đáp án của mô hình RAG.
Các bước thực hiện:
1. Cài đặt và import RAGAS
2. Load dữ liệu đánh giá (câu hỏi, đáp án chuẩn)
3. Viết hàm truy vấn mô hình RAG
4. Đánh giá và thống kê kết quả

In [1]:
import os
import sys
sys.path.append(os.path.abspath(os.path.join(os.getcwd(), '..')))

from retriever.hybrid_search import hybrid_retriever
from utils.save_chunks_json import save_chunks_to_json
from agent import generate_answer, get_router

# Cài đặt RAGAS nếu chưa có
!pip install ragas[metrics] --quiet
from ragas import evaluate
from ragas.metrics import answer_relevancy, faithfulness, context_precision, context_recall
import pandas as pd

  _warn(("h5py is running against HDF5 {0} when it was built against {1}, "







In [2]:
# Hàm truy vấn mô hình RAG (ví dụ, bạn cần chỉnh lại cho phù hợp với project của bạn)
def query_rag(eval_data, file_path):

    data = []

    for question, ground_truth in zip(eval_data['question'], eval_data['ground_truth_answer']):

        #Phần xử lý truy vấn mô hình RAG để lấy context và trả về kết quả
        context = hybrid_retriever(question, 'gemini-2.5-flash', 10)
        router = get_router(question, 'gemini-2.5-flash')
        answer = generate_answer(question, context, router, model_choice='gemini-2.5-flash')

        data.append({
            'question': question,
            'answer': answer,
            'contexts': context,
            'ground_truth': ground_truth
        })
        
    save_chunks_to_json(data, file_path)

    return data

## ***Đánh giá môn Lịch Sử Đảng***

In [3]:
# # Đọc dữ liệu đánh giá từ file CSV
# # File nên có các cột: question, ground_truth_answer
# LSD_data = pd.read_csv('../eval/eval_data/lich_su_dang.csv')
# LSD_data.head()

In [4]:
# # Tạo danh sách các sample cho RAGAS
# LSD_eval = query_rag(LSD_data, './eval_data/LSD_eval_data.json')

# LSD_eval[:2]

In [5]:
# # Đánh giá kết quả bằng RAGAS
# results = evaluate(
#     data_samples,
#     metrics=[answer_relevancy, faithfulness, context_precision, context_recall]
# )

# print(results)
# results.plot()

## ***Đánh giá môn Triết Học***

In [6]:
# Đọc dữ liệu đánh giá từ file CSV
# File nên có các cột: question, ground_truth_answer
TrietHoc_data = pd.read_csv('../eval/eval_data/lich_su_dang.csv')
TrietHoc_data.head()

Unnamed: 0,question,ground_truth_answer
0,Chiến lược chung của ĐCSVN trong cuộc Tổng khở...,Đảng lãnh đạo nhân dân thực hiện Tổng khởi ngh...
1,Hội Việt Nam Cách mạng Thanh niên (1925) do Ng...,Hội Việt Nam Cách mạng Thanh niên ra đời năm 1...
2,"Phong trào ""vô sản hóa"" (từ 1928) trong công n...","Phong trào ""vô sản hóa"" được Hội Việt Nam Cách..."
3,Hội Việt Nam Cách mạng Thanh niên đã tiến hành...,Hội đã xuất bản báo Thanh Niên (xuất bản ở Tru...
4,Cuối năm 1929 có những tổ chức cộng sản nào đư...,"Cuối năm 1929, tại các vùng Việt Nam lần lượt ..."


In [7]:
# Tạo danh sách các sample cho RAGAS
TrietHoc_eval = query_rag(TrietHoc_data, './eval_data/TrietHoc_eval_data.json')

TrietHoc_eval[:2]

2025-07-18 10:20:43.750 
  command:

    streamlit run c:\Users\dhdnc\miniconda3\Lib\site-packages\ipykernel_launcher.py [ARGUMENTS]


c:\Users\dhdnc\OneDrive\ドキュメント\GitHub\RAG_GeneralSubject\data\LichSuDang\Lich_Su_Dang_raw.json True
c:\Users\dhdnc\OneDrive\ドキュメント\GitHub\RAG_GeneralSubject\data\TrietHoc\TrietHoc_raw.json True




c:\Users\dhdnc\OneDrive\ドキュメント\GitHub\RAG_GeneralSubject\data\LichSuDang\Lich_Su_Dang_raw.json True
c:\Users\dhdnc\OneDrive\ドキュメント\GitHub\RAG_GeneralSubject\data\TrietHoc\TrietHoc_raw.json True
c:\Users\dhdnc\OneDrive\ドキュメント\GitHub\RAG_GeneralSubject\data\LichSuDang\Lich_Su_Dang_raw.json True
c:\Users\dhdnc\OneDrive\ドキュメント\GitHub\RAG_GeneralSubject\data\TrietHoc\TrietHoc_raw.json True
c:\Users\dhdnc\OneDrive\ドキュメント\GitHub\RAG_GeneralSubject\data\LichSuDang\Lich_Su_Dang_raw.json True
c:\Users\dhdnc\OneDrive\ドキュメント\GitHub\RAG_GeneralSubject\data\TrietHoc\TrietHoc_raw.json True
c:\Users\dhdnc\OneDrive\ドキュメント\GitHub\RAG_GeneralSubject\data\LichSuDang\Lich_Su_Dang_raw.json True
c:\Users\dhdnc\OneDrive\ドキュメント\GitHub\RAG_GeneralSubject\data\TrietHoc\TrietHoc_raw.json True
c:\Users\dhdnc\OneDrive\ドキュメント\GitHub\RAG_GeneralSubject\data\LichSuDang\Lich_Su_Dang_raw.json True
c:\Users\dhdnc\OneDrive\ドキュメント\GitHub\RAG_GeneralSubject\data\TrietHoc\TrietHoc_raw.json True
c:\Users\dhdnc\OneDrive\ドキュメント

[{'question': 'Chiến lược chung của ĐCSVN trong cuộc Tổng khởi nghĩa Tháng Tám (1945) là gì và ý nghĩa lịch sử của nó?',
  'answer': '**Nội dung:**\nChiến lược chung của Đảng Cộng sản Việt Nam (ĐCSVN) trong cuộc Tổng khởi nghĩa Tháng Tám (1945) và ý nghĩa lịch sử của nó được trình bày cụ thể như sau:\n\n1.  **Chiến lược chung của ĐCSVN trong cuộc Tổng khởi nghĩa Tháng Tám (1945):**\n    *   **Hoàn chỉnh đường lối giải phóng dân tộc:** Từ Hội nghị lần thứ tám Ban Chấp hành Trung ương Đảng (tháng 5-1941), Đảng đã hoàn chỉnh chủ trương chiến lược giải phóng dân tộc, khắc phục những hạn chế của Luận cương chính trị (tháng 10-1930) và khẳng định lại đường lối đúng đắn trong Cương lĩnh chính trị đầu tiên. Đường lối này nhấn mạnh mục tiêu giải phóng dân tộc là cao hơn hết thảy và cần đoàn kết toàn dân để đánh đổ đế quốc và Việt gian [LSD_chunk_00070], [LSD_chunk_00017].\n    *   **Xác định nhiệm vụ trung tâm là chuẩn bị khởi nghĩa vũ trang:** Hội nghị Trung ương lần thứ tám đã xác định chuẩn 