In [1]:
# Importing the necessary Python libraries
import os
import pandas as pd
from datasets import Dataset
from langchain_google_genai import ChatGoogleGenerativeAI
from ragas import evaluate
from ragbase.config import Config
from ragas.llms import LangchainLLMWrapper
from ragas.run_config import RunConfig
from langchain_community.embeddings import HuggingFaceEmbeddings
from ragas.metrics import (
    faithfulness, # xem câu trả lời có trung thực với các contexts không.
    answer_relevancy, # câu trả lời có liên quan đến câu hỏi không
    context_precision, # contexts mà model truy xuất có liên quan đến câu hỏi không
    context_recall,
    answer_correctness, # độ chính xác câu trả lời của model với ground_truth
)

from tqdm import tqdm


  from .autonotebook import tqdm as notebook_tqdm


In [2]:
df_testset = pd.read_excel('./data/generated_test_dataset_advance_context_answer_final_test.xlsx')
# df_testset = pd.read_excel('./data/generated_test_dataset_advance_context_answer_missing.xlsx')

In [3]:
df_testset

Unnamed: 0,question,answer,context,best_answer
0,"Mình cảm thấy lạc lõng quá, như thể mình không...","Tớ hiểu mà, cái cảm giác lạc lõng giữa đám đôn...",['Question: Xung quanh có rất nhiều người nhưn...,"Mình tin rằng, dù có cảm thấy lạc lõng đến đâu..."
1,"Dạo này mình cứ thấy chán nản ấy, chẳng có hứn...","Tớ hiểu mà, cái cảm giác chán nản nó đáng ghét...",['Question: Mình cảm thấy rất mệt mỏi và bất l...,Mình hiểu cảm giác của bạn. Đôi khi cuộc sống ...
2,Dạo này mình cứ thấy mọi thứ xung quanh thật l...,"Tớ hiểu mà, ai cũng có những lúc thấy mọi thứ ...",['Question: Mình từng là người rất nhiều đam m...,"Ôi, nghe bạn nói mà mình thấy thương ghê. Cái ..."
3,"Mình dạo này stress quá, nhìn ai cũng thấy có ...","Tớ hiểu mà, dạo này nhìn đâu cũng thấy ""cẩu lư...",['Question: Áp Lực Điểm Số\nCứ mỗi kì thi tới ...,Mình thấy nhiều người có đôi có cặp rồi mà vẫn...
4,"Dạo này mình thấy cuộc sống chán quá, chẳng có...","Tớ hiểu mà, ai cũng có những lúc thấy cuộc sốn...",['Question: Mình muốn hỏi mn là ko biết s mình...,Mình nghĩ rằng bạn nên thử tìm một người để ch...
5,"Dạo này mình cứ cảm thấy trống rỗng ấy, không ...","Tớ hiểu mà, cái cảm giác trống rỗng đó nó đáng...",['Question: Mình từng là người rất nhiều đam m...,Cảm giác trống rỗng đôi khi là dấu hiệu cho th...
6,Mấy đứa bạn cấp 3 của mình giờ đứa nào cũng xe...,Tớ hiểu cảm giác của cậu mà! 🥹 Ai mà chẳng có ...,"['Con xin lỗi, chắc có lẽ, con không thể hoàn ...",Hãy nhớ rằng mỗi người có một xuất phát điểm k...
7,Mình cứ bị ám ảnh bởi những sai lầm trong quá ...,Tớ hiểu cảm giác của cậu mà. Tớ cũng từng trải...,['Khi viết cảm xúc của mình thì bạn sẽ dễ dàng...,"Thử viết ra những điều bạn dằn vặt, rồi tự hỏi..."
8,"Dạo này mình cứ thấy trống rỗng ấy, làm gì cũn...",Tớ hiểu cái cảm giác trống rỗng mà cậu đang tr...,['Question: Mình cảm thấy rất mệt mỏi và bất l...,Tớ hiểu cảm giác đó. Đôi khi cuộc sống cứ cuốn...
9,Tớ đang stress quá mọi người ơi! Công việc thì...,Nghe cậu kể mà tớ thấy nghẹt thở thay á 🥹. Côn...,"['Question: Chào các chị,\nDạo gần đây em gặp ...",Thở sâu nào bạn ơi! Cuộc sống đôi khi quăng ch...


In [4]:
df_testset.rename(columns={
    'context': 'contexts',
    'best_answer': 'ground_truth',
}, inplace=True)

In [None]:
df_testset

In [6]:


import ast

def pandas_to_ragas(df):
    '''
    Converts a Pandas DataFrame into a Ragas-compatible dataset
    
    Inputs:
        - df (Pandas DataFrame): The input DataFrame to be converted
        
    Returns:
        - ragas_testset (Hugging Face Dataset): A Hugging Face dataset compatible with the Ragas framework
    '''
    # Đảm bảo tất cả các cột văn bản đều là chuỗi và không có NaN
    text_columns = ['question', 'ground_truth', 'answer']
    for col in text_columns:
        df[col] = df[col].fillna('').astype(str)

    # Xử lý cột 'contexts' từ string hoặc JSON thành list of strings
    def parse_context(val):
        if isinstance(val, list):
            return val
        elif isinstance(val, str):
            val = val.strip()
            if val.startswith('[') and val.endswith(']'):
                try:
                    parsed = ast.literal_eval(val)
                    return parsed if isinstance(parsed, list) else [val]
                except Exception:
                    return [val]
            elif val:
                return [val]
        return []

    df['contexts'] = df['contexts'].apply(parse_context)

    # Chuyển DataFrame thành Hugging Face dataset
    data_dict = df[['question', 'contexts', 'answer', 'ground_truth']].to_dict('list')
    ragas_testset = Dataset.from_dict(data_dict)
    return ragas_testset

In [7]:
ragas_testset = pandas_to_ragas(df = df_testset)

In [8]:
ragas_testset

Dataset({
    features: ['question', 'contexts', 'answer', 'ground_truth'],
    num_rows: 50
})

In [9]:
print(ragas_testset['contexts'][0])

['Question: Xung quanh có rất nhiều người nhưng em cứ cảm giác lạc lõng kiểu gì ấy....Em vẫn có thể giao tiếp nói chuyện bình thường ạ\nBest answer: Xin chào, Có thể bạn đang có một chút vấn đề về cảm xúc, do đó bạn sẽ khó kết nối hơn với mọi người xung quanh. Nếu cảm thấy phù hợp, bạn có thể liên hệ với chúng mình để được đánh giá và hỗ trợ tâm lý nhé.', 'Question: Mình muốn hỏi mn là ko biết s mình lại cảm thấy chán nản vô vị cuộc sống...cứ đi làm kiếm tiền rồi lại ăn ngủ vòng lập vô tận như vậy đến cuối đời mình thấy cuộc sống chán vô vị làm sao. Những thứ mình thích trước kia cũng cảm thấy chán vô vị mình cũng ko muốn tồn tại nữa chả hiểu sao... Mình còn thấy sống cũng chán... Mình bị khoảng 1 thời gian rồi...có ai giúp mình giải đáp tại sao mình lại như vậy không ạ?\nBest answer: Mình rất tiếc khi nghe bạn đang cảm thấy như vậy. Bạn có thể đang trải qua một giai đoạn tâm lý khó khăn, có thể là sự mất kết nối với bản thân và những thứ xung quanh.\nTrong cuộc sống, đôi khi chúng ta 

In [10]:
print(len(ragas_testset['contexts'][0]))

3


In [None]:
# ======= CẤU HÌNH =======


save_dir = "data/evaluate"


os.makedirs(save_dir, exist_ok=True)
num_chunks = (len(df_testset) + chunk_size - 1) // chunk_size

# EMBEDDINGS: chỉ cần khởi tạo 1 lần
embedding_model = HuggingFaceEmbeddings(model_name=Config.Model.EMBEDDINGS)

run_config = RunConfig(
    timeout=200,
    max_retries=200,
    max_wait=200,
    max_workers=16
)

  embedding_model = HuggingFaceEmbeddings(model_name=Config.Model.EMBEDDINGS)





In [13]:
from google.api_core.exceptions import ResourceExhausted
import time
# ======= XỬ LÝ THEO CHUNK VÀ XOAY VÒNG API KEY =======
list_key = [
    "AIzaSyBhSDC69kLBqw21VdsYvBs74q98w4dHa7E", # special hơn
    # "AIzaSyB34kWQh8OekS06SU0jvj1XN9znmh9C9qo", # special
    # "AIzaSyDaVCYIC-j6BoBe4VEWPRMWnR7hTu9puZo",
    # "AIzaSyBfmOEpr9mdfyEimLW1wQh9Ik4drMAdyF8",
    # "AIzaSyCZ6lZNrFesfPtSkixvmaH7b8TX-UMUVBg",
    # "AIzaSyDVjszXsue2Qs7rQf4-VNHhUt-1KZtQdx4",
    # "AIzaSyDQMVfzyVcytu_4I32Hh6_xwVQA2G2nr30",
    # "AIzaSyAtDL5ryd6oIUAKjp4cFnTgW21xPynp6YY",
    # "AIzaSyDha2zavpRp2fkrpVz6Xopv6HppcyubX2Y",
    # "AIzaSyBSLdACUAR5srrD_yoolWKtIZlIk5JtMSo",
    # "AIzaSyB17vRD3BlCe0gzOCbvbrgwwC7zVTXlbZo",
    # "AIzaSyCVA6ctW4cXNUzwUqYkR6pWbBSdh19zwvA",
    # "AIzaSyCNLh5HhlIUovo8_de1RWg1jAx2Iq4Yo8g",
    # "AIzaSyD_d2NNsNxVhWLK_d2yjnEQuyTNUECi1Ns",
    # "AIzaSyCw371rlLG4FqlRan4C0rD280sqVga-zE4",
    # "AIzaSyBctBtlbRv4aJ5cvJRZNK_sfPiBY8-6KoY",
    # "AIzaSyAMKQvJs5hAup1JUNl3G29dt24m5mRLgiE",
]
chunk_size = 10

for i in tqdm(range(1, 5), desc="Đang chạy các chunk"):
    chunk_df = df_testset.iloc[i * chunk_size:(i + 1) * chunk_size].reset_index(drop=True)
    if chunk_df.empty:
        continue

    ragas_testset_chunk = pandas_to_ragas(chunk_df)
    api_key_index = i % len(list_key)
    success = False
    retry_count = 0
    max_retries_per_chunk = 1000

    while not success and retry_count < max_retries_per_chunk:
        selected_key = list_key[api_key_index]

        try:
            llm = LangchainLLMWrapper(ChatGoogleGenerativeAI(
                model="gemini-2.0-flash",
                google_api_key=selected_key,
                temperature=Config.Model.TEMPERATURE,
                max_tokens=Config.Model.MAX_TOKENS,
                timeout=None,
                max_retries=5,
            ))

            ragas_scores_chunk = evaluate(
                dataset=ragas_testset_chunk,
                llm=llm,
                embeddings=embedding_model,
                metrics=[
                    faithfulness,
                    answer_relevancy,
                    context_precision,
                    # answer_correctness,
                    context_recall,
                ],
                run_config=run_config
            )

            df_scores_chunk = ragas_scores_chunk.to_pandas()
            output_path = os.path.join(save_dir, f"ragas_score_chunk_{i + 1}.xlsx")
            df_scores_chunk.to_excel(output_path, index=False)

            print(f"✅ Chunk {i + 1} xử lý xong với API key: {selected_key}")
            success = True

        except Exception as e:
            error_msg = str(e)
            if "429" in error_msg or isinstance(e, ResourceExhausted) or "rate limit" in error_msg.lower():
                print(f"⚠️  Lỗi 429 với key {selected_key}. Thử key khác...")
                retry_count += 1
                api_key_index = (api_key_index + 1) % len(list_key)
                time.sleep(1)  # chờ 1s rồi thử lại
            else:
                print(f"❌ Lỗi khác ở chunk {i + 1} với key {selected_key}: {e}")
                break

Evaluating: 100%|██████████| 40/40 [00:40<00:00,  1.01s/it]
Đang chạy các chunk:  25%|██▌       | 1/4 [00:41<02:04, 41.48s/it]

✅ Chunk 2 xử lý xong với API key: AIzaSyBhSDC69kLBqw21VdsYvBs74q98w4dHa7E


Evaluating: 100%|██████████| 40/40 [00:39<00:00,  1.01it/s]
Đang chạy các chunk:  50%|█████     | 2/4 [01:22<01:21, 40.99s/it]

✅ Chunk 3 xử lý xong với API key: AIzaSyBhSDC69kLBqw21VdsYvBs74q98w4dHa7E


Evaluating: 100%|██████████| 40/40 [00:42<00:00,  1.06s/it]
Đang chạy các chunk:  75%|███████▌  | 3/4 [02:06<00:42, 42.38s/it]

✅ Chunk 4 xử lý xong với API key: AIzaSyBhSDC69kLBqw21VdsYvBs74q98w4dHa7E


Evaluating: 100%|██████████| 40/40 [00:38<00:00,  1.05it/s]
Đang chạy các chunk: 100%|██████████| 4/4 [02:45<00:00, 41.38s/it]

✅ Chunk 5 xử lý xong với API key: AIzaSyBhSDC69kLBqw21VdsYvBs74q98w4dHa7E



