In [1]:
# Importing the necessary Python libraries
import os
import pandas as pd
from datasets import Dataset
from langchain_core.prompts import ChatPromptTemplate, HumanMessagePromptTemplate
from langchain_community.document_loaders import DataFrameLoader
from langchain_google_genai import ChatGoogleGenerativeAI
from ragas import evaluate
from langchain_groq import ChatGroq
from langchain_community.chat_models import ChatOllama
from ragbase.config import Config
from ragas.llms import LangchainLLMWrapper
from ragas.run_config import RunConfig
from langchain_community.embeddings import HuggingFaceEmbeddings
from ragas.metrics import (
    faithfulness, # xem câu trả lời có trung thực với các contexts không.
    answer_relevancy, # câu trả lời có liên quan đến câu hỏi không
    context_precision, # contexts mà model truy xuất có liên quan đến câu hỏi không
    context_recall,
    context_entity_recall,
    answer_similarity,
    answer_correctness, # câu trả lời của model với ground_truth
)

from tqdm import tqdm


  from .autonotebook import tqdm as notebook_tqdm


In [10]:
df_testset = pd.read_excel('./data/test_dataset_3000.xlsx')

In [11]:
df_testset

Unnamed: 0,question,contexts,answer,ground_truth
0,"Em mới chia tay người yêu được 2 tháng, nhưng ...",Question: Làm sao để quay trở lại? Tôi và em m...,Nghe cậu nói mà tớ thấy thương cậu ghê 🥺 Chia ...,Hãy cho phép bản thân được buồn. Đừng cố gắng ...
1,Mình và người yêu mình yêu nhau được 2 năm rồi...,Question: Mình với bồ mình quen nhau gần 2 năm...,Tớ hiểu cảm giác của cậu nè. Yêu lâu mà cứ đều...,Lên kế hoạch cho một chuyến đi ngắn ngày đến m...
2,Em cảm thấy khó khăn khi mở lòng và tin tưởng ...,Question: Em mong nhận được sự tư vấn của các ...,"Tớ hiểu mà, sau những tổn thương từ gia đình t...",Thấu hiểu và chấp nhận quá khứ là bước đầu tiê...
3,Dạo gần đây mình cảm thấy mọi thứ xung quanh t...,"Question: Chào mn ạ, dạo gần đây mình stress q...","Ui da, nghe cậu kể mà tớ thấy nhói lòng ghê 🥺....","Hãy nhớ rằng, cảm giác này là tạm thời. Dành t..."
4,"Em là sinh viên năm nhất, mới lên thành phố họ...",Question: Lên Đại Học Nên Quan Trọng Mối Quan ...,Nghe em kể mà thấy thương ghê 🥺. Tớ hiểu cảm g...,"Tham gia các câu lạc bộ, đội nhóm ở trường. Đâ..."
...,...,...,...,...
3004,Em đang học lớp 9 và cảm thấy rất áp lực vì sắ...,"Question: Mọi người ơi cho em hỏi ạ, em năm na...",Nghe cậu kể mà tớ thấy thương ghê 🥺. Tớ hiểu c...,"Dành thời gian cho những hoạt động thư giãn, g..."
3005,Dạo gần đây mình cảm thấy khó khăn trong việc ...,Question: Làm Thế Nào Để Thay Đổi Bố Mình? Xin...,"Tớ hiểu mà, cái cảm giác muốn thể hiện tình cả...","Hãy bắt đầu từ những hành động nhỏ, ví dụ như ..."
3006,Em đang rất băn khoăn giữa việc tiếp tục theo ...,"Em vừa tốt nghiệp, cũng đã tìm được việc làm. ...","Nghe cậu kể mà tớ thấy quen ghê á, giống như t...",Hãy thử tìm cách dung hòa cả hai! Bạn có thể l...
3007,Em và người yêu em đã chia tay được 3 tháng. A...,Question: Cần giúp chuyện tình yêu. Chuyện là ...,Nghe cậu kể mà tớ thấy thương ghê 🥺 Yêu nhau t...,"Trước khi quyết định liên lạc, hãy dành thời g..."


In [12]:
def pandas_to_ragas(df):
    '''
    Converts a Pandas DataFrame into a Ragas-compatible dataset
    
    Inputs:
        - df (Pandas DataFrame): The input DataFrame to be converted
        
    Returns:
        - ragas_testset (Hugging Face Dataset): A Hugging Face dataset compatible with the Ragas framework
    '''
    # Ensure all text columns are strings and handle NaN values
    text_columns = ['question', 'ground_truth', 'answer']
    for col in text_columns:
        df[col] = df[col].fillna('').astype(str)
        
    # Convert 'contexts' to a list of lists
    df['contexts'] = df['contexts'].fillna('').astype(str).apply(lambda x: [x] if x else [])
    
    # Converting the DataFrame to a dictionary
    data_dict = df[['question', 'contexts', 'answer', 'ground_truth']].to_dict('list')
    
    # Loading the dictionary as a Hugging Face dataset
    ragas_testset = Dataset.from_dict(data_dict)
    
    return ragas_testset

In [13]:
ragas_testset = pandas_to_ragas(df = df_testset)

In [None]:
# llm = LangchainLLMWrapper(ChatGoogleGenerativeAI(
#             model="gemini-2.0-flash",
#             google_api_key="AIzaSyB17vRD3BlCe0gzOCbvbrgwwC7zVTXlbZo",
#             temperature=Config.Model.TEMPERATURE,
#             max_tokens=Config.Model.MAX_TOKENS,
#             timeout=None,
#             max_retries=5,
#         ))
# embedding_model = HuggingFaceEmbeddings(model_name=Config.Model.EMBEDDINGS)
# run_config = RunConfig(timeout=200, max_retries=10, max_wait = 100, max_workers=1)

# # Generating the Ragas scores
# ragas_scores = evaluate(
#     dataset = ragas_testset,
#     llm = llm,
#     embeddings = embedding_model,
#     metrics = [
#         faithfulness, # xem câu trả lời có trung thực với các contexts không.
#         answer_relevancy, # câu trả lời có liên quan đến câu hỏi không
#         context_precision, # contexts mà model truy xuất có liên quan đến câu hỏi không
#         answer_correctness, # câu trả lời của model với ground_truth
#     ],
#     run_config = run_config
# )
# # Converting the Ragas scores to a Pandas DataFrame
# df_ragas_scores = ragas_scores.to_pandas()

# # Saving the Ragas scores to a CSV file

# df_ragas_scores.to_excel('data/ragas_scores.xlsx', index = False)

In [None]:
# ======= CẤU HÌNH =======
chunk_size = 3

save_dir = "data/evaluate"
list_key = [
    "AIzaSyBSLdACUAR5srrD_yoolWKtIZlIk5JtMSo",
    "AIzaSyB17vRD3BlCe0gzOCbvbrgwwC7zVTXlbZo",
    "AIzaSyCVA6ctW4cXNUzwUqYkR6pWbBSdh19zwvA",
    "AIzaSyCNLh5HhlIUovo8_de1RWg1jAx2Iq4Yo8g",
    "AIzaSyD_d2NNsNxVhWLK_d2yjnEQuyTNUECi1Ns",
    "AIzaSyCw371rlLG4FqlRan4C0rD280sqVga-zE4",
    "AIzaSyBctBtlbRv4aJ5cvJRZNK_sfPiBY8-6KoY",
    "AIzaSyAMKQvJs5hAup1JUNl3G29dt24m5mRLgiE",
    "AIzaSyDaVCYIC-j6BoBe4VEWPRMWnR7hTu9puZo"
]

os.makedirs(save_dir, exist_ok=True)
num_chunks = (len(df_testset) + chunk_size - 1) // chunk_size

# EMBEDDINGS: chỉ cần khởi tạo 1 lần
embedding_model = HuggingFaceEmbeddings(model_name=Config.Model.EMBEDDINGS)

run_config = RunConfig(
    timeout=200,
    max_retries=20,
    max_wait=200,
    max_workers=1
)

In [None]:
chunk_start = 18

In [None]:
# ======= XỬ LÝ THEO CHUNK VÀ XOAY VÒNG API KEY =======
for i in tqdm(range(chunk_start, num_chunks), desc="Đang chạy các chunk"):
    chunk_df = df_testset.iloc[i * chunk_size:(i + 1) * chunk_size].reset_index(drop=True)
    if chunk_df.empty:
        continue

    try:
        # 👉 Chuyển DataFrame chunk sang ragas_testset (theo đúng hàm của bạn)
        ragas_testset_chunk = pandas_to_ragas(chunk_df)

        # 👉 Chọn API key theo round-robin
        selected_key = list_key[i % len(list_key)]

        # 👉 Tạo LLM wrapper tương ứng
        llm = LangchainLLMWrapper(ChatGoogleGenerativeAI(
            model="gemini-2.0-flash",
            google_api_key=selected_key,
            temperature=Config.Model.TEMPERATURE,
            max_tokens=Config.Model.MAX_TOKENS,
            timeout=None,
            max_retries=5,
        ))

        # 👉 Đánh giá
        ragas_scores_chunk = evaluate(
            dataset=ragas_testset_chunk,
            llm=llm,
            embeddings=embedding_model,
            metrics=[
                faithfulness,
                answer_relevancy,
                context_precision,
                answer_correctness
            ],
            run_config=run_config
        )

        # 👉 Ghi kết quả ra file Excel
        df_scores_chunk = ragas_scores_chunk.to_pandas()
        # df_scores_chunk["chunk_index"] = i
        output_path = os.path.join(save_dir, f"ragas_score_chunk_{i + 1}.xlsx")
        df_scores_chunk.to_excel(output_path, index=False)

        print(f"✅ Chunk {i + 1} đã xử lý xong với API key: {selected_key}")

    except Exception as e:
        print(f"❌ Lỗi ở chunk {i + 1} với key {selected_key}: {e}")
        continue

Đang chạy các chunk:   0%|          | 0/990 [00:00<?, ?it/s]Retrying langchain_google_genai.chat_models._achat_with_retry.<locals>._achat_with_retry in 2.0 seconds as it raised ResourceExhausted: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerMinutePerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.0-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 15
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 53
}
].
Retrying langchain_google_genai.chat_models._achat_with_retry.<locals>._achat_with_retry in 2.0 seconds as it raised ResourceExhausted: 429 You

✅ Chunk 14 đã xử lý xong với API key: AIzaSyD_d2NNsNxVhWLK_d2yjnEQuyTNUECi1Ns


Retrying langchain_google_genai.chat_models._achat_with_retry.<locals>._achat_with_retry in 2.0 seconds as it raised ResourceExhausted: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerMinutePerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.0-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 15
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 45
}
].
Retrying langchain_google_genai.chat_models._achat_with_retry.<locals>._achat_with_retry in 2.0 seconds as it raised ResourceExhausted: 429 You exceeded your current quota, please check your plan and bil

✅ Chunk 15 đã xử lý xong với API key: AIzaSyCw371rlLG4FqlRan4C0rD280sqVga-zE4


Retrying langchain_google_genai.chat_models._achat_with_retry.<locals>._achat_with_retry in 2.0 seconds as it raised ResourceExhausted: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerMinutePerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.0-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 15
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 58
}
].
Retrying langchain_google_genai.chat_models._achat_with_retry.<locals>._achat_with_retry in 2.0 seconds as it raised ResourceExhausted: 429 You exceeded your current quota, please check your plan and bil

✅ Chunk 16 đã xử lý xong với API key: AIzaSyBctBtlbRv4aJ5cvJRZNK_sfPiBY8-6KoY


Retrying langchain_google_genai.chat_models._achat_with_retry.<locals>._achat_with_retry in 2.0 seconds as it raised ResourceExhausted: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerMinutePerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.0-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 15
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 10
}
].
Retrying langchain_google_genai.chat_models._achat_with_retry.<locals>._achat_with_retry in 2.0 seconds as it raised ResourceExhausted: 429 You exceeded your current quota, please check your plan and bil

✅ Chunk 17 đã xử lý xong với API key: AIzaSyAMKQvJs5hAup1JUNl3G29dt24m5mRLgiE


Retrying langchain_google_genai.chat_models._achat_with_retry.<locals>._achat_with_retry in 2.0 seconds as it raised ResourceExhausted: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerMinutePerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.0-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 15
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 55
}
].
Retrying langchain_google_genai.chat_models._achat_with_retry.<locals>._achat_with_retry in 2.0 seconds as it raised ResourceExhausted: 429 You exceeded your current quota, please check your plan and bil

✅ Chunk 18 đã xử lý xong với API key: AIzaSyDaVCYIC-j6BoBe4VEWPRMWnR7hTu9puZo


Evaluating:  17%|█▋        | 2/12 [00:12<01:01,  6.19s/it]
Đang chạy các chunk:   1%|          | 5/990 [09:13<30:17:35, 110.72s/it]


KeyboardInterrupt: 

Exception raised in Job[3]: AssertionError(LLM must be set)
Exception raised in Job[4]: AssertionError(LLM is not set)
Exception raised in Job[5]: AssertionError(LLM is not set)
Exception raised in Job[6]: AssertionError(LLM is not set)
Exception raised in Job[7]: AssertionError(LLM must be set)
Exception raised in Job[8]: AssertionError(LLM is not set)
Exception raised in Job[9]: AssertionError(LLM is not set)
Exception raised in Job[10]: AssertionError(LLM is not set)
Exception raised in Job[11]: AssertionError(LLM must be set)


In [16]:
df_ragas_scores

Unnamed: 0,user_input,retrieved_contexts,response,reference,faithfulness,answer_relevancy,context_precision,answer_correctness
0,"Em mới chia tay người yêu được 2 tháng, nhưng ...",[Question: Làm sao để quay trở lại? Tôi và em ...,Nghe cậu nói mà tớ thấy thương cậu ghê 🥺 Chia ...,Hãy cho phép bản thân được buồn. Đừng cố gắng ...,0.04878,0.84203,1.0,0.354633
1,Mình và người yêu mình yêu nhau được 2 năm rồi...,[Question: Mình với bồ mình quen nhau gần 2 nă...,Tớ hiểu cảm giác của cậu nè. Yêu lâu mà cứ đều...,Lên kế hoạch cho một chuyến đi ngắn ngày đến m...,0.5,0.831,1.0,0.273304
2,Em cảm thấy khó khăn khi mở lòng và tin tưởng ...,[Question: Em mong nhận được sự tư vấn của các...,"Tớ hiểu mà, sau những tổn thương từ gia đình t...",Thấu hiểu và chấp nhận quá khứ là bước đầu tiê...,1.0,0.891097,1.0,0.273067
