In [1]:
import sys
import os
# Thêm thư mục gốc của project vào sys.path
sys.path.append(os.path.abspath(os.path.join(os.getcwd(), '..')))

In [5]:
from utils.api_client import RAGAPIClient
# Initialize API client
api_client = RAGAPIClient(base_url="http://localhost:8000")

# Check if API is available
if not api_client.check_health():
    print("⚠️ RAG API is not available at http://localhost:8000")
    print("Please start the RAG service first!")
else:
    print("✅ RAG API is available")

[32m2025-11-13 12:22:08.350[0m | [1mINFO    [0m | [36mutils.api_client[0m:[36m__init__[0m:[36m28[0m - [1mInitialized RAG API Client: http://localhost:8000/api/v1[0m


✅ RAG API is available


In [17]:
import json
file_path = "../data/questions.json"

# Đọc file JSON
with open(file_path, "r", encoding="utf-8") as f:
    questions = json.load(f)

# In ra dữ liệu đã load
print(questions)

[{'question_id': 'Q001', 'question': 'Ngành Kỹ thuật Máy tính có thể làm những công việc gì sau khi tốt nghiệp?'}, {'question_id': 'Q002', 'question': 'Chương trình Kỹ thuật Máy tính có bao nhiêu tín chỉ tổng cộng, phân bổ giữa các khối kiến thức chính như thế nào?'}, {'question_id': 'Q003', 'question': 'Sinh viên mới vào học nên theo thứ tự học những môn nền tảng nào trong hai năm đầu để có nền tảng vững về lập trình, cấu trúc dữ liệu, hệ điều hành và kiến trúc máy tính?'}, {'question_id': 'Q004', 'question': 'Nếu em muốn theo hướng Hệ thống nhúng/IoT thì yêu cầu học những môn gì và kế hoạch ra sao?'}, {'question_id': 'Q005', 'question': 'Ngành này có những định hướng chuyên ngành tự chọn nào?'}, {'question_id': 'Q006', 'question': "Môn 'Thực tập doanh nghiệp' (CE502) có bắt buộc không? Có thể đổi sang hình thức khác không?"}, {'question_id': 'Q007', 'question': 'Nếu em muốn theo hướng Hệ thống nhúng/IoT hoặc hướng Robotics & AI thì nên chọn những môn tự chọn nào, và mỗi hướng yêu cầu

In [None]:
rag_responses = []
# Generate answers for first N test cases
for i, tc in enumerate(questions):
    question_id = tc['question_id']
    question = tc['question']
    print(f"[{question_id}] Generating answer for: {question[:50]}...")
    
    try:
        # Call RAG API
        response = api_client.ask_question(question)
        formatted = api_client.format_response(response)
        
        # Store result
        rag_responses.append({
            'question_id':question_id,
            'question': question,
            'answer': formatted['answer'],
            'contexts': formatted['sources'],
            'processing_time': formatted['processing_time']
        })
        
        print(f"  ✅ Got answer ({len(formatted['answer'])} chars)")
        
    except Exception as e:
        print(f"  ❌ Error: {e}")
        rag_responses.append({
            'question_id': tc['id'],
            'question': question,
            'answer': '',
            'contexts': [],
            'error': str(e)
        })

print(f"\n✅ Generated {len([r for r in rag_responses if r.get('answer')])} answers")

[32m2025-11-13 12:33:07.459[0m | [1mINFO    [0m | [36mutils.api_client[0m:[36mask_question[0m:[36m50[0m - [1mAsking question: Ngành Kỹ thuật Máy tính có thể làm những công việc...[0m


[Q001] Generating answer for: Ngành Kỹ thuật Máy tính có thể làm những công việc...


[32m2025-11-13 12:33:24.839[0m | [1mINFO    [0m | [36mutils.api_client[0m:[36mask_question[0m:[36m59[0m - [1mGot response in 17.36s[0m
[32m2025-11-13 12:33:24.841[0m | [1mINFO    [0m | [36mutils.api_client[0m:[36mask_question[0m:[36m50[0m - [1mAsking question: Chương trình Kỹ thuật Máy tính có bao nhiêu tín ch...[0m


  ✅ Got answer (650 chars)
[Q002] Generating answer for: Chương trình Kỹ thuật Máy tính có bao nhiêu tín ch...


[32m2025-11-13 12:33:35.591[0m | [1mINFO    [0m | [36mutils.api_client[0m:[36mask_question[0m:[36m59[0m - [1mGot response in 10.74s[0m
[32m2025-11-13 12:33:35.592[0m | [1mINFO    [0m | [36mutils.api_client[0m:[36mask_question[0m:[36m50[0m - [1mAsking question: Sinh viên mới vào học nên theo thứ tự học những mô...[0m


  ✅ Got answer (52 chars)
[Q003] Generating answer for: Sinh viên mới vào học nên theo thứ tự học những mô...


[32m2025-11-13 12:33:52.631[0m | [1mINFO    [0m | [36mutils.api_client[0m:[36mask_question[0m:[36m59[0m - [1mGot response in 17.02s[0m
[32m2025-11-13 12:33:52.632[0m | [1mINFO    [0m | [36mutils.api_client[0m:[36mask_question[0m:[36m50[0m - [1mAsking question: Nếu em muốn theo hướng Hệ thống nhúng/IoT thì yêu ...[0m


  ✅ Got answer (561 chars)
[Q004] Generating answer for: Nếu em muốn theo hướng Hệ thống nhúng/IoT thì yêu ...


[32m2025-11-13 12:34:13.819[0m | [1mINFO    [0m | [36mutils.api_client[0m:[36mask_question[0m:[36m59[0m - [1mGot response in 21.18s[0m
[32m2025-11-13 12:34:13.819[0m | [1mINFO    [0m | [36mutils.api_client[0m:[36mask_question[0m:[36m50[0m - [1mAsking question: Ngành này có những định hướng chuyên ngành tự chọn...[0m


  ✅ Got answer (611 chars)
[Q005] Generating answer for: Ngành này có những định hướng chuyên ngành tự chọn...


[32m2025-11-13 12:34:29.959[0m | [1mINFO    [0m | [36mutils.api_client[0m:[36mask_question[0m:[36m59[0m - [1mGot response in 16.13s[0m
[32m2025-11-13 12:34:29.959[0m | [1mINFO    [0m | [36mutils.api_client[0m:[36mask_question[0m:[36m50[0m - [1mAsking question: Môn 'Thực tập doanh nghiệp' (CE502) có bắt buộc kh...[0m


  ✅ Got answer (534 chars)
[Q006] Generating answer for: Môn 'Thực tập doanh nghiệp' (CE502) có bắt buộc kh...


[32m2025-11-13 12:34:45.305[0m | [1mINFO    [0m | [36mutils.api_client[0m:[36mask_question[0m:[36m59[0m - [1mGot response in 15.33s[0m
[32m2025-11-13 12:34:45.306[0m | [1mINFO    [0m | [36mutils.api_client[0m:[36mask_question[0m:[36m50[0m - [1mAsking question: Nếu em muốn theo hướng Hệ thống nhúng/IoT hoặc hướ...[0m


  ✅ Got answer (426 chars)
[Q007] Generating answer for: Nếu em muốn theo hướng Hệ thống nhúng/IoT hoặc hướ...


[32m2025-11-13 12:35:14.189[0m | [1mINFO    [0m | [36mutils.api_client[0m:[36mask_question[0m:[36m59[0m - [1mGot response in 28.87s[0m
[32m2025-11-13 12:35:14.191[0m | [1mINFO    [0m | [36mutils.api_client[0m:[36mask_question[0m:[36m50[0m - [1mAsking question: Chương trình có những phương thức tốt nghiệp nào? ...[0m


  ✅ Got answer (2022 chars)
[Q008] Generating answer for: Chương trình có những phương thức tốt nghiệp nào? ...


[32m2025-11-13 12:35:25.381[0m | [1mINFO    [0m | [36mutils.api_client[0m:[36mask_question[0m:[36m59[0m - [1mGot response in 11.18s[0m
[32m2025-11-13 12:35:25.381[0m | [1mINFO    [0m | [36mutils.api_client[0m:[36mask_question[0m:[36m50[0m - [1mAsking question: Nếu một sinh viên muốn thay Khóa luận (CE505) bằng...[0m


  ✅ Got answer (52 chars)
[Q009] Generating answer for: Nếu một sinh viên muốn thay Khóa luận (CE505) bằng...


[32m2025-11-13 12:35:51.250[0m | [1mINFO    [0m | [36mutils.api_client[0m:[36mask_question[0m:[36m59[0m - [1mGot response in 25.86s[0m
[32m2025-11-13 12:35:51.252[0m | [1mINFO    [0m | [36mutils.api_client[0m:[36mask_question[0m:[36m50[0m - [1mAsking question: Ngành Kỹ thuật máy tính chương trình đại trà học t...[0m


  ✅ Got answer (1321 chars)
[Q010] Generating answer for: Ngành Kỹ thuật máy tính chương trình đại trà học t...


[32m2025-11-13 12:36:01.089[0m | [1mINFO    [0m | [36mutils.api_client[0m:[36mask_question[0m:[36m59[0m - [1mGot response in 9.82s[0m


  ✅ Got answer (52 chars)

✅ Generated 10 answers


In [16]:
rag_responses

[{'testcase_id': {'Q001'},
  'question': 'Ngành Kỹ thuật Máy tính có thể làm những công việc gì sau khi tốt nghiệp?',
  'answer': 'Dựa trên các tài liệu được cung cấp, sinh viên tốt nghiệp ngành Cử nhân Công nghệ Thông tin có thể làm việc trong nhiều phạm vi và lĩnh vực khác nhau, bao gồm:\n\n| Công việc sau tốt nghiệp |\n|---|\n| Tham mưu, tư vấn |\n| Tổ chức thực hiện nhiệm vụ với tư cách của một chuyên viên trong lĩnh vực CNTT |\n| Nghiên cứu phát triển và ứng dụng công nghệ thông tin |\n\n**Lưu ý:**  Các tài liệu cung cấp thông tin chung về khả năng làm việc sau tốt nghiệp, không chi tiết về các vị trí cụ thể.',
  'contexts': [{'score': 13.901946,
    'doc_id': 'd3f2c2f8-a16a-4d6b-a53c-d6157afce5d4',
    'chunk_index': 13,
    'content': 'Sinh viên tốt nghiệp Chương trình đào tạo Cử nhân chính quy ngành Công nghệ Thông tin Việt – Nhật có khả năng làm việc ở những phạm vi và lĩnh vực khác nhau như:',
    'title': 'Cử Nhân Công Nghệ Thông Tin Nhật - 1.2. Vị trí và khả năng làm việc s

In [14]:
def convert_sets(obj):
    if isinstance(obj, set):
        return list(obj)
    elif isinstance(obj, dict):
        return {k: convert_sets(v) for k, v in obj.items()}
    elif isinstance(obj, list):
        return [convert_sets(x) for x in obj]
    else:
        return obj

rag_responses_jsonable = convert_sets(rag_responses)

In [20]:
output_path = "../data/rag_results.json"

# Ghi ra JSON với định dạng đẹp
with open(output_path, "w", encoding="utf-8-sig") as f:
    json.dump(rag_responses, f, ensure_ascii=False, indent=2)

print(f"✅ Saved {len(rag_responses)} responses to {output_path}")

✅ Saved 10 responses to ../data/rag_results.json


In [2]:
import utils.convert_results_to_csv as convert_utils

In [3]:
convert_utils.convert_json_to_csv(
    json_file="../data/rag_results.json",
    csv_file="../data/rag_results.csv"
)

✅ Converted 10 queries to ../data/rag_results.csv
   Total rows: 50


In [8]:
import json
import csv
file_path = "../data/questions.json"

# Đọc file JSON
with open(file_path, "r", encoding="utf-8") as f:
    questions = json.load(f)

with open("questions.csv", "w", newline="", encoding="utf-8-sig") as csvfile:
    writer = csv.writer(csvfile)
    writer.writerow(["query"])
    for row in questions:
        writer.writerow([row["question"]])