# RAGAS 테스트 01 - 기본 RAG 평가

이 노트북은 RAGAS를 사용한 기본적인 RAG 시스템 평가를 수행합니다.


In [None]:
import pandas as pd
import numpy as np
from ragas import evaluate
from ragas.metrics import (
    faithfulness,
    answer_relevancy,
    context_precision,
    context_recall
)
from datasets import Dataset

print("RAGAS 테스트 01 시작")


In [None]:
# 테스트 데이터 준비
test_data = {
    "question": [
        "KB 동반성장협약 상생대출이 무엇인가요?",
        "KB 스마트론 대출 조건은 무엇인가요?",
        "KB 닥터론 신청 방법을 알려주세요"
    ],
    "answer": [
        "KB 동반성장협약 상생대출은 중소기업과의 상생을 위한 특별 대출 상품입니다.",
        "KB 스마트론은 온라인 신청이 가능한 간편 대출 상품입니다.",
        "KB 닥터론은 의료진을 위한 전용 대출 상품으로 온라인 신청이 가능합니다."
    ],
    "contexts": [
        ["동반성장협약 관련 문서 내용"],
        ["스마트론 관련 문서 내용"],
        ["닥터론 관련 문서 내용"]
    ],
    "ground_truths": [
        ["동반성장협약 상생대출은 중소기업 지원을 위한 대출"],
        ["스마트론은 온라인 간편 대출 상품"],
        ["닥터론은 의료진 전용 대출 상품"]
    ]
}

dataset = Dataset.from_dict(test_data)
print(f"테스트 데이터셋 생성 완료: {len(dataset)}개 샘플")


In [None]:
# RAGAS 평가 실행
result = evaluate(
    dataset,
    metrics=[
        faithfulness,
        answer_relevancy,
        context_precision,
        context_recall
    ]
)

print("평가 결과:")
print(result)
