# HEALO RAG Evaluation - Google Colab

이 노트북은 HEALO RAG 시스템의 성능을 평가합니다.

## 평가 항목
- 가상의 의료 문의 200개 (다국어 혼합)
- 일반 LLM vs HEALO RAG + 정규화 비교
- Intent Match / Grounding 평가

## 1. 패키지 설치

In [None]:
# 필수 패키지 설치
!pip install openai google-generativeai supabase pandas -q
print("✅ Packages installed")

## 2. 환경 변수 설정

아래 셀에서 API 키를 설정하세요.

In [None]:
import os

# LLM Provider (openai 또는 google)
os.environ["LLM_PROVIDER"] = "openai"  # 또는 "google"

# OpenAI API Key (LLM_PROVIDER=openai인 경우)
os.environ["OPENAI_API_KEY"] = "your_openai_api_key_here"

# Google Generative AI API Key (LLM_PROVIDER=google인 경우)
os.environ["GOOGLE_GENERATIVE_AI_API_KEY"] = "your_google_api_key_here"

# Supabase (필수)
os.environ["SUPABASE_URL"] = "your_supabase_url_here"
os.environ["SUPABASE_SERVICE_KEY"] = "your_service_role_key_here"

print("✅ Environment variables set")

## 3. 평가 스크립트 로드

In [None]:
# evaluation_colab.py 파일을 업로드하거나, 아래 셀에 직접 코드를 붙여넣으세요
# 또는 GitHub에서 직접 로드:
# !wget https://raw.githubusercontent.com/your-repo/HEALO_Demo/main/scripts/evaluation_colab.py

# 스크립트를 실행
# exec(open('evaluation_colab.py').read())

## 4. 평가 실행

아래 셀에 `evaluation_colab.py`의 전체 코드를 붙여넣고 실행하세요.

또는 파일을 업로드한 경우:
```python
exec(open('evaluation_colab.py').read())
results, csv_path = main()
```

In [None]:
# evaluation_colab.py의 전체 코드를 여기에 붙여넣으세요
# 또는 파일을 업로드한 경우:
# exec(open('evaluation_colab.py').read())
# results, csv_path = main()

## 5. 결과 확인

In [None]:
# pandas가 설치되어 있는지 확인
try:
    import pandas as pd
    print("✅ pandas imported successfully")
except ImportError:
    print("❌ pandas not found. Installing...")
    !pip install pandas
    import pandas as pd

# CSV 파일 읽기
try:
    df = pd.read_csv(csv_path)
    print(f"✅ CSV loaded: {len(df)} rows")
    
    # 샘플 결과 확인
    print("\nSample Results:")
    print(df.head())
    
    # 통계
    print("\nStatistics:")
    # boolean 값을 숫자로 변환해서 계산
    df['intent_match_baseline'] = df['intent_match_baseline'].map({'true': True, 'false': False, True: True, False: False})
    df['intent_match_rag'] = df['intent_match_rag'].map({'true': True, 'false': False, True: True, False: False})
    df['grounding_rag'] = df['grounding_rag'].map({'true': True, 'false': False, True: True, False: False})
    
    print(f"Intent Match (Baseline): {df['intent_match_baseline'].mean()*100:.1f}%")
    print(f"Intent Match (RAG): {df['intent_match_rag'].mean()*100:.1f}%")
    print(f"Grounding (RAG): {df['grounding_rag'].mean()*100:.1f}%")
except FileNotFoundError:
    print(f"❌ CSV file not found: {csv_path}")
    print("Make sure you ran the evaluation script first.")
except Exception as e:
    print(f"❌ Error reading CSV: {str(e)}")

## 6. 결과 다운로드

In [None]:
from google.colab import files

# CSV 파일 다운로드
files.download(csv_path)