# BM25 Retriever 테스트 (Keyword Search)

이 노트북은 `BM25Retriever`의 키워드 매칭, 토크나이저 동작, 필터링 기능을 독립적으로 검증합니다.

In [None]:
# 환경 설정
import sys
import os
from dotenv import load_dotenv

# 프로젝트 루트 경로 설정
project_root = os.path.abspath(os.path.join(os.getcwd(), "../.."))
sys.path.append(project_root)

load_dotenv(os.path.join(project_root, ".env"))
print(f"Project Root: {project_root}")

In [None]:
from src.retrieval.bm25_retriever import BM25Retriever

bm25 = BM25Retriever(version="v3", collection_name="care_guides")
print("✅ BM25Retriever initialized.")

## 1. 정확한 키워드 매칭 (Exact Match)

In [None]:
query = "메인쿤"
results = await bm25.search(query)

print(f"Query: {query}")
for i, r in enumerate(results):
    print(f"{i+1}. {r.get('name_ko')} (Score type: {r.get('score_type')})")

## 2. 없는 키워드 (No Match)
DB에 없는 단어(예: '갤럭시 캣')를 검색했을 때, 결과가 0건이어야 합니다.

In [None]:
query = "갤럭시 캣"
results = await bm25.search(query)

print(f"Query: {query}")
if not results:
    print("✅ 결과 없음 (예상대로 동작함)")
else:
    for i, r in enumerate(results):
        print(f"{i+1}. {r.get('name_ko')}")

## 3. 필터링 동작 (Filtering)
`specialist="Matchmaker"` 및 `categories="Breeds"` 필터가 정상 작동하는지 확인합니다.

In [None]:
query = "털 안빠지는 고양이"
results = await bm25.search(
    query, 
    specialist="Matchmaker", 
    filters={"categories": "Breeds"}
)

print(f"Query: {query} (Filter: Matchmaker/Breeds)")
for i, r in enumerate(results):
    print(f"{i+1}. {r.get('name_ko')} ({r.get('category', 'Unknown')})")