# RAG Fusion: 검색 결과 재순위화

이 노트북에서는 **여러 검색 결과를 통합하고 재순위화**하는 **RAG Fusion** 기법을 배웁니다.

## RAG Fusion이란?

**RAG Fusion**은 Multi-Query의 발전된 형태입니다.

### Multi-Query vs RAG Fusion

```
┌────────────────────────────────────────────────────────────────────┐
│                Multi-Query vs RAG Fusion                          │
├────────────────────────────────────────────────────────────────────┤
│                                                                    │
│   Multi-Query:                                                     │
│   쿼리 1 → 결과들  ┐                                               │
│   쿼리 2 → 결과들  ├──▶ 단순 합치기 (중복만 제거)                  │
│   쿼리 3 → 결과들  ┘                                               │
│                                                                    │
│   RAG Fusion:                                                      │
│   쿼리 1 → 결과들 (순위 포함) ┐                                    │
│   쿼리 2 → 결과들 (순위 포함) ├──▶ RRF로 점수 계산 ──▶ 재순위화   │
│   쿼리 3 → 결과들 (순위 포함) ┘                                    │
│                                                                    │
└────────────────────────────────────────────────────────────────────┘
```

## RRF (Reciprocal Rank Fusion)란?

**RRF**는 "상호 순위 융합"이라는 뜻입니다.

### RRF의 핵심 아이디어

> "여러 검색에서 **상위에 자주 나오는 문서**가 더 관련성이 높다!"

```
┌────────────────────────────────────────────────────────────────────┐
│                      RRF 점수 계산 예시                            │
├────────────────────────────────────────────────────────────────────┤
│                                                                    │
│   쿼리 1 검색 결과: [문서A(1위), 문서B(2위), 문서C(3위)]            │
│   쿼리 2 검색 결과: [문서B(1위), 문서A(2위), 문서D(3위)]            │
│   쿼리 3 검색 결과: [문서A(1위), 문서D(2위), 문서B(3위)]            │
│                                                                    │
│   RRF 점수 (k=60):                                                 │
│   • 문서A: 1/(1+60) + 1/(2+60) + 1/(1+60) = 0.049                  │
│   • 문서B: 1/(2+60) + 1/(1+60) + 1/(3+60) = 0.048                  │
│   • 문서D: 0 + 1/(3+60) + 1/(2+60) = 0.032                         │
│   • 문서C: 1/(3+60) + 0 + 0 = 0.016                                │
│                                                                    │
│   최종 순위: 문서A > 문서B > 문서D > 문서C                          │
│                                                                    │
└────────────────────────────────────────────────────────────────────┘
```

### RRF 공식

```
RRF 점수 = Σ (1 / (순위 + k))

• k = 60 (일반적으로 사용되는 값)
• 순위가 높을수록(숫자가 작을수록) 점수가 높음
• 여러 검색에서 상위에 나오면 점수가 누적됨
```

---

# 1. 환경 설정

In [None]:
!pip install -q langchain langchain-community langchain-postgres langchain-ollama langchain-text-splitters psycopg psycopg-binary

In [None]:
import subprocess
import time

!apt-get install -y zstd
!curl -fsSL https://ollama.com/install.sh | sh

subprocess.Popen(['ollama', 'serve'])
time.sleep(3)

!ollama pull llama3.2
!ollama pull nomic-embed-text

# 2. 벡터 저장소 준비

In [None]:
# 테스트 문서 생성
sample_text = '''고대 그리스 철학사

소크라테스(Socrates, BC 470-399)는 서양 철학의 창시자로 불립니다.
"너 자신을 알라"는 그의 유명한 가르침입니다.
소크라테스는 대화를 통해 진리를 탐구하는 문답법을 사용했습니다.

플라톤(Plato, BC 428-348)은 소크라테스의 제자였습니다.
그는 이데아론을 주장했는데, 현실 세계는 이상적인 형태(이데아)의 불완전한 복사본이라고 했습니다.
플라톤은 아카데미아라는 학교를 세웠습니다.

아리스토텔레스(Aristotle, BC 384-322)는 플라톤의 제자였습니다.
그는 논리학, 생물학, 윤리학 등 다양한 분야를 연구했습니다.
아리스토텔레스는 알렉산더 대왕의 스승이기도 했습니다.
'''

with open('./test.txt', 'w', encoding='utf-8') as f:
    f.write(sample_text)

print("test.txt 생성 완료")

In [None]:
from langchain_community.document_loaders import TextLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_ollama import OllamaEmbeddings, ChatOllama
from langchain_postgres.vectorstores import PGVector
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import chain

connection = 'postgresql+psycopg://langchain:langchain@localhost:6024/langchain'

# 문서 로드 및 분할
raw_documents = TextLoader('./test.txt', encoding='utf-8').load()
text_splitter = RecursiveCharacterTextSplitter(chunk_size=200, chunk_overlap=30)
documents = text_splitter.split_documents(raw_documents)

# 벡터 저장소 생성
embeddings_model = OllamaEmbeddings(model='nomic-embed-text')
db = PGVector.from_documents(documents, embeddings_model, connection=connection)
retriever = db.as_retriever(search_kwargs={'k': 5})

# LLM
llm = ChatOllama(model='llama3.2', temperature=0)

print(f"✅ 벡터 저장소 준비 완료 (문서 {len(documents)}개)")

# 3. 다중 쿼리 생성

In [None]:
# RAG Fusion용 쿼리 생성 프롬프트
prompt_rag_fusion = ChatPromptTemplate.from_template(
    '''
하나의 입력 쿼리를 기반으로 여러 개의 검색 쿼리를 생성하는 유용한 어시스턴트입니다.
다음과 관련된 여러 검색 쿼리를 영문으로 생성합니다: 
{question}

출력(쿼리 4개):
''')

def parse_queries_output(message):
    return message.content.split('\n')

# 쿼리 생성 체인
query_gen = prompt_rag_fusion | llm | parse_queries_output

print("✅ 쿼리 생성 체인 준비 완료")

In [None]:
# 쿼리 생성 테스트
query = '고대 그리스 철학사의 주요 인물은 누구인가요?'

generated_queries = query_gen.invoke(query)

print(f"원본 질문: {query}\n")
print("=== 생성된 검색 쿼리 ===")
for i, q in enumerate(generated_queries):
    if q.strip():
        print(f"{i+1}. {q}")

# 4. RRF (Reciprocal Rank Fusion) 구현

여러 검색 결과의 순위를 종합하여 최종 순위를 계산합니다.

In [None]:
def reciprocal_rank_fusion(results: list[list], k=60):
    """
    Reciprocal Rank Fusion (RRF) 알고리즘
    
    여러 검색 결과 목록을 받아서 RRF 점수를 계산하고
    점수가 높은 순서대로 문서를 정렬하여 반환합니다.
    
    Parameters:
    - results: 검색 결과 목록들 [[결과1], [결과2], ...]
    - k: RRF 공식의 파라미터 (기본값 60)
    
    Returns:
    - 재순위화된 문서 목록
    """
    # 점수와 문서를 저장할 딕셔너리
    fused_scores = {}  # {문서내용: 점수}
    documents = {}     # {문서내용: 문서객체}
    
    # 각 검색 결과 순회
    for docs in results:
        # 각 문서와 순위(0부터 시작) 순회
        for rank, doc in enumerate(docs):
            doc_str = doc.page_content
            
            # 처음 보는 문서면 초기화
            if doc_str not in fused_scores:
                fused_scores[doc_str] = 0
                documents[doc_str] = doc
            
            # RRF 점수 누적: 1 / (순위 + k)
            fused_scores[doc_str] += 1 / (rank + k)
    
    # 점수 기준 내림차순 정렬
    reranked_doc_strs = sorted(
        fused_scores, 
        key=lambda d: fused_scores[d], 
        reverse=True
    )
    
    # 정렬된 문서 객체 반환
    return [documents[doc_str] for doc_str in reranked_doc_strs]

print("✅ RRF 함수 정의 완료")

# 5. RAG Fusion 검색 체인 구축

```
┌─────────────────────────────────────────────────────────────────────┐
│                  RAG Fusion 검색 체인 구조                          │
├─────────────────────────────────────────────────────────────────────┤
│                                                                     │
│   query_gen        retriever.batch       reciprocal_rank_fusion    │
│   ──────────▶     ──────────────▶       ───────────────────▶       │
│                                                                     │
│   쿼리 4개 생성     4개 쿼리 동시 검색     RRF로 순위 재조정          │
│                                                                     │
│   [쿼리1]           [결과1: A,B,C]       점수 계산 후                │
│   [쿼리2]    ──▶   [결과2: B,A,D]  ──▶  최종 순서 결정              │
│   [쿼리3]           [결과3: A,D,B]       [A > B > D > C]            │
│   [쿼리4]           [결과4: C,A,B]                                  │
│                                                                     │
└─────────────────────────────────────────────────────────────────────┘
```

In [None]:
# RAG Fusion 검색 체인
retrieval_chain = query_gen | retriever.batch | reciprocal_rank_fusion

print("✅ RAG Fusion 검색 체인 준비 완료")

In [None]:
# RAG Fusion 검색 테스트
result = retrieval_chain.invoke(query)

print(f"검색된 문서 수: {len(result)}개\n")
print("=== 재순위화된 검색 결과 (RRF 점수 순) ===")
print(f"\n[1위 문서]")
print(result[0].page_content)

# 6. RAG Fusion 완성

In [None]:
# 답변 생성용 프롬프트
prompt = ChatPromptTemplate.from_template(
    '''
다음 컨텍스트만 사용해 질문에 답하세요.
컨텍스트:{context}

질문: {question}
'''
)

@chain
def rag_fusion(input):
    """
    RAG Fusion 체인
    
    1. 입력 질문으로 여러 검색 쿼리 생성
    2. 여러 쿼리로 동시 검색
    3. RRF로 검색 결과 재순위화
    4. 최상위 문서들로 답변 생성
    """
    # RAG Fusion 검색
    docs = retrieval_chain.invoke(input)
    
    # 답변 생성
    formatted = prompt.invoke({'context': docs, 'question': input})
    answer = llm.invoke(formatted)
    
    return answer

print("✅ RAG Fusion 체인 준비 완료")

In [None]:
# RAG Fusion 실행
print("=== RAG Fusion 실행 ===")
print(f"질문: {query}\n")

result = rag_fusion.invoke(query)

print("=== 답변 ===")
print(result.content)

# 7. 다양한 질문으로 테스트

In [None]:
questions = [
    "플라톤의 철학 사상은 무엇인가요?",
    "소크라테스와 플라톤의 관계는?",
    "아리스토텔레스는 무엇을 연구했나요?"
]

for q in questions:
    print(f"\n{'='*60}")
    print(f"질문: {q}")
    print("="*60)
    result = rag_fusion.invoke(q)
    print(f"\n답변: {result.content}")

---

## 정리: RAG Fusion

### Multi-Query vs RAG Fusion 비교

| 항목 | Multi-Query | RAG Fusion |
|------|-------------|------------|
| 검색 방식 | 여러 쿼리로 검색 | 여러 쿼리로 검색 |
| 결과 처리 | 단순 중복 제거 | RRF로 재순위화 |
| 장점 | 구현 간단 | 더 관련성 높은 결과 |
| 적용 사례 | 일반적인 검색 | 정확도가 중요한 검색 |

### RRF 공식

```
RRF(d) = Σ 1/(rank_i + k)

d: 문서
rank_i: i번째 검색에서의 순위
k: 상수 (보통 60)
```

### 핵심 코드

```python
def reciprocal_rank_fusion(results, k=60):
    fused_scores = {}
    for docs in results:
        for rank, doc in enumerate(docs):
            fused_scores[doc] += 1 / (rank + k)
    return sorted(fused_scores, reverse=True)

# RAG Fusion 검색 체인
retrieval_chain = query_gen | retriever.batch | reciprocal_rank_fusion
```

## 코드 변경점 (OpenAI → Ollama)

```python
# 원본
llm = ChatOpenAI(model='gpt-4o-mini', temperature=0)

# 변경
llm = ChatOllama(model='llama3.2', temperature=0)
```

## 다음 단계

**가상의 답변 문서를 먼저 생성**하여 검색하는 **HyDE (Hypothetical Document Embeddings)** 기법을 배웁니다. (15-17번 노트북)