# Multi-Query: 다중 쿼리 검색

이 노트북에서는 **하나의 질문을 여러 관점으로 변형**하여 검색 범위를 넓히는 **Multi-Query** 기법을 배웁니다.

## 왜 Multi-Query가 필요할까요?

### 문제: 같은 의미, 다른 표현

사람들은 같은 것을 물을 때 다양한 방식으로 표현합니다.

```
┌────────────────────────────────────────────────────────────────────┐
│         같은 의미를 다르게 표현하는 예시                           │
├────────────────────────────────────────────────────────────────────┤
│                                                                    │
│   질문: "소크라테스는 누구인가요?"                                 │
│                                                                    │
│   다양한 표현:                                                     │
│   • "소크라테스에 대해 알려주세요"                                 │
│   • "소크라테스는 어떤 철학자였나요?"                              │
│   • "소크라테스의 생애와 사상은?"                                  │
│   • "Who was Socrates?"                                            │
│                                                                    │
│   → 문서가 특정 표현으로만 작성되어 있으면 검색 누락 발생!          │
│                                                                    │
└────────────────────────────────────────────────────────────────────┘
```

### 해결: 여러 버전의 질문으로 검색

```
┌────────────────────────────────────────────────────────────────────┐
│                    Multi-Query 검색 흐름                           │
├────────────────────────────────────────────────────────────────────┤
│                                                                    │
│   원본 질문        LLM이 변형         5개 쿼리로 검색              │
│   ──────────▶    ──────────▶       ──────────▶                    │
│                                                                    │
│   "소크라테스는     질문 1 ────▶ 결과 1  ┐                         │
│    누구인가요?"    질문 2 ────▶ 결과 2  │                         │
│                    질문 3 ────▶ 결과 3  ├──▶ 중복 제거 후 통합     │
│                    질문 4 ────▶ 결과 4  │                         │
│                    질문 5 ────▶ 결과 5  ┘                         │
│                                                                    │
│   → 더 많은 관련 문서를 찾을 수 있음!                              │
│                                                                    │
└────────────────────────────────────────────────────────────────────┘
```

---

# 1. 환경 설정

In [None]:
!pip install -q langchain langchain-community langchain-postgres langchain-ollama langchain-text-splitters psycopg psycopg-binary

In [None]:
import subprocess
import time

!apt-get install -y zstd
!curl -fsSL https://ollama.com/install.sh | sh

subprocess.Popen(['ollama', 'serve'])
time.sleep(3)

!ollama pull llama3.2
!ollama pull nomic-embed-text

# 2. 벡터 저장소 준비

In [None]:
# 테스트 문서 생성
sample_text = '''고대 그리스 철학사

소크라테스(Socrates, BC 470-399)는 서양 철학의 창시자로 불립니다.
"너 자신을 알라"는 그의 유명한 가르침입니다.
소크라테스는 대화를 통해 진리를 탐구하는 문답법을 사용했습니다.

플라톤(Plato, BC 428-348)은 소크라테스의 제자였습니다.
그는 이데아론을 주장했는데, 현실 세계는 이상적인 형태(이데아)의 불완전한 복사본이라고 했습니다.
플라톤은 아카데미아라는 학교를 세웠습니다.

아리스토텔레스(Aristotle, BC 384-322)는 플라톤의 제자였습니다.
그는 논리학, 생물학, 윤리학 등 다양한 분야를 연구했습니다.
아리스토텔레스는 알렉산더 대왕의 스승이기도 했습니다.

에피쿠로스(Epicurus, BC 341-270)는 쾌락주의 철학을 주장했습니다.
그러나 그가 말한 쾌락은 방탕이 아니라 마음의 평화를 의미했습니다.

스토아 학파는 제논(Zeno)이 창시했습니다.
스토아 철학은 감정을 다스리고 덕에 따라 사는 것을 강조했습니다.
'''

with open('./test.txt', 'w', encoding='utf-8') as f:
    f.write(sample_text)

print("test.txt 생성 완료")

In [None]:
from langchain_community.document_loaders import TextLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_ollama import OllamaEmbeddings, ChatOllama
from langchain_postgres.vectorstores import PGVector
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import chain

connection = 'postgresql+psycopg://langchain:langchain@localhost:6024/langchain'

# 문서 로드 및 분할
raw_documents = TextLoader('./test.txt', encoding='utf-8').load()
text_splitter = RecursiveCharacterTextSplitter(chunk_size=200, chunk_overlap=30)
documents = text_splitter.split_documents(raw_documents)

# 벡터 저장소 생성
embeddings_model = OllamaEmbeddings(model='nomic-embed-text')
db = PGVector.from_documents(documents, embeddings_model, connection=connection)

# 5개 문서 검색하는 Retriever
retriever = db.as_retriever(search_kwargs={'k': 5})

# LLM
llm = ChatOllama(model='llama3.2', temperature=0)

print(f"✅ 벡터 저장소 준비 완료 (문서 {len(documents)}개)")

# 3. Multi-Query 프롬프트 생성

LLM에게 "이 질문을 5가지 다른 방식으로 표현해달라"고 요청합니다.

In [None]:
# Multi-Query 생성 프롬프트
perspectives_prompt = ChatPromptTemplate.from_template(
    '''당신은 AI 언어 모델 어시스턴트입니다. 
주어진 사용자 질문의 다섯 가지 버전을 생성하여 벡터 데이터베이스에서 관련 문서를 검색하세요. 

사용자 질문에 대한 다양한 관점을 생성함으로써 
사용자가 거리 기반 유사도 검색의 한계를 극복할 수 있도록 돕는 것이 목표입니다. 

이러한 대체 질문을 개행으로 구분하여 제공하세요. 

원래 질문: {question}''')

# 출력 파싱 (줄바꿈으로 분리)
def parse_queries_output(message):
    return message.content.split('\n')

# 쿼리 생성 체인
query_gen = perspectives_prompt | llm | parse_queries_output

print("✅ Multi-Query 생성 체인 준비 완료")

In [None]:
# Multi-Query 생성 테스트
query = '고대 그리스 철학사의 주요 인물은 누구인가요?'

generated_queries = query_gen.invoke(query)

print(f"원본 질문: {query}\n")
print("=== 생성된 5가지 버전 ===")
for i, q in enumerate(generated_queries):
    if q.strip():  # 빈 줄 제외
        print(f"{i+1}. {q}")

# 4. 중복 제거 함수

여러 쿼리로 검색하면 같은 문서가 여러 번 나올 수 있습니다.
**중복을 제거**해야 합니다.

In [None]:
def get_unique_union(document_lists):
    """
    여러 검색 결과에서 중복을 제거하고 고유한 문서만 반환
    
    예시:
    입력: [[문서A, 문서B], [문서B, 문서C], [문서A, 문서D]]
    출력: [문서A, 문서B, 문서C, 문서D]  (중복 제거됨)
    """
    # 문서 내용을 키로 사용해 중복 제거
    deduped_docs = {}
    for sublist in document_lists:
        for doc in sublist:
            if doc.page_content not in deduped_docs:
                deduped_docs[doc.page_content] = doc
    
    return list(deduped_docs.values())

print("✅ 중복 제거 함수 준비 완료")

# 5. Multi-Query 검색 체인 구축

```
┌─────────────────────────────────────────────────────────────────────┐
│                Multi-Query 검색 체인 구조                          │
├─────────────────────────────────────────────────────────────────────┤
│                                                                     │
│   query_gen        retriever.batch       get_unique_union          │
│   ──────────▶     ──────────────▶       ─────────────▶             │
│                                                                     │
│   질문 5개 생성     5개 쿼리 동시 검색     중복 제거 후 통합          │
│                                                                     │
└─────────────────────────────────────────────────────────────────────┘
```

In [None]:
# Multi-Query 검색 체인
# query_gen: 5개 쿼리 생성
# retriever.batch: 5개 쿼리로 동시 검색
# get_unique_union: 중복 제거
retrieval_chain = query_gen | retriever.batch | get_unique_union

print("✅ Multi-Query 검색 체인 준비 완료")

In [None]:
# Multi-Query 검색 테스트
docs = retrieval_chain.invoke(query)

print(f"검색된 고유 문서 수: {len(docs)}개\n")
print("=== 검색된 문서들 ===")
for i, doc in enumerate(docs):
    print(f"\n[문서 {i+1}]")
    print(doc.page_content[:150] + "...")

# 6. Multi-Query RAG 완성

In [None]:
# 답변 생성용 프롬프트
prompt = ChatPromptTemplate.from_template(
    '''
다음 컨텍스트만 사용해 질문에 답하세요.
컨텍스트:{context}

질문: {question}
'''
)

@chain
def multi_query_qa(input):
    """
    Multi-Query RAG 체인
    
    1. 입력 질문을 5가지 버전으로 변형
    2. 5개 쿼리로 동시에 검색
    3. 중복 제거 후 통합
    4. 통합된 문서로 답변 생성
    """
    # Multi-Query 검색
    docs = retrieval_chain.invoke(input)
    
    # 답변 생성
    formatted = prompt.invoke({'context': docs, 'question': input})
    answer = llm.invoke(formatted)
    
    return answer

print("✅ Multi-Query RAG 체인 준비 완료")

In [None]:
# Multi-Query RAG 실행
print("=== Multi-Query RAG 실행 ===")
print(f"질문: {query}\n")

result = multi_query_qa.invoke(query)

print("=== 답변 ===")
print(result.content)

# 7. 일반 검색 vs Multi-Query 비교

In [None]:
# 일반 검색 (단일 쿼리)
@chain
def simple_qa(input):
    docs = retriever.invoke(input)
    formatted = prompt.invoke({'context': docs, 'question': input})
    answer = llm.invoke(formatted)
    return answer

print("=" * 60)
print("비교: 일반 검색 vs Multi-Query")
print("=" * 60)

test_query = "고대 그리스 철학의 다양한 학파에 대해 알려주세요"
print(f"\n질문: {test_query}\n")

print("--- 일반 검색 ---")
result_simple = simple_qa.invoke(test_query)
print(f"답변: {result_simple.content}\n")

print("--- Multi-Query 검색 ---")
result_multi = multi_query_qa.invoke(test_query)
print(f"답변: {result_multi.content}")

---

## 정리: Multi-Query 기법

### 장점과 단점

| 항목 | 설명 |
|------|------|
| **장점** | 다양한 관점에서 검색하여 누락 감소 |
| **장점** | 유사도 검색의 한계 극복 |
| **단점** | LLM 호출이 추가로 필요 (비용/시간) |
| **단점** | 검색량이 많아짐 |

### 핵심 코드

```python
# 1. 쿼리 생성 프롬프트
prompt = ChatPromptTemplate.from_template(
    '질문의 5가지 버전을 생성하세요: {question}'
)

# 2. 쿼리 생성 체인
query_gen = prompt | llm | parse_output

# 3. Multi-Query 검색 체인
retrieval_chain = query_gen | retriever.batch | get_unique_union

# 4. RAG 체인
@chain
def multi_query_qa(input):
    docs = retrieval_chain.invoke(input)
    answer = llm.invoke(...)
    return answer
```

## 코드 변경점 (OpenAI → Ollama)

```python
# 원본
llm = ChatOpenAI(model='gpt-4o-mini')

# 변경
llm = ChatOllama(model='llama3.2')
```

## 다음 단계

검색 결과의 **순위를 재조정**하여 더 관련성 높은 문서를 찾는 **RAG Fusion** 기법을 배웁니다. (12-14번 노트북)