### RRR(Rewrite-Retrieve-Read)

In [3]:
from langchain_community.document_loaders import TextLoader
from langchain_ollama import OllamaEmbeddings
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_postgres.vectorstores import PGVector
from langchain_ollama import ChatOllama
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import chain


connection = "postgresql+psycopg://langchain:langchain@localhost:6024/langchain"

# 문서를 로드 후 분할
raw_documents = TextLoader("../test.txt", encoding="utf-8").load()
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
documents = text_splitter.split_documents(raw_documents)

# 문서에 대한 임베딩 생성
embeddings_model = OllamaEmbeddings(model="nomic-embed-text")

db = PGVector.from_documents(documents, embeddings_model, connection=connection)

# 벡터 저장소에서 2개의 관련 문서 검색
retriever = db.as_retriever(search_kwargs={"k": 5})

In [4]:
# 관련 질문을 하기 전에 관련 없는 정보로 시작하는 쿼리
query = "일어나서 이를 닦고 뉴스를 읽었어요. 그러다 전자레인지에 음식을 넣어둔 걸 깜빡했네요. 고대 그리스 철학사의 주요 인물은 누구인가요?"

# 관련 문서 받아오기
docs = retriever.invoke(query)

print(docs[0].page_content)
print("\n\n")

V.





In [6]:
prompt = ChatPromptTemplate.from_template(
    """다음 컨텍스트만 사용해 질문에 답하세요.
컨텍스트:{context}

질문: {question}
"""
)

llm = ChatOllama(model="gemma3:1b", temperature=0)

llm_chain = prompt | llm
llm_chain.invoke({"context": docs, "question": query})

AIMessage(content='컨텍스트에 나와있는 정보는 없습니다.', additional_kwargs={}, response_metadata={'model': 'gemma3:1b', 'created_at': '2025-10-23T00:53:40.382544505Z', 'done': True, 'done_reason': 'stop', 'total_duration': 8619737645, 'load_duration': 2940083607, 'prompt_eval_count': 337, 'prompt_eval_duration': 5204626629, 'eval_count': 11, 'eval_duration': 455849747, 'model_name': 'gemma3:1b'}, id='run--852dffe3-adff-41e1-87fc-f7a265ba9983-0', usage_metadata={'input_tokens': 337, 'output_tokens': 11, 'total_tokens': 348})

In [7]:
rewrite_prompt = ChatPromptTemplate.from_template(
    """
웹 검색 엔진이 주어진 질문에 답할 수 있도록 더 나은 영문 검색어를 제공하세요. 쿼리는 \'**\'로 끝내세요. 

질문: {x} 

답변:
"""
)


def parse_rewriter_output(message):
    return message.content.strip("'").strip("**")


rewriter = rewrite_prompt | llm | parse_rewriter_output


@chain
def qa_rrr(input):
    # 쿼리 재작성
    new_query = rewriter.invoke(input)
    print("재작성한 쿼리: ", new_query)
    # 관련 문서 검색
    docs = retriever.invoke(new_query)
    # 프롬프트 포매팅
    formatted = prompt.invoke({"context": docs, "question": input})
    # 답변 생성
    answer = llm.invoke(formatted)
    return answer


print("\n재작성한 쿼리로 모델 호출\n")

# 재작성한 쿼리로 재실행
result = qa_rrr.invoke(query)
print(result.content)


재작성한 쿼리로 모델 호출

재작성한 쿼리:  Okay, let's rephrase the question to be more effective for a search engine. Here's a revised query:

**"Ancient Greek philosopher known for his contributions to logic and metaphysics, and who is the primary figure associated with the invention of the electronic reheat?"**

Here's why this is better:

* **Specificity:** It directly asks for a specific philosopher and their key contributions.
* **Context:** It includes "invention of the electronic reheat" to narrow the search to relevant information.
* **Keywords:** It uses keywords that search engines understand well (philosopher, logic, metaphysics, electronic reheat).

Would you like me to refine this further, perhaps by adding a timeframe or focusing on a particular aspect of the philosopher?
고대 그리스 철학사의 주요 인물은 사고를 깊이 하고, 세상의 본질을 탐구하며, 인간의 삶과 사회에 대한 통찰력을 제공한 **사고를 깊이 하고, 세상의 본질을 탐구하며, 인간의 삶과 사회에 대한 통찰력을 제공한 철학자**입니다.

이 질문에 답하기 위해, 컨텍스트에서 제시된 정보를 바탕으로 다음과 같이 답변할 수 있습니다.

*   **사고를 깊이 하고, 세상의 본질을 탐구하며, 인간의 삶

### 다중 쿼리 검색

In [8]:
# 다중 쿼리를 위한 프롬프트
perspectives_prompt = ChatPromptTemplate.from_template(
    """당신은 AI 언어 모델 어시스턴트입니다. 주어진 사용자 질문의 다섯 가지 버전을 생성하여 벡터 데이터베이스에서 관련 문서를 검색하세요. 
    사용자 질문에 대한 다양한 관점을 생성함으로써 사용자가 거리 기반 유사도 검색의 한계를 극복할 수 있도록 돕는 것이 목표입니다. 
    이러한 대체 질문을 개행으로 구분하여 제공하세요. 
    원래 질문: {question}"""
)

llm = ChatOllama(model="gemma3:1b")

In [9]:
def parse_queries_output(message):
    return message.content.split("\n")


query_gen = perspectives_prompt | llm | parse_queries_output


def get_unique_union(document_lists):
    # 목록 여러 개를 포함한 리스트를 평탄화하고 중복 제거
    deduped_docs = {
        doc.page_content: doc for sublist in document_lists for doc in sublist
    }
    # 고유한 문서만 반환
    return list(deduped_docs.values())


retrieval_chain = query_gen | retriever.batch | get_unique_union

In [10]:
prompt = ChatPromptTemplate.from_template(
    """
다음 컨텍스트만 사용해 질문에 답하세요.
컨텍스트:{context}

질문: {question}
"""
)

query = "고대 그리스 철학사의 주요 인물은 누구인가요?"

In [11]:
@chain
def multi_query_qa(input):
    docs = retrieval_chain.invoke(input)
    formatted = prompt.invoke({"context": docs, "question": input})
    answer = llm.invoke(formatted)
    return answer


# run
print("다중 쿼리 검색\n")
result = multi_query_qa.invoke(query)
print(result.content)

다중 쿼리 검색

컨텍스트에서 고대 그리스 철학사의 주요 인물은 다음과 같습니다.

*   Phidias
*   Polykleitos
*   Myron
*   Aristotle
