In [1]:
# !pip install langchain-opentutorial

In [2]:
from dotenv import load_dotenv

load_dotenv()

True

In [3]:
from langchain_teddynote import logging

logging.langsmith("CH15-Agentic-RAG")

LangSmith 추적을 시작합니다.
[프로젝트명]
CH15-Agentic-RAG


# Agentic RAG

= NaiveRAG + RelevanceCheck + WebSearch + QueryRewrite


In [4]:
# Core imports
from typing import Annotated, Literal, Sequence, TypedDict
from pydantic import BaseModel, Field

# LangChain imports
from langchain import hub
from langchain_core.messages import BaseMessage, HumanMessage
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import PromptTemplate
from langchain_core.runnables import RunnableConfig
from langchain_core.tools.retriever import create_retriever_tool
from langchain_openai import ChatOpenAI

# LangGraph imports
from langgraph.graph import END, START, StateGraph
from langgraph.graph.message import add_messages
from langgraph.prebuilt import ToolNode, tools_condition

# Custom imports
from langchain_opentutorial.rag.pdf import PDFRetrievalChain
from langchain_teddynote.messages import random_uuid, stream_graph
from langchain_teddynote.models import LLMs, get_model_name

## 1. 데이터 및 설정


In [5]:
# 파일 경로 설정
file_path = ["data/SPRi AI Brief_Special_AI Agent_241209_F.pdf"]

In [6]:
# PDF 체인 생성
pdf_file = PDFRetrievalChain(file_path).create_chain()
pdf_retriever = pdf_file.retriever
pdf_chain = pdf_file.chain

In [7]:
# PDF 문서를 기반으로 검색 도구 생성
retriever_tool = create_retriever_tool(
    pdf_retriever,
    "pdf_retriever",
    "Search and return information about SPRI AI Brief PDF file. It contains useful information on recent AI Agent trends. The document is published on Dec 2024.",
    document_prompt=PromptTemplate.from_template(
        "<document><context>{page_content}</context><metadata><source>{source}</source><page>{page}</page></metadata></document>"
    ),
)

# 생성된 검색 도구를 도구 리스트에 추가
tools = [retriever_tool]

## 2. 상태 및 모델 정의


In [8]:
class AgentState(TypedDict):
    """에이전트 상태 정의"""

    # add_messages reducer 함수를 사용하여 메시지 시퀀스를 관리
    messages: Annotated[Sequence[BaseMessage], add_messages]

In [9]:
# 최신 모델이름 가져오기
MODEL_NAME = get_model_name(LLMs.GPT4)

In [10]:
class Grade(BaseModel):
    """관련성 평가를 위한 이진 점수 모델"""

    binary_score: str = Field(
        description="Response 'yes' if the document is relevant to the question or 'no' if it is not."
    )

## 3. 노드 함수 정의


In [11]:
def grade_documents(state) -> Literal["generate", "rewrite"]:
    """문서 관련성 평가 함수"""
    # LLM 모델 초기화
    model = ChatOpenAI(temperature=0, model=MODEL_NAME, streaming=True)

    # 구조화된 출력을 위한 LLM 설정
    llm_with_tool = model.with_structured_output(Grade)

    # 프롬프트 템플릿 정의
    prompt = PromptTemplate(
        template="""You are a grader assessing relevance of a retrieved document to a user question. \\n 
        Here is the retrieved document: \\n\\n {context} \\n\\n
        Here is the user question: {question} \\n
        If the document contains keyword(s) or semantic meaning related to the user question, grade it as relevant. \\n
        Give a binary score 'yes' or 'no' score to indicate whether the document is relevant to the question.""",
        input_variables=["context", "question"],
    )

    # llm + tool 바인딩 체인 생성
    chain = prompt | llm_with_tool

    # 현재 상태에서 메시지 추출
    messages = state["messages"]
    last_message = messages[-1]
    question = messages[0].content

    # 검색된 문서 추출
    retrieved_docs = last_message.content

    # 관련성 평가 실행
    scored_result = chain.invoke({"question": question, "context": retrieved_docs})

    # 관련성 여부 추출
    score = scored_result.binary_score

    # 관련성 여부에 따른 결정
    if score == "yes":
        print("==== [DECISION: DOCS RELEVANT] ====")
        return "generate"
    else:
        print("==== [DECISION: DOCS NOT RELEVANT] ====")
        print(score)
        return "rewrite"

In [12]:
def agent(state):
    """에이전트 노드 함수"""
    # 현재 상태에서 메시지 추출
    messages = state["messages"]

    # LLM 모델 초기화
    model = ChatOpenAI(temperature=0, streaming=True, model=MODEL_NAME)

    # retriever tool 바인딩
    model = model.bind_tools(tools)

    # 에이전트 응답 생성
    response = model.invoke(messages)

    # 기존 리스트에 추가되므로 리스트 형태로 반환
    return {"messages": [response]}

In [13]:
def rewrite(state):
    """질문 재작성 노드 함수"""
    print("==== [QUERY REWRITE] ====")
    # 현재 상태에서 메시지 추출
    messages = state["messages"]
    # 원래 질문 추출
    question = messages[0].content

    # 질문 개선을 위한 프롬프트 구성
    msg = [
        HumanMessage(
            content=f""" \\n 
    Look at the input and try to reason about the underlying semantic intent / meaning. \\n 
    Here is the initial question:
    \\n ------- \\n

    {question} 
    \\n ------- \\n

    Formulate an improved question: """,
        )
    ]

    # LLM 모델로 질문 개선
    model = ChatOpenAI(temperature=0, model=MODEL_NAME, streaming=True)
    # Query-Transform 체인 실행
    response = model.invoke(msg)

    # 재작성된 질문 반환
    return {"messages": [response]}

In [14]:
def generate(state):
    """최종 답변 생성 노드 함수"""
    # 현재 상태에서 메시지 추출
    messages = state["messages"]

    # 원래 질문 추출
    question = messages[0].content

    # 가장 마지막 메시지 추출
    docs = messages[-1].content

    # RAG 프롬프트 템플릿 가져오기
    prompt = hub.pull("teddynote/rag-prompt")

    # LLM 모델 초기화
    llm = ChatOpenAI(model_name=MODEL_NAME, temperature=0, streaming=True)

    # RAG 체인 구성
    rag_chain = prompt | llm | StrOutputParser()

    # 답변 생성 실행
    response = rag_chain.invoke({"context": docs, "question": question})
    return {"messages": [response]}

## 4. 그래프 구성


In [15]:
# 워크플로우 생성
workflow = StateGraph(AgentState)

# 노드 추가
workflow.add_node("agent", agent)  # 에이전트 노드
retrieve = ToolNode([retriever_tool])
workflow.add_node("retrieve", retrieve)  # 검색 노드
workflow.add_node("rewrite", rewrite)  # 질문 재작성 노드
workflow.add_node("generate", generate)  # 관련 문서 확인 후 응답 생성 노드

# 엣지 추가
workflow.add_edge(START, "agent")

workflow.add_conditional_edges(
    "agent",
    tools_condition,
    {
        "tools": "retrieve",
        END: END,
    },
)

workflow.add_conditional_edges(
    "retrieve",
    grade_documents,
)

workflow.add_edge("generate", END)
workflow.add_edge("rewrite", "agent")

# 그래프 컴파일
graph = workflow.compile()

In [16]:
from langchain_teddynote.graphs import visualize_graph

visualize_graph(graph)

[ERROR] Visualize Graph Error: Failed to render the graph using the Mermaid.INK API. Status code: 502.


In [20]:
print(graph.get_graph().draw_ascii())

                    +-----------+                
                    | __start__ |                
                    +-----------+                
                           *                     
                           *                     
                           *                     
                      +-------+                  
                      | agent |.                 
                   ...+-------+ ....             
                ...        *        ....         
            ....           *            ...      
          ..               *               ....  
+----------+               *                   ..
| retrieve |               *                    .
+----------+....           *                    .
      .         ...        *                    .
      .            ....    *                    .
      .                ..  *                    .
+----------+          +---------+              ..
| generate |          | rewrite |          ....  


## 5. 그래프 실행


In [17]:
# 설정 초기화
config = RunnableConfig(recursion_limit=20, configurable={"thread_id": random_uuid()})

In [18]:
# 문서 검색 기반 질문
inputs = {
    "messages": [
        ("user", "구글이 진행하고 있는 Project Astra는 무엇?"),
    ]
}

# 그래프 실행
stream_graph(graph, inputs, config, ["agent", "rewrite", "generate"])


🔄 Node: [1;36magent[0m 🔄
- - - - - - - - - - - - - - - - - - - - - - - - - 
==== [DECISION: DOCS RELEVANT] ====

🔄 Node: [1;36mgenerate[0m 🔄
- - - - - - - - - - - - - - - - - - - - - - - - - 
구글의 Project Astra는 보편적인 AI 에이전트를 개발하는 프로젝트로, AI 기술을 활용하여 사용자 경험을 극대화하고 다양한 산업에 적용 가능한 AI 에이전트를 제공하는 것을 목표로 합니다. 이 프로젝트는 다중모드 정보를 처리하고 사용자의 상황을 이해하며 자연스럽게 대화할 수 있는 AI 어시스턴트를 탐구합니다.

**Source**
- data/SPRi AI Brief_Special_AI Agent_241209_F.pdf (page 6)
- data/SPRi AI Brief_Special_AI Agent_241209_F.pdf (page 7)
- data/SPRi AI Brief_Special_AI Agent_241209_F.pdf (page 8)

In [19]:
# 문서 검색이 안되는 질문
inputs = {
    "messages": [
        ("user", "도널드 트럼프 대통령"),
    ]
}

stream_graph(graph, inputs, config, ["agent", "rewrite", "generate"])


🔄 Node: [1;36magent[0m 🔄
- - - - - - - - - - - - - - - - - - - - - - - - - 
==== [DECISION: DOCS NOT RELEVANT] ====
no
==== [QUERY REWRITE] ====

🔄 Node: [1;36mrewrite[0m 🔄
- - - - - - - - - - - - - - - - - - - - - - - - - 
What are the key policies and actions of President Donald Trump during his time in office?
🔄 Node: [1;36magent[0m 🔄
- - - - - - - - - - - - - - - - - - - - - - - - - 
==== [DECISION: DOCS NOT RELEVANT] ====
no
==== [QUERY REWRITE] ====

🔄 Node: [1;36mrewrite[0m 🔄
- - - - - - - - - - - - - - - - - - - - - - - - - 
What are the key policies and actions of President Donald Trump during his time in office?
🔄 Node: [1;36magent[0m 🔄
- - - - - - - - - - - - - - - - - - - - - - - - - 
During his presidency, Donald Trump implemented a range of key policies and actions across various domains. Here are some notable ones:

1. **Economic Policies**:
   - **Tax Cuts and Jobs Act (2017)**: This legislation reduced the corporate tax rate from 35% to 21% and aimed to stim

** End of Documents **