# ReAct Pattern with Local Ollama Model

ReAct (Reasoning + Acting) 패턴을 **로컬 Ollama 모델**을 사용하여 구현합니다.

## 사전 요구사항
1. [Ollama](https://ollama.ai/) 설치
2. 모델 다운로드: `ollama pull gemma3:4b`
3. Ollama 서버 실행 중 (기본: http://localhost:11434)

## 지원 모델 (도구 호출 지원)
- `gemma3:4b` (추천 - 경량, 빠름)
- `llama3.1`
- `llama3.2`
- `mistral`
- `qwen2.5`

## 1. 환경 설정

In [1]:
import os
from dotenv import load_dotenv

# .env 파일에서 환경변수 로드
load_dotenv()

# Ollama URL 설정 (기본값: localhost:11434)
OLLAMA_URL = os.getenv("OLLAMA_URL", "http://localhost:11434")
print(f"Ollama URL: {OLLAMA_URL}")

Ollama URL: http://localhost:11434


In [3]:
# Ollama 서버 연결 확인
import requests

try:
    response = requests.get(f"{OLLAMA_URL}/api/tags")
    if response.status_code == 200:
        models = response.json().get("models", [])
        print("Ollama 서버 연결 성공!")
        print(f"사용 가능한 모델: {[m['name'] for m in models]}")
    else:
        print(f"Ollama 서버 응답 오류: {response.status_code}")
except requests.exceptions.ConnectionError:
    print("Ollama 서버에 연결할 수 없습니다.")
    print("Ollama가 실행 중인지 확인해주세요: ollama serve")

Ollama 서버 연결 성공!
사용 가능한 모델: ['candiy:4b', 'candiy:12b', 'bge-m3:latest', 'sakak:8b', 'nomic-embed-text:latest', 'gemma3:12b', 'gemma3:4b', 'gemma3:1b', 'candiy:8b', 'candiy-insurance:8b', 'candiy:2b', 'aya:8b', 'llama3.2:1b', 'gemma2:2b']


## 2. 도구(Tools) 정의

ReAct 에이전트가 사용할 도구들을 정의합니다.

In [4]:
from langchain_core.tools import tool


@tool
def add(a: int, b: int) -> int:
    """Add two numbers together."""
    return a + b


@tool
def multiply(a: int, b: int) -> int:
    """Multiply two numbers together."""
    return a * b


@tool
def divide(a: int, b: int) -> float:
    """Divide the first number by the second number."""
    if b == 0:
        return "Error: Cannot divide by zero."
    return a / b


@tool
def get_weather(city: str) -> str:
    """Get the current weather for a city. (Simulation)"""
    weather_data = {
        "seoul": "Sunny, 15°C",
        "busan": "Cloudy, 18°C",
        "jeju": "Rainy, 20°C",
        "daejeon": "Sunny, 16°C",
        "new york": "Cloudy, 10°C",
        "tokyo": "Sunny, 22°C",
    }
    return weather_data.get(city.lower(), f"Weather data not found for {city}.")


# 사용할 도구 목록
tools = [add, multiply, divide, get_weather]
print(f"정의된 도구: {[t.name for t in tools]}")

정의된 도구: ['add', 'multiply', 'divide', 'get_weather']


## 3. LLM 설정 (Local Ollama)

도구 호출을 지원하는 로컬 모델을 사용합니다.

In [5]:
from langchain_ollama import ChatOllama

# 사용할 모델 선택 (도구 호출 지원 모델)
MODEL_NAME = "gemma3:4b"  # 또는 "llama3.1", "mistral", "qwen2.5" 등

# Ollama 모델 초기화
llm = ChatOllama(
    model=MODEL_NAME,
    base_url=OLLAMA_URL,
    temperature=0,  # 일관된 출력을 위해 0으로 설정
)

# 도구를 바인딩한 LLM
llm_with_tools = llm.bind_tools(tools)

print(f"{MODEL_NAME} 모델 설정 완료!")

gemma3:4b 모델 설정 완료!


## 4. LangGraph를 사용한 ReAct 에이전트 구현

### 4.1 방법 1: `create_react_agent` 사용 (간단한 방법)

> **Note**: LangGraph v1.0에서 deprecated 경고가 나오지만 정상 작동합니다. v2.0에서 제거될 예정입니다.

In [None]:
from langgraph.prebuilt import create_react_agent

# ReAct 에이전트 생성 (deprecated 경고가 나오지만 정상 작동)
react_agent = create_react_agent(llm, tools)

print("ReAct 에이전트 생성 완료!")

In [None]:
# 간단한 테스트 (영어 사용 권장 - 로컬 모델은 영어 성능이 더 좋음)
response = react_agent.invoke({"messages": [("human", "Add 3 and 5, then multiply the result by 2")]})

# 결과 출력
for message in response["messages"]:
    print(f"[{message.type}]: {message.content}")
    if hasattr(message, "tool_calls") and message.tool_calls:
        print(f"  -> Tool calls: {message.tool_calls}")

### 4.2 방법 2: 수동으로 ReAct 그래프 구성

In [None]:
from typing import Annotated, TypedDict
from langchain_core.messages import BaseMessage, HumanMessage, AIMessage
from langgraph.graph import StateGraph, START, END
from langgraph.graph.message import add_messages
from langgraph.prebuilt import ToolNode


# 상태 정의
class AgentState(TypedDict):
    messages: Annotated[list[BaseMessage], add_messages]


# 에이전트 노드
def agent_node(state: AgentState) -> AgentState:
    """에이전트가 추론하고 다음 행동을 결정합니다."""
    messages = state["messages"]
    response = llm_with_tools.invoke(messages)
    return {"messages": [response]}


# 조건부 라우팅
def should_continue(state: AgentState) -> str:
    """도구를 호출해야 하는지 결정합니다."""
    last_message = state["messages"][-1]
    if hasattr(last_message, "tool_calls") and last_message.tool_calls:
        return "tools"
    return END


# 도구 노드
tool_node = ToolNode(tools)

# 그래프 구성
workflow = StateGraph(AgentState)
workflow.add_node("agent", agent_node)
workflow.add_node("tools", tool_node)
workflow.add_edge(START, "agent")
workflow.add_conditional_edges("agent", should_continue, ["tools", END])
workflow.add_edge("tools", "agent")

# 그래프 컴파일
custom_react_agent = workflow.compile()

print("수동 ReAct 그래프 구성 완료!")

In [None]:
# 그래프 시각화
try:
    from IPython.display import Image, display
    display(Image(custom_react_agent.get_graph().draw_mermaid_png()))
except Exception as e:
    print(f"그래프 시각화 실패: {e}")
    print("그래프 구조: START -> agent -> (tools -> agent) | END")

## 5. 테스트 케이스

In [None]:
def run_agent(query: str, agent=react_agent, verbose: bool = True):
    """에이전트를 실행하고 결과를 출력합니다."""
    if verbose:
        print(f"\n{'='*60}")
        print(f"Query: {query}")
        print(f"{'='*60}")
    
    response = agent.invoke({"messages": [("human", query)]})
    
    if verbose:
        for msg in response["messages"]:
            if msg.type == "human":
                continue
            elif msg.type == "ai":
                if hasattr(msg, "tool_calls") and msg.tool_calls:
                    print(f"\n[AI - Tool Calls]")
                    for tc in msg.tool_calls:
                        print(f"  -> {tc['name']}({tc['args']})")
                elif msg.content:
                    print(f"\n[AI - Final Response]")
                    print(f"  {msg.content}")
            elif msg.type == "tool":
                print(f"\n[Tool Result] {msg.name}: {msg.content}")
    
    return response

In [None]:
# 테스트 1: 수학 연산 (영어)
run_agent("Add 10 and 20, then divide the result by 3")

In [None]:
# 테스트 2: 날씨 정보
run_agent("What is the weather in Seoul and Tokyo?")

In [None]:
# 테스트 3: 복합 작업
run_agent("Multiply 7 by 8, then add 10 to the result")

## 6. 한국어 테스트 (선택사항)

일부 로컬 모델은 한국어 지원이 제한적일 수 있습니다.

In [None]:
# 한국어 테스트 (모델에 따라 결과가 다를 수 있음)
try:
    run_agent("5와 10을 더해줘")
except Exception as e:
    print(f"한국어 처리 중 오류: {e}")
    print("영어로 시도해보세요.")

## 7. 스트리밍 출력

In [None]:
def run_agent_stream(query: str, agent=react_agent):
    """에이전트를 스트리밍 모드로 실행합니다."""
    print(f"\n{'='*60}")
    print(f"Query: {query}")
    print(f"{'='*60}")
    
    for event in agent.stream({"messages": [("human", query)]}, stream_mode="updates"):
        for node_name, node_output in event.items():
            print(f"\n[{node_name} node]")
            if "messages" in node_output:
                for msg in node_output["messages"]:
                    if hasattr(msg, "tool_calls") and msg.tool_calls:
                        for tc in msg.tool_calls:
                            print(f"  -> Tool call: {tc['name']}({tc['args']})")
                    elif hasattr(msg, "content") and msg.content:
                        content = str(msg.content)
                        print(f"  -> {content[:200]}..." if len(content) > 200 else f"  -> {content}")

In [None]:
# 스트리밍 테스트
run_agent_stream("Multiply 5 and 7, then add 10 to the result")

## 8. 다른 로컬 모델 사용하기

In [None]:
def create_agent_with_model(model_name: str):
    """다른 Ollama 모델로 에이전트를 생성합니다."""
    from langchain_ollama import ChatOllama
    from langgraph.prebuilt import create_react_agent
    
    local_llm = ChatOllama(
        model=model_name,
        base_url=OLLAMA_URL,
        temperature=0,
    )
    return create_react_agent(local_llm, tools)


# 예시: 다른 모델 사용
# other_agent = create_agent_with_model("gemma3:12b")
# run_agent("Add 5 and 3", agent=other_agent)

## 9. 요약

### 로컬 모델 사용의 장점
- **프라이버시**: 데이터가 외부로 전송되지 않음
- **비용**: API 호출 비용 없음
- **오프라인**: 인터넷 연결 없이 사용 가능
- **커스터마이징**: 모델 파인튜닝 가능

### 로컬 모델 사용 시 고려사항
- 추론 속도가 상대적으로 느림 (GPU 필요)
- 도구 호출 정확도가 상용 모델보다 낮을 수 있음
- 한국어 성능이 제한적일 수 있음
- 충분한 RAM/VRAM 필요 (최소 8GB 이상 권장)

### 권장 모델 (도구 호출 지원)
| 모델 | 크기 | 특징 |
|------|------|------|
| gemma3:4b | 4B | 경량, 빠름, 도구 호출 지원 |
| llama3.1 | 8B | 균형 잡힌 성능 |
| llama3.2 | 3B | 경량, 빠름 |
| mistral | 7B | 우수한 추론 |
| qwen2.5 | 7B | 다국어 지원 |