### 미들웨어 (Middleware)

#### 모든 단계에서 에이전트 실행을 제어하고 커스터마이즈하기

**미들웨어(Middleware)** 는 에이전트 내부에서 일어나는 과정을
더 세밀하게 **제어하고(customize)** 조정할 수 있는 기능을 제공합니다.

에이전트의 핵심 실행 루프(core agent loop)는 다음과 같은 과정으로 이루어집니다:

1. **모델 호출 (Call the model)** — LLM을 호출하여 다음 행동을 결정합니다.
2. **도구 실행 (Execute tools)** — 모델이 선택한 도구(tool)를 실행합니다.
3. **종료 조건 (Finish)** — 더 이상 실행할 도구가 없으면 루프를 종료합니다.

미들웨어는 이 전체 과정의 각 단계에 개입하여,
에이전트의 동작을 **감시, 수정, 또는 확장**할 수 있도록 합니다.

![image.png](attachment:fcbb763e-09b0-4684-ad9f-de7f4b9088f6.png)

### 미들웨어 용도

- **모니터링 (Monitor)**

    * 에이전트의 동작을 **로깅(logging)**, **분석(analytics)**, **디버깅(debugging)** 을 통해 추적할 수 있습니다.
  → 예: 각 단계의 실행 시간, 선택된 도구, 에러 로그 등을 기록

- **수정 (Modify)**

    * **프롬프트(prompt)**, **도구 선택(tool selection)**, **출력 형식(output formatting)** 등을 변형하거나 조정할 수 있습니다.
  → 예: 입력 문장을 재구성하거나, 특정 도구만 사용하도록 제한

- **제어 (Control)**

    * **재시도(retries)**, **대체 실행(fallbacks)**, **조기 종료(early termination)** 로직을 추가하여
  에이전트의 실행 흐름을 제어할 수 있습니다.

- **강제 적용 (Enforce)**

    * **요율 제한(rate limits)**, **안전 가드레일(guardrails)**, **개인정보(PII) 탐지** 같은
  보안 및 정책 규칙을 적용할 수 있습니다.


In [2]:
from dotenv import load_dotenv

load_dotenv()

True

In [3]:
from langchain.chat_models import init_chat_model

model = init_chat_model("gpt-5-nano", model_provider="openai")
# model = init_chat_model("gemini-2.5-flash", model_provider="google_genai")

### 기본 제공 미들웨어 (Built-in middleware)

LangChain은 일반적인 사용 사례를 위한 **기본 제공(prebuilt) 미들웨어**를 제공합니다.

---

#### 요약 (Summarization)

대화가 **토큰 한도(token limit)** 에 가까워질 때, 대화 기록(conversation history)을 **자동으로 요약(summarize)** 해주는 기능을 수행합니다.

In [4]:
from langchain.agents import create_agent
from langchain.agents.middleware import SummarizationMiddleware, HumanInTheLoopMiddleware
from langchain_core.runnables import RunnableConfig

agent = create_agent(
    model=model,                # 사용할 언어 모델 지정
    tools=[],          # 사용할 도구(함수) 등록
    middleware=[
        SummarizationMiddleware(          # 요약 미들웨어 추가
            model=model,                  # 요약에 사용할 모델
            max_tokens_before_summary=4000,  # 토큰 수가 4000에 도달하면 요약 실행
            messages_to_keep=20,             # 요약 후 최근 2개의 메시지만 유지
            summary_prompt="""
            이전 대화 내용을 간결하게 요약하되, 핵심 정보와 결론을 유지하세요.
            불필요한 인사말, 반복된 문장은 생략하고, 사용자의 의도와 모델의 주요 응답만 포함하세요.
            요약 형식:
            - 주요 내용 요약: 
            """  # 선택적 요약 프롬프트
        ),
    ]
)

### 인간 개입(Human-in-the-loop)

에이전트가 도구(tool)를 실행하기 **직전 단계에서 일시 정지(pause)** 하여,
**사람이 직접 승인(approval)**, **수정(editing)**, 또는 **거부(rejection)** 할 수 있도록 하는 기능입니다.

In [4]:
from langchain.agents import create_agent
from langchain.agents.middleware import HumanInTheLoopMiddleware
from langgraph.checkpoint.memory import InMemorySaver
from langchain.tools import tool

@tool
def send_email_tool(recipient: str, subject: str, body: str) -> str:
    """
    이메일을 전송하는 함수입니다.
    """
    return f"이메일 발송 완료!\n수신자: {recipient}\n제목: {subject}\n본문: {body[:50]}..."

@tool
def read_email_tool(sender: str, subject: str, body: str) -> str:
    """
    이메일을 읽는 함수입니다.
    """
    return f"이메일 수신 완료!\n발신자: {sender}\n제목: {subject}\n본문: {body[:50]}..."

agent = create_agent(
    model=model,           # 사용할 언어 모델 지정
    tools=[send_email_tool, read_email_tool],     # 사용할 도구(함수) 등록
    checkpointer=InMemorySaver(),  # 대화 상태를 메모리에 저장 (세션 관리용)
    middleware=[
        HumanInTheLoopMiddleware(  # 인간 개입 미들웨어 추가
            interrupt_on={
                # 이메일 전송 시: 실행 전 사용자 승인/수정/거부 필요
                "send_email_tool": {
                    "allowed_decisions": ["approve", "edit", "reject"],
                },
                # 이메일 읽기 시: 자동 승인 (사용자 개입 없음)
                "read_email_tool": False,
            }
        ),
    ],
)

In [5]:
question = """
안부 이메일을 보내주세요. 주어진 도구를 사용하세요.
수신자: test@gmail.com
제목: 파티 초대
본문: 
파티에 초대합니다. 
장소는 추후 통보합니다.
""" 
config = {"configurable": {"thread_id": "1"}} 

result = agent.invoke(
    {"messages": [{"role": "user", "content": question}]},
    config=config 
)

In [6]:
result

{'messages': [HumanMessage(content='\n안부 이메일을 보내주세요. 주어진 도구를 사용하세요.\n수신자: test@gmail.com\n제목: 파티 초대\n본문: \n파티에 초대합니다. \n장소는 추후 통보합니다.\n', additional_kwargs={}, response_metadata={}, id='5b6a9425-54cc-4f97-87a4-7015693e7f4b'),
  AIMessage(content='', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 501, 'prompt_tokens': 217, 'total_tokens': 718, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 448, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-5-nano-2025-08-07', 'system_fingerprint': None, 'id': 'chatcmpl-CVARG1k5e0O7BafHMIEs5u410i5d1', 'service_tier': 'default', 'finish_reason': 'tool_calls', 'logprobs': None}, id='lc_run--535c86cb-d9e1-4df2-8d22-a8c513769fba-0', tool_calls=[{'name': 'send_email_tool', 'args': {'recipient': 'test@gmail.com', 'subject': '파티 초대', 'body': '파티에 초대합니다.\n장소는 추후 

In [7]:
interrupt = result["__interrupt__"][0].value
req = interrupt["action_requests"][0]          # 이번에 승인 필요한 액션
tool_name = req["name"]                         # 'send_email_tool'
args = req["args"]                              # {'recipient':..., 'subject':..., 'body':...}

# 결제자에게 보여줄 미리보기
print("\n=== 이메일 미리보기 ===")
print(f"수신자: {args.get('recipient')}")
print(f"제목  : {args.get('subject')}")
print("본문  :")
print(args.get('body'))
print("=======================\n")


=== 이메일 미리보기 ===
수신자: test@gmail.com
제목  : 파티 초대
본문  :
파티에 초대합니다.
장소는 추후 통보합니다.



In [8]:
from langgraph.types import Command

# --- 승인(approve)
admin_command = Command(resume={
    "decisions": [
        {
            "tool": "send_email_tool",   # 인터럽트가 걸린 툴 이름과 정확히 일치해야 함
            "type": "approve",           # approve / edit / reject
        }
    ]
})

# 중단된 실행 재개 (agent.stream 사용)
events = agent.stream(
    admin_command,
    config,
    stream_mode="values",
)

for event in events:
    if "messages" in event and event["messages"]:
        event["messages"][-1].pretty_print()

Tool Calls:
  send_email_tool (call_d4VtvCmG4nsc3hxi8sV0uO4K)
 Call ID: call_d4VtvCmG4nsc3hxi8sV0uO4K
  Args:
    recipient: test@gmail.com
    subject: 파티 초대
    body: 파티에 초대합니다.
장소는 추후 통보합니다.
Tool Calls:
  send_email_tool (call_d4VtvCmG4nsc3hxi8sV0uO4K)
 Call ID: call_d4VtvCmG4nsc3hxi8sV0uO4K
  Args:
    recipient: test@gmail.com
    subject: 파티 초대
    body: 파티에 초대합니다.
장소는 추후 통보합니다.
Name: send_email_tool

이메일 발송 완료!
수신자: test@gmail.com
제목: 파티 초대
본문: 파티에 초대합니다.
장소는 추후 통보합니다....

안부 이메일(파티 초대) 발송이 완료되었습니다.

- 수신자: test@gmail.com
- 제목: 파티 초대
- 본문:
  파티에 초대합니다.
  장소는 추후 통보합니다.

필요하시면 리마인더 메일을 보내거나 RSVP 요청 문구를 추가하는 등 추가 작업을 도와드릴게요. 또 다른 받는 사람이나 다른 메시지로도 도와드릴까요?


### 모델 호출 제한 (Model call limit)
모델이 무한 루프에 빠지거나 과도한 비용이 발생하지 않도록, 모델 호출 횟수를 제한할 수 있습니다.

### 도구 호출 제한 (Tool call limit)
특정 도구 또는 모든 도구에 대해 호출 횟수를 제한합니다.

### 도구 재시도 (Tool retry)
도구 호출이 실패했을 때, 자동으로 재시도하도록 설정하는 기능입니다.
이는 일시적인 네트워크 오류나 외부 API 지연 같은 문제를 완화할 때 유용합니다.

In [9]:
from langchain.agents import create_agent
from langchain.agents.middleware import ModelCallLimitMiddleware
from langchain.agents.middleware import ToolCallLimitMiddleware
from langchain.agents.middleware import ToolRetryMiddleware

# 모델 호출 횟수를 제한 설정
model_limiter = ModelCallLimitMiddleware(
            thread_limit=10,  # 스레드(대화 단위)당 최대 10회 호출 가능 (세션 전체 기준)
            run_limit=5,      # 한 번의 실행(run)당 최대 5회 호출 가능
            exit_behavior="end",  # 한도 초과 시 실행 종료("error"로 설정 시 예외 발생)
        )

# 모든 도구 호출에 대한 전역 제한 설정
global_limiter = ToolCallLimitMiddleware(thread_limit=20, run_limit=10)

# 특정 도구(search)에 대한 개별 호출 제한 설정
search_limiter = ToolCallLimitMiddleware(
    tool_name="search",  # 제한할 도구 이름
    thread_limit=5,      # 스레드(대화 단위)당 최대 5회 호출
    run_limit=3,         # 한 번의 실행(run)당 최대 3회 호출
)

toolcall_limiter = ToolRetryMiddleware(
    max_retries=3,       # 최대 3번까지 재시도
    backoff_factor=2.0,  # 지수 백오프 배수 (재시도 시 대기 시간을 2배씩 증가)
    initial_delay=1.0,   # 첫 번째 재시도 전 대기 시간 (1초)
    max_delay=60.0,      # 최대 대기 시간 제한 (60초 이상 대기하지 않음)
    jitter=True,         # 지터(jitter) 활성화 — 동시에 여러 요청이 몰리는 것을 방지하기 위해 랜덤 지연 추가
)

agent = create_agent(
    model,
    tools=[],
    middleware=[
        model_limiter, global_limiter, search_limiter, toolcall_limiter      
    ],
)

### PII 감지 (PII Detection)
대화 중에 개인 식별 정보(PII, Personally Identifiable Information) 가 포함되어 있는지를 탐지하고 처리합니다. 
- 이름, 주민등록번호, 여권번호
- 이메일 주소, 전화번호
- 집 주소, IP 주소
- 신용카드 번호 등

| 전략 이름 (`strategy`) | 동작 방식                                         | 예시                                                  | 사용 목적                        |
| ------------------ | --------------------------------------------- | --------------------------------------------------- | ---------------------------- |
| `"redact"`         | **완전히 가리기** — 탐지된 부분을 `[REDACTED]`로 대체        | `"내 이메일은 test@example.com"` → `"내 이메일은 [REDACTED]"` | 입력/출력에서 개인정보를 완전히 숨기고 싶을 때   |
| `"mask"`           | **일부만 표시** — 대부분을 `*`로 가리고 일부(예: 마지막 4자리)만 유지 | `"1234-5678-9012-3456"` → `"****-****-****-3456"`   | 신용카드·전화번호처럼 일부만 보여도 되는 경우    |
| `"hash"`           | **해시 처리** — 감지된 값을 해시(예: SHA256)로 변환          | `"test@example.com"` → `"4f7d3a7a9c..."`            | 원문을 숨기되, 같은 입력값을 구분·추적해야 할 때 |
| `"block"`          | **차단** — 탐지 시 예외 발생 (`PIIDetectionError`)     | `"sk-abc..."` → ❌ 실행 중단                             | API Key 등 절대 노출되어선 안 되는 경우   |
| `"remove"`         | **제거** — 감지된 부분을 빈 문자열로 완전히 삭제                | `"내 전화번호는 010-1234-5678"` → `"내 전화번호는 "`            | 문맥 유지 없이 완전히 삭제할 때           |
| `"log"`            | **탐지 로그만 남기고 원문 유지**                          | `"test@example.com"` → 그대로 유지, 내부 로그만 기록            | 개발·테스트 중 PII 탐지 여부를 점검할 때    |


In [5]:
from langchain.agents import create_agent
from langchain.agents.middleware import PIIMiddleware

agent = create_agent(
    model,
    tools=[],
    middleware=[
        # 사용자 입력에서 이메일 주소를 탐지하고 가리기 (redact)
        # 예: "my email is test@example.com" → "my email is [REDACTED]"
        PIIMiddleware("email", 
                      strategy="redact", 
                      apply_to_input=True),

        # 신용카드 번호를 마스킹 처리 (마지막 4자리만 표시)
        # 예: "1234-5678-9012-3456" → "****-****-****-3456"
        PIIMiddleware(
            "credit_card",
            detector=r"\b(?:\d[ -]*?){13,19}\b",  # 숫자 + 하이픈/공백 허용
            strategy="mask",
            apply_to_input=True,
        ),

        # 사용자 정의 PII 유형 추가 (정규식 기반)
        # 예: API 키 형식 "sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
        # 감지 시 실행 중단 (block)
        PIIMiddleware(
            "api_key",
            detector=r"sk-[a-zA-Z0-9]{32}",  # 탐지할 패턴 (정규식)
            strategy="block",  # 감지 시 오류 발생 (차단)
        ),
    ],
)

In [6]:
agent.invoke({
    "messages": [
        {"role": "user", "content": "제 이메일은 test@example.com 입니다. 거기로 연락 주세요."}
    ]
})

{'messages': [HumanMessage(content='제 이메일은 [REDACTED_EMAIL] 입니다. 거기로 연락 주세요.', additional_kwargs={}, response_metadata={}, id='e7feabc2-905d-4947-81d0-2ae75e0255c2'),
  AIMessage(content='도와드릴게요. 저는 직접 이메일을 보내거나 외부로 연락하는 기능은 없지만, 해당 주소로 보낼 메시지 초안이나 작성 도우미를 제공해 드릴 수 있습니다.\n\n무슨 용도로 보내시려나요? 예를 들면:\n- 일반 문의\n- 협업 제안\n- 일정 조정\n- 피드백/요청\n\n다음 중 하나에 맞춰 바로 사용할 수 있는 템플릿을 드릴게요. 필요하신 상황을 알려주시면 더 맞춤형으로 다듬어 드리겠습니다.\n\n템플릿 1: 일반 문의\n- 제목: 문의드립니다: [주제 요약]\n- 본문:\n안녕하세요. 제 이름은 [당신의 이름]이며 [소속/직무]입니다. [상황 간단 설명]. 아래 내용에 대해 확인해 주시고 답변 주시면 감사하겠습니다.\n- [질문/요청 내용]\n감사합니다.\n[이름] | [연락처]\n\n템플릿 2: 협업 제안\n- 제목: 협업 제안 드립니다: [제안 요지]\n- 본문:\n안녕하세요 [받는 사람/부서], 저는 [당신의 이름]이고 [회사/조직]에서 [직책]을 맡고 있습니다. [협업 아이디어의 간단한 요약]. 더 자세한 논의를 위해 짧은 미팅을 제안드립니다. 가능하신 시간대를 알려주시면 조정하겠습니다.\n감사합니다.\n[이름] | [연락처]\n\n템플릿 3: 일정 확인\n- 제목: 회의 일정 확인드립니다\n- 본문:\n안녕하세요 [받는 분], 저는 [당신의 이름]입니다. [회의 목적]. 아래 제안시간을 드려요: [날짜/시간]. 가능하신지 회신 부탁드립니다.\n감사합니다.\n[이름] | [연락처]\n\n원하시는 톤(정중하게, 캐주얼하게 등)이나 구체적인 내용이 있다면 알려주시면 더 정확하게 다듬어 드리겠습니다. 또한 실제로 이메일 작성에 필

In [7]:
agent.invoke({
    "messages": [
        {"role": "user", "content": "내 카드 번호는 1234-5678-9012-3456 이야."}
    ]
})

{'messages': [HumanMessage(content='내 카드 번호는 ****-****-****-3456 이야.', additional_kwargs={}, response_metadata={}, id='462de52c-1616-46c9-96d0-cfa427c95665'),
  AIMessage(content='마지막 네 자리 3456을 공유해 주셨군요. 이렇게 일부만 밝힌 건 안전합니다. 다만 전체 카드번호나 CVV 같은 민감정보는 온라인에서 절대 공유하지 않는 게 좋습니다. 저는 이 대화에서 카드 정보를 저장하거나 처리하지 않습니다.\n\n도움이 될 만한 일반 팁\n- 온라인 결제 시: HTTPS가 있는 안전한 사이트에서만 입력하고, 가능한 경우 카드 대행사나 은행의 공식 앱/웹사이트를 이용하세요.\n- 카드 정보 관리: 카드 번호, 유효기간, CVV를 메모 앱 등에 보관하지 말고 필요 시 은행이나 결제사에서 제공하는 안전한 방법으로 관리하세요.\n- 의심스러운 거래: 거래 내역을 자주 확인하고 낯선 거래가 있으면 즉시 은행에 신고하고 카드 일시정지 또는 재발급을 요청하세요.\n- 보안 개선: 강력한 비밀번호, 이중 인증 설정, 피싱 주의 등 기본 보안 수칙을 지키세요.\n\n원하시는 도움이 구체적으로 어떤 건가요? 예를 들어 결제 절차 안내, 카드 발급/해지 문의, 거래 내역 확인 방법 등 일반적인 정보가 필요하신지 알려주시면 도와드리겠습니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 1243, 'prompt_tokens': 20, 'total_tokens': 1263, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 960, 'rejected_prediction_tokens': 0}, 

In [8]:
try:
    agent.invoke({
        "messages": [
            {"role": "user", "content": "이건 내 OpenAI 키야: sk-ABC123XYZ456LMN789OPQ987RST654UV"}
        ]
    })
except Exception as e:
    print(e)

Detected 1 instance(s) of api_key in text content
