# 구조화된 출력 (Structured Output)

구조화된 출력은 **에이전트가 데이터를 일정하고 예측 가능한 형식으로 반환**할 수 있도록 합니다.
즉, 사람이 읽기 위한 자연어 응답을 파싱할 필요 없이,
**JSON 객체**, **Pydantic 모델**, 또는 **데이터클래스(dataclass)** 형태로
애플리케이션이 **직접 사용할 수 있는 구조화된 데이터**를 받을 수 있습니다.


LangChain의 `create_agent`는 이러한 **구조화된 출력**을 자동으로 처리합니다.
사용자는 원하는 **출력 스키마(schema)** 를 지정하기만 하면,
모델이 구조화된 데이터를 생성할 때 그것이 **자동으로 캡처되고, 검증(validated)** 되며,
에이전트의 상태(`agent’s state`) 안의 `'structured_response'` 키에 포함되어 반환됩니다.

```
def create_agent(
    ...
    response_format: Union[
        ToolStrategy[StructuredResponseT],
        ProviderStrategy[StructuredResponseT],
        type[StructuredResponseT],
    ]
```

### Response Format
에이전트가 구조화된 데이터를 반환하는 방식을 제어합니다:  

In [1]:
from dotenv import load_dotenv
load_dotenv()

True

In [4]:
from langchain.chat_models import init_chat_model

# model = init_chat_model("gpt-5-nano", model_provider="openai")
model = init_chat_model("gemini-2.5-flash", model_provider="google_genai")

### Pydantic을 이용하여 LLM의 구조화된 출력 유도

In [7]:
from pydantic import BaseModel, Field
from langchain.agents import create_agent

class ContactInfo(BaseModel):
    """사람의 연락처 정보를 나타내는 클래스."""
    name: str = Field(description="사람의 이름")
    email: str = Field(description="사람의 이메일 주소")
    phone: str = Field(description="사람의 전화번호")

agent = create_agent(
    model=model,
    tools=[],
    response_format=ContactInfo  # ProviderStrategy가 자동 선택됨
)

result = agent.invoke({
    "messages": [{"role": "user", "content": "다음 문장에서 연락처 정보를 추출해줘: John Doe, john@example.com, (555) 123-4567"}]
})

result["structured_response"]

ContactInfo(name='John Doe', email='john@example.com', phone='(555) 123-4567')

## Schema 정의와 도구 호출 

LangChain에서 OpenAI의 **도구 호출(Tool Calling)** 기능을 사용하여 태깅을 수행하는 간단한 예제를 살펴보겠습니다.  

- OpenAI 모델에서 지원하는 `with_structured_output` 메서드를 사용할 것입니다.  

스키마에 몇 가지 속성과 예상 유형을 추가하여 Pydantic 모델을 지정해 보겠습니다.

In [8]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from pydantic import BaseModel, Field

# 프롬프트 템플릿 정의
# 주어진 텍스트에서 필요한 정보를 추출하도록 지침 제공
tagging_prompt = ChatPromptTemplate.from_template(
"""
다음 글에서 원하는 정보를 추출하세요.
'Classification' 함수에 언급된 속성만 추출하세요.

글:
{input}
"""
)

# Pydantic 데이터 모델을 이용하여 텍스트에서 추출할 속성 정의
# 감정의 종류와 값의 범위를 자율 지정
class Classification(BaseModel):
    sentiment: str = Field(description="텍스트의 감정")
    agressiveness: int = Field(
        description="텍스트가 1~10점 척도로 얼마나 공격적인지를 나타냅니다."
    )

# Structured Output(구조화된 출력) 생성
llm = model.with_structured_output(Classification)
llm

RunnableBinding(bound=ChatGoogleGenerativeAI(model='models/gemini-2.5-flash', google_api_key=SecretStr('**********'), client=<google.ai.generativelanguage_v1beta.services.generative_service.client.GenerativeServiceClient object at 0x0000022F5C52B4D0>, default_metadata=(), model_kwargs={}), kwargs={'tools': [{'type': 'function', 'function': {'name': 'Classification', 'description': '', 'parameters': {'properties': {'sentiment': {'description': '텍스트의 감정', 'type': 'string'}, 'agressiveness': {'description': '텍스트가 1~10점 척도로 얼마나 공격적인지를 나타냅니다.', 'type': 'integer'}}, 'required': ['sentiment', 'agressiveness'], 'type': 'object'}}}], 'ls_structured_output_format': {'kwargs': {'method': 'function_calling'}, 'schema': {'type': 'function', 'function': {'name': 'Classification', 'description': '', 'parameters': {'properties': {'sentiment': {'description': '텍스트의 감정', 'type': 'string'}, 'agressiveness': {'description': '텍스트가 1~10점 척도로 얼마나 공격적인지를 나타냅니다.', 'type': 'integer'}}, 'required': ['sentiment',

In [9]:
inp = "너를 만나게 되어 정말 기뻐! 우리는 아주 좋은 친구가 될 것 같아!"

prompt = tagging_prompt.invoke({"input": inp})
response = llm.invoke(prompt)

response

Classification(sentiment='긍정', agressiveness=1)

dictionary 출력을 원하면 `.model_dump()`를 호출하면 됩니다.

In [10]:
response.model_dump()

{'sentiment': '긍정', 'agressiveness': 1}

예제에서 볼 수 있듯이, 모델은 우리가 원하는 바를 정확하게 해석합니다.  

다음 섹션에서는 이러한 결과를 어떻게 제어할 수 있는지 살펴보겠습니다.

## **더 세밀한 출력 제어**

**스키마(schema)** 를 더 자세히 정의하면 모델의 출력을 더 세밀하게 제어할 수 있습니다.  

구체적으로 다음을 정의할 수 있습니다:  

- **각 속성의 가능한 값**  
- **속성을 모델이 정확하게 이해할 수 있도록 설명 추가**  
- **반드시 반환해야 할 필수 속성**  

이전에 언급한 각 요소를 제어하기 위해 **Enums**를 사용하여 우리의 **Pydantic 모델**을 다시 선언해봅시다.



In [11]:
model = init_chat_model("gpt-5-mini", model_provider="openai")

In [13]:
from pydantic import BaseModel, Field
from typing import Literal

class Classification_2(BaseModel):
    sentiment: Literal["행복하다", "화난다", "슬프다"]
    aggressiveness: Literal[1, 2, 3, 4, 5] = Field(
        ...,
        description="문장이 얼마나 공격적인지를 나타내며 숫자가 높을수록 더 공격적입니다."
    )

llm = model.with_structured_output(Classification_2)

이제 답변은 우리가 예상하는 방식으로 제한될 것입니다!

In [14]:
inps = ["너를 만나면 죽여 버릭거야! 우리는 영원히 친구가 될 수 없어!",
        "너를 보면 눈물이 나!",
        "여기 날씨는 괜찮아요, 코트 하나 없이도 밖에 나갈 수 있어요"]

for inp in inps:
    prompt = tagging_prompt.invoke({"input": inp})
    response = llm.invoke(prompt)
    print(response.model_dump())

{'sentiment': '화난다', 'aggressiveness': 5}
{'sentiment': '슬프다', 'aggressiveness': 1}
{'sentiment': '행복하다', 'aggressiveness': 1}


# 구조화된 출력을 활용한 콘텐츠 심사

In [15]:
from enum import Enum
from typing import Optional
from pydantic import BaseModel

class Category(str, Enum):
    violence = "폭력"
    sexual = "성적인내용"
    self_harm = "자해"

class ContentCompliance(BaseModel):
    is_violating: bool
    category: Optional[Category]
    explanation_if_violating: Optional[str]

llm = model.with_structured_output(ContentCompliance)

tagging_prompt = ChatPromptTemplate.from_template(
"""
사용자 입력이 특정 지침을 위반하는지 판단하고 'ContentCompliance' 형식에 맞추어 출력하세요.
한국어로 출력하세요.

글:
{input}
"""
)

inps = ["요즘 너무 힘들고 삶을 포기하고 싶어.",
        "이 사진은 성적으로 노골적인 내용을 포함하고 있어.",
        "니 대가리를 박살낼거야"]

for inp in inps:
    prompt = tagging_prompt.invoke({"input": inp})
    response = llm.invoke(prompt)
    print(response.model_dump())
    print()

{'is_violating': True, 'category': <Category.self_harm: '자해'>, 'explanation_if_violating': "사용자가 '삶을 포기하고 싶어'라고 명백한 자해·자살 의향을 표현하고 있으므로 자해 관련 금지 지침에 해당합니다. 이 입력은 자해·자살을 암시하거나 권장하는 내용으로 분류됩니다."}

{'is_violating': False, 'category': None, 'explanation_if_violating': None}

{'is_violating': True, 'category': <Category.violence: '폭력'>, 'explanation_if_violating': '해당 문장은 특정인에게 심각한 신체적 피해를 가하겠다는 직접적인 폭력적 위협입니다. 위협적·폭력적 표현은 유해한 콘텐츠로 분류되어 허용되지 않습니다.'}



# 실습 : 구조화된 출력 코드 작성

### 문제 1: 캘린더 이벤트 추출 (기초)

아래 문장에서 **이름**, **날짜**, **참석자** 정보를 추출하도록 `CalendarEvent` 클래스를 정의하고, .

```text
"민수, 유리, 그리고 지민은 다음 주 화요일에 회사 워크숍에 참석합니다."
```

<details>
<summary>힌트</summary>

```
class CalendarEvent(BaseModel):
    이름: str
    날자: str
    참석자: list[str]
```

</details>