# 구조화된 출력 (Structured Outputs)

### 응답을 JSON 스키마에 맞게 생성하기

- JSON은 애플리케이션 간 데이터 교환을 위한 가장 널리 사용되는 형식 중 하나입니다.

- 구조화된 출력(Structured Outputs) 기능을 사용하면 모델이 제공된 JSON 스키마를 항상 준수하도록 보장할 수 있습니다.
이를 통해 필수 키가 누락되거나 잘못된 값이 생성되는 문제를 방지할 수 있습니다.

- 구조화된 출력의 장점
    - 타입 안전성 보장 - 응답이 항상 올바른 형식을 따르므로 검증 및 재요청이 불필요함
    - 명시적인 거부 응답 - 안전상의 이유로 모델이 요청을 거부하면 이를 프로그래밍 방식으로 감지 가능
    - 더 간단한 프롬프트 작성 - 특정 형식을 강제하기 위한 프롬프트 조정이 불필요
  
<br>  
- Python OpenAI SDK에서는 JSON 스키마를 사용하여 데이터를 정의할 수 있도록 Pydantic 지원

In [1]:
from dotenv import load_dotenv
load_dotenv()

True

In [2]:
from openai import OpenAI
client = OpenAI()

Model = "gpt-5-nano"

In [3]:
from pydantic import BaseModel

class CalendarEvent(BaseModel):
    name: str
    date: str
    participants: list[str]

response = client.responses.parse(
    model=Model,
    input=[
        {"role": "developer", "content": "이벤트 정보를 추출하세요."},
        {"role": "user", "content": "Alice와 Bob은 금요일에 과학 박람회에 갈 예정입니다."},
    ],
    text_format=CalendarEvent,
)

event = response.output_parsed
print(event)

name='과학 박람회' date='금요일' participants=['Alice', 'Bob']


### 함수 호출을 통해 구조화된 출력을 사용하는 경우와 response_format을 통해 구조화된 출력을 사용하는 경우

구조화된 출력은 OpenAI API에서 두 가지 형태로 제공됩니다.

1) 함수 호출을 사용할 때
2) json_schema응답 형식을 사용할 때

예를 들어, 사용자의 주문을 지원하는 AI 어시스턴트를 구축하기 위해 데이터베이스를 쿼리하는 함수나 UI와 상호 작용하는 함수에 모델에 액세스 권한을 부여할 수 있습니다.  

반대로, 모델이 도구를 호출할 때가 아니라 사용자에게 응답할 때 사용할 구조화된 스키마를 지정하려는 경우 response_format을 통한 구조화된 출력이 더 적합합니다.  
예를 들어, 수학 튜터링 애플리케이션을 구축하는 경우, 어시스턴트가 특정 JSON 스키마를 사용하여 사용자에게 응답하도록 하여 모델 출력의 각 부분을 고유한 방식으로 표시하는 UI를 생성할 수 있습니다.

간단히 말해서:  
- 시스템의 도구, 함수, 데이터 등에 모델을 연결하는 경우 함수 호출을 사용해야 합니다.  
- 사용자에게 응답할 때 모델의 출력을 구조화하려면 구조화 `response_format`을 사용해야 합니다.

### COT (Chain of Thought)  
모델에 구조화된 단계별 방식으로 답변을 출력하도록 요청하여 사용자가 해결책을 찾을 수 있도록 안내할 수 있습니다.

In [4]:
# 체인 오브 소트(Chain of Thought) 기반 수학 지도용 구조화된 출력

# 1단계: 객체 정의
# 먼저, 모델이 따라야 할 JSON 스키마를 나타내는 객체 또는 데이터 구조를 정의해야 합니다. 
class Step(BaseModel):
    explanation: str
    step_result: str

class MathReasoning(BaseModel):
    step: list[Step]
    final_result: str

# 2단계: API 호출에 객체 제공
# parse 메서드를 사용하면 JSON 응답을 정의한 객체로 자동 파싱할 수 있습니다.
# SDK는 내부적으로 데이터 구조에 맞는 JSON 스키마를 제공하고, 응답을 객체로 파싱합니다.
response = client.responses.parse(
    model=Model,
    input=[
        {"role": "developer", 
         "content": "당신은 유용한 수학 튜터입니다. 사용자가 해결 과정을 단계별로 따라갈 수 있도록 안내하세요."},
        {"role": "user", "content": "8x + 7 = -23 방정식 문제의 해는?"}
    ],
    text_format=MathReasoning,
)

math_reasoning = response.output_text
math_reasoning

'{\n  "step": [\n    {\n      "explanation": "양변에서 상수항 7을 제거하기 위해 양변에서 7을 뺍니다.",\n      "step_result": "8x + 7 = -23 → 8x = -23 - 7 = -30"\n    },\n    {\n      "explanation": "양변을 8로 나누어 x를 고립시킵니다.",\n      "step_result": "8x = -30 → x = -30/8 = -15/4"\n    },\n    {\n      "explanation": "분수를 소수로 표현하면 x = -3.75입니다.",\n      "step_result": "-15/4 = -3.75"\n    },\n    {\n      "explanation": "해를 검증합니다. x = -15/4를 대입하면 원식이 성립합니다.",\n      "step_result": "8(-15/4) + 7 = -30 + 7 = -23"\n    }\n  ],\n  "final_result": "해는 x = -15/4 이며, 소수로는 -3.75도 같습니다."\n}'

In [5]:
import json

json.loads(math_reasoning)

{'step': [{'explanation': '양변에서 상수항 7을 제거하기 위해 양변에서 7을 뺍니다.',
   'step_result': '8x + 7 = -23 → 8x = -23 - 7 = -30'},
  {'explanation': '양변을 8로 나누어 x를 고립시킵니다.',
   'step_result': '8x = -30 → x = -30/8 = -15/4'},
  {'explanation': '분수를 소수로 표현하면 x = -3.75입니다.',
   'step_result': '-15/4 = -3.75'},
  {'explanation': '해를 검증합니다. x = -15/4를 대입하면 원식이 성립합니다.',
   'step_result': '8(-15/4) + 7 = -30 + 7 = -23'}],
 'final_result': '해는 x = -15/4 이며, 소수로는 -3.75도 같습니다.'}

### 구조화된 데이터 추출  
연구 논문과 같은 비정형 입력 데이터에서 구조화된 필드를 정의하여 정보를 추출할 수 있습니다..

In [11]:
# pip install PyMuPDF

In [12]:
# 구조화된 출력을 사용하여 연구 논문에서 데이터 추출하기
import fitz  # PyMuPDF

def extract_text_from_pdf(pdf_path):
    text = ""
    with fitz.open(pdf_path) as doc:
        for page in doc:
            text += page.get_text("text") + "\n"
    return text

# PDF 파일에서 텍스트 추출
paper_text = extract_text_from_pdf("data/deep_seek.pdf")

class ResearchPaperExtraction(BaseModel):
    title: str
    author: list[str]
    subject: str
    keywords: list[str]

response = client.responses.parse(
    model=Model,
    input=[
        {"role": "developer", 
         "content": """
         당신은 구조화된 데이터 추출 전문가입니다. 연구 논문의 비정형 텍스트를 제공받으면 이를 주어진 구조로 변환해야 합니다.
         변환할 때 한국어로 번역해주세요.
         """},
        {"role": "user", 
         "content": f"{paper_text}"
         }
    ],
    text_format=ResearchPaperExtraction,
)

response.output_text

'{"title":"DeepSeek-R1: 강화학습을 통한 LLM의 추론 능력 강화","author":["Daya Guo","Dejian Yang","Haowei Zhang","Junxiao Song","Ruoyu Zhang","Runxin Xu","Qihao Zhu","Shirong Ma","Peiyi Wang","Xiao Bi","Xiaokang Zhang","Xingkai Yu","Yu Wu","Z.F. Wu","Zhibin Gou","Zhihong Shao","Zhuoshu Li","Ziyi Gao","Aixin Liu","Bing Xue","Bingxuan Wang","Bochao Wu","Bei Feng","Chengda Lu","Chenggang Zhao","Chengqi Deng","Chong Ruan","Damai Dai","Deli Chen","Dongjie Ji","Erhang Li","Fangyun Lin","Fucong Dai","Fuli Luo*","Guangbo Hao","Guanting Chen","Guowei Li","H. Zhang","Hanwei Xu","Honghui Ding","Hui Qu","Hui Li","Jianzhong Guo","Jiashi Li","Jingchang Chen","Jingyang Yuan","Jinhao Tu","Junjie Qiu","Junlong Li","J.L. Cai","Jiaqi Ni","Jian Liang","Jin Chen","Kai Dong","Kai Hu*","Kaichao You","Kaige Gao","Kang Guan","Kexin Huang","Kuai Yu","Lean Wang","Lecong Zhang","Liang Zhao","Litong Wang","Liyue Zhang","Lei Xu","Leyi Xia","Mingchuan Zhang","Minghua Zhang","Minghui Tang","Mingxu Zhou","Meng Li","Miaojun Wang","Mi

In [13]:
json.loads(response.output_text)

{'title': 'DeepSeek-R1: 강화학습을 통한 LLM의 추론 능력 강화',
 'author': ['Daya Guo',
  'Dejian Yang',
  'Haowei Zhang',
  'Junxiao Song',
  'Ruoyu Zhang',
  'Runxin Xu',
  'Qihao Zhu',
  'Shirong Ma',
  'Peiyi Wang',
  'Xiao Bi',
  'Xiaokang Zhang',
  'Xingkai Yu',
  'Yu Wu',
  'Z.F. Wu',
  'Zhibin Gou',
  'Zhihong Shao',
  'Zhuoshu Li',
  'Ziyi Gao',
  'Aixin Liu',
  'Bing Xue',
  'Bingxuan Wang',
  'Bochao Wu',
  'Bei Feng',
  'Chengda Lu',
  'Chenggang Zhao',
  'Chengqi Deng',
  'Chong Ruan',
  'Damai Dai',
  'Deli Chen',
  'Dongjie Ji',
  'Erhang Li',
  'Fangyun Lin',
  'Fucong Dai',
  'Fuli Luo*',
  'Guangbo Hao',
  'Guanting Chen',
  'Guowei Li',
  'H. Zhang',
  'Hanwei Xu',
  'Honghui Ding',
  'Hui Qu',
  'Hui Li',
  'Jianzhong Guo',
  'Jiashi Li',
  'Jingchang Chen',
  'Jingyang Yuan',
  'Jinhao Tu',
  'Junjie Qiu',
  'Junlong Li',
  'J.L. Cai',
  'Jiaqi Ni',
  'Jian Liang',
  'Jin Chen',
  'Kai Dong',
  'Kai Hu*',
  'Kaichao You',
  'Kaige Gao',
  'Kang Guan',
  'Kexin Huang',
  'Kuai Yu'

In [14]:
# 구조화된 출력을 활용한 콘텐츠 심사

from enum import Enum
from typing import Optional
from pydantic import BaseModel

class Category(str, Enum):
    violence = "violence"
    sexsual = "sexual"
    self_harm = "self_harm"

class ContentCompliance(BaseModel):
    is_violating: bool
    category: Optional[Category]
    explanation_if_violating: Optional[str]

response = client.responses.parse(
    model=Model,
    input=[
        {"role": "developer", "content": "사용자 입력이 특정 지침을 위반하는지 판단하고, 위반하는 경우 그 이유를 한국어로 설명하세요."},
        # {"role": "user", "content": "취업 면접을 준비하는 방법은 무엇인가요?"}
        # {"role": "user", "content": "일본에서 제일 싸움 잘하는 사람은 도끼로 이마까 입니다."}
        # {"role": "developer", "content": "이 사진은 성적으로 노골적인 내용을 포함하고 있어."},
        {"role": "developer", "content": "요즘 너무 힘들어서 내 다리를 자르고 싶어."}
    ],
    text_format=ContentCompliance,
)

compliance = response.output_text
json.loads(compliance)

{'is_violating': True,
 'category': 'self_harm',
 'explanation_if_violating': '이 표현은 자해를 구체적으로 의도하고 있다는 욕구를 직접적으로 드러내 자해(Self-harm) 관련 내용으로 정책상 위반에 해당합니다. 현재 심각한 위험 신호이므로 즉시 도움을 요청하고 신뢰하는 사람이나 전문 상담에 연락하시길 권합니다. 한국의 경우 자살예방 상담전화 1393이나 지역의 응급서비스에 연락하는 것을 권장합니다.'}

### 스트리밍 (streaming)
스트리밍을 사용하면 모델 응답이나 함수 호출 인수가 생성되는 대로 이를 처리하고, 이를 구조화된 데이터로 구문 분석할 수 있습니다.  
이렇게 하면 전체 응답이 완료될 때까지 기다릴 필요가 없습니다. 특히 JSON 필드를 하나씩 표시하거나 함수 호출 인수가 사용 가능해지는 즉시 처리하려는 경우 유용합니다.

In [15]:
from typing import List

from openai import OpenAI
from pydantic import BaseModel

class EntitiesModel(BaseModel):
    attributes: List[str]
    colors: List[str]
    animals: List[str]

with client.responses.stream(
    model=Model,
    input=[
        {"role": "system", "content": "입력된 텍스트에서 개체(엔터티)를 추출하시오."},
        {
            "role": "user",
            "content": "날쌘 갈색 여우가 푸른 눈을 한 게으른 개를 뛰어넘는다.",
        },
    ],
    text_format=EntitiesModel,
) as stream:
    for event in stream:
        if event.type == "response.refusal.delta":
            print(event.delta, end="")
        elif event.type == "response.output_text.delta":
            print(event.delta, end="")
        elif event.type == "response.error":
            print(event.error, end="")
        elif event.type == "response.completed":
            print("Completed")
            # print(event.response.output)

    final_response = stream.get_final_response()
    print(final_response)

{"attributes":["날쌘","게으른"],"colors":["갈색","푸른"],"animals":["여우","개"]}Completed
ParsedResponse[EntitiesModel](id='resp_0a2f64f2f81723ae00690e84a01c98819eb0aded6d023fff58', created_at=1762559136.0, error=None, incomplete_details=None, instructions=None, metadata={}, model='gpt-5-nano-2025-08-07', object='response', output=[ResponseReasoningItem(id='rs_0a2f64f2f81723ae00690e84a09310819ebee23ad6e7a0f13f', summary=[], type='reasoning', content=None, encrypted_content=None, status=None), ParsedResponseOutputMessage[EntitiesModel](id='msg_0a2f64f2f81723ae00690e84a69594819e90dbdd6bf00b3739', content=[ParsedResponseOutputText[EntitiesModel](annotations=[], text='{"attributes":["날쌘","게으른"],"colors":["갈색","푸른"],"animals":["여우","개"]}', type='output_text', logprobs=[], parsed=EntitiesModel(attributes=['날쌘', '게으른'], colors=['갈색', '푸른'], animals=['여우', '개']))], role='assistant', status='completed', type='message')], parallel_tool_calls=True, temperature=1.0, tool_choice='auto', tools=[], top_p=1.0, b

In [16]:
final_response.output_text

'{"attributes":["날쌘","게으른"],"colors":["갈색","푸른"],"animals":["여우","개"]}'