In [2]:
# 12/17(수) 10:30

# Output Parser
**Output Parser**: 대규모 언어 모델(LLM, Large Language Model)의 출력 결과를 **애플리케이션에서 활용할 수 있도록 적절한 형식으로 변환**하는 도구.
- LLM은 일반적으로 텍스트 형태로 응답을 생성하지만, 이 텍스트는 그대로 활용하기 어려운 경우가 많다.
- Output Parser는 이러한 **비구조적 텍스트 데이터를 구조화된 데이터로 변환**하여 프로그램에서 활용 가능하도록 만든다.
- 예를 들어, 키워드 리스트를 뽑거나 JSON 형식으로 정보를 변환하는 데 사용.

## 주요 Output Parser 종류

1. **CommaSeparatedListOutputParser**
   - 쉼표로 구분된 텍스트를 파싱하여 리스트 형태로 변환한다.
   - 예: `"사과, 바나나, 포도"` → `["사과", "바나나", "포도"]`
2. **JsonOutputParser**
   - LLM의 출력이 JSON 형식일 때 이를 Python의 `dict` 객체로 변환.
   - JSON(JavaScript Object Notation): 데이터 구조를 표현하기 위한 경량 포맷.
3. **PydanticOutputParser**
   - JSON 데이터를 Python의 [Pydantic](https://docs.pydantic.dev) 모델로 변환.
   - Pydantic: 데이터 유효성 검사와 설정 관리에 널리 사용되는 Python 라이브러리.
4. **StrOutputParser**
   - 모델의 출력 결과를 단순 문자열로 반환.
   - Chat 기반 모델은 Message 객체의 속성으로 LLM 결과를 반환. 거기에서 응답 문자열만 추출해서 반환.
> `JsonOutputParser`, `PydanticOutputParser` 는 모두 Pydantic을 사용해 데이터 구조(schema)를 정의하고, 해당 구조에 따라 출력을 검증하고 변환.

## 주요 메소드
- `parse(text: str)`
  - LLM이 생성한 문자열 응답을 받아 정해진 구조로 변환하여 반환.
- `get_format_instructions() -> str`
  - 각 OutputParer가 변환할 수있는 형식으로 LLM이 응답하도록 하는 프롬프트 텍스트를 반환.
  - 이 내용을 프롬프트에 넣어서 LLM이 정확한 포맷으로 응답하도록 유도.
  
## 참고
- Output Parser는 일반적으로 [`Runnable`](05_chaing_LECL.ipynb#Runnable) 인터페이스를 상속하여 구현되며, `invoke()` 메서드를 통해 실행할 수 있다.
- `invoke()`는 내부적으로 `parse()`를 호출하여 동작.
- 필요한 경우 Output Parser를 직접 구현하여 사용자 정의 출력 포맷을 처리할 수도 있다. 


## StrOutputParser
- 모델(LLM)의 출력 결과를 string으로 변환하여 반환하는 output parser.
- Chat Model은  Message 객체에서 content 속성값을 추출하여 문자열로 반환한다.

In [3]:
from dotenv import load_dotenv

load_dotenv()

True

In [4]:
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI

# 단순 질의용 prompt 생성 - from_template() 메소드 이용. (PromptTemplate용)
prompt = ChatPromptTemplate.from_template(
    template="한국의 {topic}에 관련된 속담 {count}개를 알려줘. 목록 형식으로 출력해줘."
)
model = ChatOpenAI(model="gpt-5-mini")
parser = StrOutputParser()
# prompt -> model -> parser

query = prompt.invoke({"topic":"호랑이", "count":3})
res = model.invoke(query)
final_res = parser.invoke(res)

In [5]:
res

AIMessage(content='1. 호랑이도 제 말 하면 온다. — 누군가를 말하고 있으면 그 사람이 뜻밖에 나타난다는 뜻(영어의 "speak of the devil"과 유사).\n\n2. 호랑이에게 물려가도 정신만 차리면 산다. — 큰 위험에 처해도 침착하면 살 길이 있다는 뜻(위기 상황에서 냉정함의 중요성).\n\n3. 호랑이 없는 굴에 여우가 왕. — 강한 존재가 없으면 약한 자가 그 자리를 차지하게 된다는 뜻(권력 공백 시의 상황 설명).', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 976, 'prompt_tokens': 30, 'total_tokens': 1006, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 832, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-5-mini-2025-08-07', 'system_fingerprint': None, 'id': 'chatcmpl-CncEcYFXwGpdZGqMzmWScMEc8FhBH', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--019b2a4a-72e9-7722-bce2-774fcfa8ff85-0', usage_metadata={'input_tokens': 30, 'output_tokens': 976, 'total_tokens': 1006, 'input_token_details': {'audio': 0, 'cache_read'

In [6]:
print(final_res)

1. 호랑이도 제 말 하면 온다. — 누군가를 말하고 있으면 그 사람이 뜻밖에 나타난다는 뜻(영어의 "speak of the devil"과 유사).

2. 호랑이에게 물려가도 정신만 차리면 산다. — 큰 위험에 처해도 침착하면 살 길이 있다는 뜻(위기 상황에서 냉정함의 중요성).

3. 호랑이 없는 굴에 여우가 왕. — 강한 존재가 없으면 약한 자가 그 자리를 차지하게 된다는 뜻(권력 공백 시의 상황 설명).


## CommaSeparatedListOutputParser

- 쉼표로 구분된 텍스트를 파싱하여 리스트 형태로 변환.
  - "a,b,c" => ['a','b','c']

In [7]:
from langchain_core.output_parsers import CommaSeparatedListOutputParser

parser = CommaSeparatedListOutputParser()
txt = "이순신, 유관순, 안중근, 강감찬, 세종대왕"
txt = "요청하신 이름은 이순신과 유관순과 안중근입니다."
r1 = parser.parse(txt)
r2 = parser.invoke(txt)
print(type(r1), type(r2))

<class 'list'> <class 'list'>


In [8]:
print(r1)
print(r2)

['요청하신 이름은 이순신과 유관순과 안중근입니다.']
['요청하신 이름은 이순신과 유관순과 안중근입니다.']


In [9]:
# 이 output parser에 맞는 출력을 모델이 하도록 하는 지시문으로 프롬프트에 추가한다. 
parser.get_format_instructions()

'Your response should be a list of comma separated values, eg: `foo, bar, baz` or `foo,bar,baz`'

In [10]:
parser = CommaSeparatedListOutputParser()
prompt = ChatPromptTemplate(
    messages=[
        {"role":"system", "content": "Output Format:{format_instruction}"},
        {"role":"user", "content":"{subject}에 대해 다섯가지를 나열해주세요."}
    ],
    partial_variables={"format_instruction":parser.get_format_instructions()}
)
# partial_variables={"input_variable": 넣을 값,} => input_variable의 값을 Prompt Template을 만들면서 넣어준다 
# (invoke 시 넣는 것이 아니라 생성 시 설정.)
model = ChatOpenAI(model="gpt-5-mini")

query = prompt.invoke({"subject": "자동차 종류"})
res = model.invoke(query)

In [11]:
res.content
final_res = parser.invoke(res)
final_res

['세단', 'SUV', '해치백', '쿠페', '컨버터블']

In [12]:
# 질의 -> (Prompt) -> query -> (Model) -> res -> (Parser) -> 최종 답변
# chain: 위 실행 흐름을 자동화 (pipeline)
chain = prompt | model | parser
res = chain.invoke({"subject":"오픈 소스 LLM 모델 이름"})
print(res)

['LLaMA 2', 'MPT-7B', 'Falcon-40B', 'BLOOM', 'Vicuna']


## JsonOutputParser

- JSON 형식의 응답을 dictionary로 반환.
- JSON 형식을 정하려는 경우 [Pydantic](Ref_typing_Pydantic.ipynb)을 이용해 JSON 스키마를 정의하여 JsonOutputParser 생성시 전달.
  - Pydantic 모델클래스를 이용해 LLM 모델이 응답할 때 json의 어떤 key에 어떤 응답을 작성할 지 Field로 정의.
  - Schema 지정은 필수는 아니다. 
- LLM이 JSON Schema를 따르는 형태로 응답을 하면 JsonOutputParser는 Dictionary로 변환.

In [13]:
from langchain_core.output_parsers import JsonOutputParser

parser = JsonOutputParser()
print(parser.get_format_instructions())

txt = '{"name":"홍길동", "age":20}'
r = parser.invoke(txt)
print(type(r))
r

Return a JSON object.
<class 'dict'>


{'name': '홍길동', 'age': 20}

In [None]:
parser = JsonOutputParser()
# parser = JsonOutputParser(pydantic_object=PersonInfo)

prompt = ChatPromptTemplate(
    [
        {"role":"system", "content":"Output Format: {output_format}"},
        {"role":"user", "content":"{query}"}
    ],
    partial_variables={"output_format":parser.get_format_instructions()}
)
model = ChatOpenAI(model='gpt-5-mini')

query = prompt.invoke({"query":"이순신 장군에 대해서 알려줘."})
res = model.invoke(query)

In [18]:
final_res = parser.invoke(res)

In [21]:
print(type(res.content), type(final_res))

<class 'str'> <class 'dict'>


In [20]:
res.content

'{\n  "이름": "이순신(李舜臣)",\n  "생몰": {\n    "출생연도": "1545년",\n    "사망일": "1598년 12월 16일 (노량해전에서 전사)"\n  },\n  "한줄소개": "조선 중기의 무신이자 명장. 임진왜란(1592–1598) 동안 해상에서 수많은 승리를 거두며 국난을 막아낸 장군으로, 충무공(忠武公)으로 숭앙됨.",\n  "주요업적": [\n    "임진왜란 기간 조선 수군을 지휘하여 연전연승을 거둠(해전에서 패한 적이 거의 없음).",\n    "한산도 대첩(1592) 등에서 학익진(鶴翼陣) 등 전술로 일본 함대를 격파하여 해상 우위를 확보.",\n    "명량해전(1597)에서 극소수의 함대로 압도적 수적 우위의 적을 상대로 대승을 거둠.",\n    "거북선의 전투적 운용 및 해군 전술의 발전에 기여(거북선의 기원과 설계에는 논란이 있으나 실전 운용과 개량에 중요한 역할).",\n    "해상 보급선 차단과 적의 해상 작전 봉쇄를 통해 육군 작전 지원 및 국토 방위에 결정적 기여."\n  ],\n  "주요해전(일부)": [\n    {\n      "전투명": "옥포해전",\n      "연도": "1592년",\n      "의의": "임진왜란 초기에 거둔 최초의 해전 승리 중 하나로 수군의 사기 진작."\n    },\n    {\n      "전투명": "한산도 대첩",\n      "연도": "1592년",\n      "의의": "학익진을 활용해 일본 수군의 해상 보급로를 차단하여 전략적 우위 확보."\n    },\n    {\n      "전투명": "명량해전",\n      "연도": "1597년",\n      "의의": "극소수의 전함으로 수적 우세의 일본 함대를 상대로 대승을 거둠(이순신의 대표적 역전극)."\n    },\n    {\n      "전투명": "노량해전",\n      "연도": "1598년",\n      "의의": "이 전투에서 이순신 장군이 전사함. 임진왜란의 마지막 해전 중

In [19]:
print(res.content)

{
  "이름": "이순신(李舜臣)",
  "생몰": {
    "출생연도": "1545년",
    "사망일": "1598년 12월 16일 (노량해전에서 전사)"
  },
  "한줄소개": "조선 중기의 무신이자 명장. 임진왜란(1592–1598) 동안 해상에서 수많은 승리를 거두며 국난을 막아낸 장군으로, 충무공(忠武公)으로 숭앙됨.",
  "주요업적": [
    "임진왜란 기간 조선 수군을 지휘하여 연전연승을 거둠(해전에서 패한 적이 거의 없음).",
    "한산도 대첩(1592) 등에서 학익진(鶴翼陣) 등 전술로 일본 함대를 격파하여 해상 우위를 확보.",
    "명량해전(1597)에서 극소수의 함대로 압도적 수적 우위의 적을 상대로 대승을 거둠.",
    "거북선의 전투적 운용 및 해군 전술의 발전에 기여(거북선의 기원과 설계에는 논란이 있으나 실전 운용과 개량에 중요한 역할).",
    "해상 보급선 차단과 적의 해상 작전 봉쇄를 통해 육군 작전 지원 및 국토 방위에 결정적 기여."
  ],
  "주요해전(일부)": [
    {
      "전투명": "옥포해전",
      "연도": "1592년",
      "의의": "임진왜란 초기에 거둔 최초의 해전 승리 중 하나로 수군의 사기 진작."
    },
    {
      "전투명": "한산도 대첩",
      "연도": "1592년",
      "의의": "학익진을 활용해 일본 수군의 해상 보급로를 차단하여 전략적 우위 확보."
    },
    {
      "전투명": "명량해전",
      "연도": "1597년",
      "의의": "극소수의 전함으로 수적 우세의 일본 함대를 상대로 대승을 거둠(이순신의 대표적 역전극)."
    },
    {
      "전투명": "노량해전",
      "연도": "1598년",
      "의의": "이 전투에서 이순신 장군이 전사함. 임진왜란의 마지막 해전 중 하나."
    }
  ],
  "전술·기술": [
    

In [None]:
########## 이 아래로 강사님 거 보고 채우기 #########

In [None]:
# JSON 응답 스키마 (구조 설계) 정의 -> Pydantic
from pydantic import BaseModel, Field

class 


parser = 


class PersonInfo(Base)
    

# 변수: Key
# Field.description: 변수에 넣을 내용.

In [None]:
parser2 = JsonOutputParser(pydantic_object=PersonInfo)
print(parser2.get_)

In [None]:
# parser = JsonOutputParser()
parser = JsonOutputParser(pydantic_object=PersonInfo)

prompt = ChatPromptTemplate(
    [
        {"role":"system", "content":"Output Format: {output_format}"},
        {"role":"user", "content":"{query}"}
    ],
    partial_variables={"output_format":parser.get_format_instructions()}
)
model = ChatOpenAI(model='gpt-5-mini')

query = prompt.invoke({"query":"이순신 장군에 대해서 알려줘."})
res = model.invoke(query)

## PydanticOutputParser

- JSON 형태로 받은 응답을 Pydantic 모델로 변환하여 반환한다.
- 구현은 JsonOutputParser와 동일한데 parsing 결과를 pydantic 모델타입으로 반환한다.

In [None]:
from prompt 


class 



In [None]:
from langchain_core.output_parsers import PydanticOutputParser
parser = PydanticOutputParser(pydantic_object=)

In [None]:
from 
parser = 
prompt = ChatPromptTemplate(
    [
        {"role":"system", "content":"Output Format: {output_format}"},
        {"role":"user", "content":"{query}"}
    ],
    partial_variables={"output_format":parser.get_format_instructions()}
)



query = prompt.invoke({"query":"이순신 장군에 대해서 알려줘."})
res = 

In [None]:
final_res = parser.invoke(res)
type(final_res)

In [None]:
final_res

In [None]:
final_res.name
final_res.profile

# LLM모델에 출력 형식을 설정

- ChatModel객체의 `with_structured_output(pydantic.BaseModel)` 을 이용해 모델의 출력 형식을 모델 자체에 추가할 수있다.
- `OutputParser`는 모델의 출력 결과를 받아서 형식을 변경해 준다. 그래서 Chain에 탈/부착을 통해 형식을 적용하거나 적용하지 않는 것을 자유롭게 할 수있다.
- 모델의 출력 결과를 항상 일정하게 할 경우에는 아예 **모델에 출력 형식을 설정할 수 있다.**

# Streaming 방식 응답 처리

- Streaming 방식 응답 처리란, LLM이 텍스트를 모두 생성할 때까지 기다리지 않고, 생성되는 즉시 **부분적인 결과**를 실시간으로 전달받아 처리하는 방식을 의미한다. 이는 사용자가 응답을 더 빠르게 인지할 수 있게 해 주며, 특히 대화형 서비스, 실시간 UI 출력, 긴 문서 생성과 같은 상황에서 매우 유용하게 활용된다.

- `invoke()` 요청으로 받는 응답은 **비 스트리밍 방식**으로 모든 응답 텍스트 생성이 완료된 이후 그 결과를 한 번에 반환하는 구조이다. 반면 Streaming 방식은 **토큰(token) 단위 또는 여러 토큰이 묶인 청크(chunk) 단위**로 연속적인 데이터 스트림을 전송한다는 점에서 큰 차이가 있다. 즉, Streaming은 마치 사람이 타이핑을 치듯이 응답을 실시간으로 “흘려보내는” 방식이라고 이해할 수 있다.

- `모델.invoke(input, config)` → 응답 데이터
    - 모델이 전체 응답을 모두 생성한 뒤, 최종 결과를 한 번에 반환하는 방식이다.
    - 배치 처리나 후처리가 중요한 경우에 적합하다.
- `모델.stream(input, config)` → Iterator
    - 모델이 토큰을 생성하는 즉시, 순차적으로 결과를 제공하는 Iterator 형태로 반환한다.
    - 실시간 출력, 대화형 인터페이스, 웹 스트리밍 등에 특히 적합하다.