#  LangChain의 개념과 주요 컴포넌트 이해

---

## LangChain이란 

- **LangChain**은 LLM 기반 애플리케이션 개발을 위한 프레임워크

- **Chain**은 작업을 순차적으로 실행하는 파이프라인 구조를 제공

- **Agent**는 자율적 의사결정이 가능한 실행 단위


## LangChain 컴포넌트 

- **언어 처리 기능**은 LLM/ChatModel이 중심이 되며, Prompt와 Memory로 대화를 관리

- **문서 처리와 검색**은 Document Loader, Text Splitter, Embedding, Vectorstore가 담당

- **모듈성**이 핵심 특징으로, 독립적인 컴포넌트들을 조합해 RAG와 같은 복잡한 시스템을 구현 가능 

---

# 환경 설정 및 준비

In [None]:
# 라이브러리 설치
# uv add ipykernel python-dotenv langchain langchain-openai langchain_google_genai

In [None]:
# .env 파일 설정
# OPENAI_API_KEY=your_openai_api_key
# GOOGLE_API_KEY=your_google_api_key

# File - Auto Save 체크하시면... 

In [1]:
# 환경 변수 로드
from dotenv import load_dotenv
load_dotenv(override=True)

True

# 1. 모델 (Models)
- LLM, ChatModel 등으로 구분
- OpenAI, Anthropic, Google 등 다양한 모델을 지원
- 텍스트 생성, 대화, 요약 등의 작업을 수행

In [None]:
from langchain_openai import ChatOpenAI

# OpenAI 모델을 사용하여 대화 생성
model = ChatOpenAI(model="gpt-4.1-mini", temperature=0.3)

# 모델에 메시지를 보내고 응답을 받기
response = model.invoke("안녕하세요! 모두의연구소에 오신 것을 환영합니다.")

In [3]:
# 응답 객체(AIMessage): 메시지(content)와 메타데이터(response_metadata 등)를 포함
response

AIMessage(content='안녕하세요! 어떻게 도와드릴까요?', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 10, 'prompt_tokens': 10, 'total_tokens': 20, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-4.1-nano-2025-04-14', 'system_fingerprint': 'fp_70fc5e01a5', 'id': 'chatcmpl-D5sNdLlt4I1iFpGxIu4MDtkf1wEFQ', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--019c2db0-355e-76b2-bda7-32789417b0fe-0', tool_calls=[], invalid_tool_calls=[], usage_metadata={'input_tokens': 10, 'output_tokens': 10, 'total_tokens': 20, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [4]:
# 응답 객체의 메시지 내용 출력
print("답변: ", response.content)

답변:  안녕하세요! 어떻게 도와드릴까요?


In [5]:
# 응답 객체의 메타데이터 출력
print("메타데이터: ", response.response_metadata)

메타데이터:  {'token_usage': {'completion_tokens': 10, 'prompt_tokens': 10, 'total_tokens': 20, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-4.1-nano-2025-04-14', 'system_fingerprint': 'fp_70fc5e01a5', 'id': 'chatcmpl-D5sNdLlt4I1iFpGxIu4MDtkf1wEFQ', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}


### [실습] ~ 21:20분까지 

- Google Gemini 모델을 사용하여 텍스트 생성하고 응답 객체를 확인해보세요.

- 참고: https://python.langchain.com/docs/integrations/chat/google_generative_ai/

In [8]:
# 여기에 코드를 작성하세요. 

from langchain_google_genai import ChatGoogleGenerativeAI

model = ChatGoogleGenerativeAI(
    model="gemini-2.5-flash",
    temperature=1.0,  # Gemini 3.0+ defaults to 1.0
    max_tokens=None,
    timeout=None,
    max_retries=2,
    # other params...
)

# 모델에 메시지를 보내고 응답을 받기
response = model.invoke("안녕하세요!")

In [9]:
response

AIMessage(content='안녕하세요! 만나서 반갑습니다. 무엇을 도와드릴까요?', additional_kwargs={}, response_metadata={'finish_reason': 'STOP', 'model_name': 'gemini-2.5-flash', 'safety_ratings': [], 'model_provider': 'google_genai'}, id='lc_run--019c2dc4-d4c8-7823-baae-72b6df0cebdf-0', tool_calls=[], invalid_tool_calls=[], usage_metadata={'input_tokens': 3, 'output_tokens': 44, 'total_tokens': 47, 'input_token_details': {'cache_read': 0}, 'output_token_details': {'reasoning': 32}})

# ~ 21:45분까지

# 2. 메시지 (Messages)
- Chat Model에서 사용할 수 있는 통합된 메시지 형식을 제공
- 각 모델 제공자의 특정 메시지 형식을 신경 쓰지 않고도 다양한 채팅 모델을 활용 가능

`1. HumanMessage`
- 사용자 역할에 해당 (user, human 등)
- 사용자의 입력을 처리

In [3]:
from langchain_core.messages import HumanMessage

# 사용자 메시지 생성
human_message = HumanMessage(content="Glory를 한국어로 번역해주세요.")

# 번역 요청 및 응답 받기
response = model.invoke([human_message])  # 메시지 리스트로 전달

# 답변 출력
print("답변: ", response.content)

답변:  "Glory"는 한국어로 "영광" 또는 "영예"라고 번역됩니다.


In [4]:
response

AIMessage(content='"Glory"는 한국어로 "영광" 또는 "영예"라고 번역됩니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 22, 'prompt_tokens': 17, 'total_tokens': 39, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-4.1-nano-2025-04-14', 'system_fingerprint': 'fp_70fc5e01a5', 'id': 'chatcmpl-D6DaGJDAxRB0thWrKbwG6H1bCOWTw', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--019c328b-eaa1-7ce2-a990-aa6782670e8e-0', tool_calls=[], invalid_tool_calls=[], usage_metadata={'input_tokens': 17, 'output_tokens': 22, 'total_tokens': 39, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [5]:
# 문자열을 입력하면, 자동으로 HumanMessage로 변환하여 요청
model.invoke("Glory를 한국어로 번역해주세요.")

AIMessage(content='"Glory"는 한국어로 "영광" 또는 "영예"라고 번역됩니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 22, 'prompt_tokens': 17, 'total_tokens': 39, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-4.1-nano-2025-04-14', 'system_fingerprint': 'fp_70fc5e01a5', 'id': 'chatcmpl-D6DaXd6JDVQdwRJq8wUnDQ8rAeZGt', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--019c328c-2c2a-7e01-8149-683c217c3ae7-0', tool_calls=[], invalid_tool_calls=[], usage_metadata={'input_tokens': 17, 'output_tokens': 22, 'total_tokens': 39, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

`2. AIMessage`
- AI 모델의 응답을 표현


In [6]:
# AI 모델의 응답 객체를 출력 
response

AIMessage(content='"Glory"는 한국어로 "영광" 또는 "영예"라고 번역됩니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 22, 'prompt_tokens': 17, 'total_tokens': 39, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-4.1-nano-2025-04-14', 'system_fingerprint': 'fp_70fc5e01a5', 'id': 'chatcmpl-D6DaGJDAxRB0thWrKbwG6H1bCOWTw', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--019c328b-eaa1-7ce2-a990-aa6782670e8e-0', tool_calls=[], invalid_tool_calls=[], usage_metadata={'input_tokens': 17, 'output_tokens': 22, 'total_tokens': 39, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [7]:
# 응답 객체의 자료형 확인
type(response)

langchain_core.messages.ai.AIMessage

In [8]:
# 모델 응답 텍스트 부분을 출력
response.content

'"Glory"는 한국어로 "영광" 또는 "영예"라고 번역됩니다.'

In [9]:
# 토큰 사용량 출력
response.usage_metadata

{'input_tokens': 17,
 'output_tokens': 22,
 'total_tokens': 39,
 'input_token_details': {'audio': 0, 'cache_read': 0},
 'output_token_details': {'audio': 0, 'reasoning': 0}}

`3. SystemMessage`
- 시스템 역할에 해당 (system, developer 등)
- AI 모델의 동작과 제약사항을 정의하는데 사용


In [21]:
from langchain_core.messages import SystemMessage 

# 시스템 메시지 생성
system_msg = SystemMessage(content="""당신은 영어를 한국어로 번역하는 AI 어시스턴트입니다. 사용자가 요청하는 메시지를 영어 문장을 원문 그대로 한국어로 번역합니다.""")

# 메시지 객체 확인
system_msg

SystemMessage(content='당신은 영어를 한국어로 번역하는 AI 어시스턴트입니다. 사용자가 요청하는 메시지를 영어 문장을 원문 그대로 한국어로 번역합니다.', additional_kwargs={}, response_metadata={})

In [22]:
# 번역 요청 (HumanMessage)과 시스템 메시지(SystemMessage)를 함께 사용
human_message = HumanMessage(content="Translate the word 'Glory' to Korean.")
messages = [system_msg, human_message]

# 모델에 메시지를 보내고 응답 받기
response = ChatOpenAI(model="gpt-4.1-mini", temperature=0.3).invoke(messages)

# 답변 출력
print("답변: ", response.content)

답변:  'Glory'의 한국어 번역은 '영광'입니다.


### [실습]

- Google Gemini 모델을 사용하여, 챗 메시지 목록을 기반으로 텍스트 생성하고 응답 객체를 확인해보세요.

- 참고: https://python.langchain.com/docs/integrations/chat/google_generative_ai/

In [None]:
# 여기에 코드를 작성하세요. 

# 3. 프롬프트 템플릿 (Prompt Template)
- 프롬프트 템플릿을 통해 일관된 입력 형식을 제공
    1. 사용자의 입력과 파라미터를 언어 모델이 이해할 수 있는 형태로 변환하는 도구
    2. 언어 모델에게 전달할 지시문을 만드는 틀
- 변수를 포함한 동적 프롬프트 생성이 가능
    1. 모든 템플릿은 딕셔너리 형태의 입력을 받아서 처리
    2. 출력은 PromptValue 형태로 반환되며, 이는 문자열이나 메시지 리스트로 변환 가능

`1. 문자열 프롬프트 템플릿 (String PromptTemplate)`
- 가장 기본적인 형태
- 단일 문자열을 형식화하는데 사용

In [23]:
from langchain_core.prompts import PromptTemplate

# 템플릿 생성 
# "{topic}에 대한 이야기를 해줘"라는 템플릿을 사용하여
# topic이라는 변수를 포함하는 프롬프트를 생성
template = PromptTemplate.from_template("{topic}에 대한 이야기를 해줘")

# 템플릿 사용
# "고양이"라는 주제를 사용하여 프롬프트 생성
# invoke 메서드를 통해 템플릿에 값을 전달
prompt = template.invoke({"topic": "강아지"})

# 템플릿 출력
prompt

StringPromptValue(text='강아지에 대한 이야기를 해줘')

`2. 채팅 프롬프트 템플릿 (ChatPromptTemplate)`
- 여러 메시지를 포함하는 대화형 템플릿을 만들 때 사용

In [24]:
from langchain_core.prompts import ChatPromptTemplate

# 채팅 템플릿 생성
# 여기서는 시스템 메시지와 사용자 메시지를 포함하여 정의
template = ChatPromptTemplate.from_messages([
    ("system", "당신은 도움이 되는 비서입니다"),
    ("user", "{subject}에 대해 설명해주세요")
])

# 템플릿 사용
prompt = template.invoke({"subject": "인공지능"})

# 출력
prompt

ChatPromptValue(messages=[SystemMessage(content='당신은 도움이 되는 비서입니다', additional_kwargs={}, response_metadata={}), HumanMessage(content='인공지능에 대해 설명해주세요', additional_kwargs={}, response_metadata={})])

In [25]:
prompt.messages

[SystemMessage(content='당신은 도움이 되는 비서입니다', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='인공지능에 대해 설명해주세요', additional_kwargs={}, response_metadata={})]

`3. 메시지 플레이스홀더 (MessagesPlaceholder)`
- 기존 메시지 목록을 템플릿의 특정 위치에 삽입할 때 사용

In [26]:
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.messages import HumanMessage, AIMessage

# 메시지 플레이스홀더가 있는 템플릿
template = ChatPromptTemplate.from_messages([
    ("system", "당신은 도움이 되는 비서입니다"),
    MessagesPlaceholder("chat_history")   # 채팅 기록을 플레이스홀더로 사용 (예: 이전 대화 내용) -> 이 위치에 메시지 목록을 추가할 수 있음
])

# 템플릿 사용
prompt = template.invoke({
    "chat_history": [
        HumanMessage(content="안녕하세요! 제 이름은 스티브입니다."),
        AIMessage(content="안녕하세요! 무엇을 도와드릴까요?"),
        HumanMessage(content="제 이름을 기억하나요?")
        ]
})

# 출력
prompt.messages

[SystemMessage(content='당신은 도움이 되는 비서입니다', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='안녕하세요! 제 이름은 스티브입니다.', additional_kwargs={}, response_metadata={}),
 AIMessage(content='안녕하세요! 무엇을 도와드릴까요?', additional_kwargs={}, response_metadata={}, tool_calls=[], invalid_tool_calls=[]),
 HumanMessage(content='제 이름을 기억하나요?', additional_kwargs={}, response_metadata={})]

In [27]:
model.invoke(prompt)

AIMessage(content='네, 스티브님! 기억하고 있습니다. 어떻게 도와드릴까요?', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 18, 'prompt_tokens': 56, 'total_tokens': 74, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-4.1-nano-2025-04-14', 'system_fingerprint': 'fp_70fc5e01a5', 'id': 'chatcmpl-D6Dut6UaoG8BsuUEUvZRRbuZSKvzX', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--019c329f-6d43-7830-868e-3bd41efbf652-0', tool_calls=[], invalid_tool_calls=[], usage_metadata={'input_tokens': 56, 'output_tokens': 18, 'total_tokens': 74, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

### [실습] ~ 20:15분까지

- 프롬프트 템플릿을 사용하여, 입력받은 텍스트를 요약하는 템플릿을 작성하고, Google Gemini 모델을 사용하여 요약 결과를 확인해보세요.

In [None]:
# 여기에 코드를 작성하세요. 

summary_template = ChatPromptTemplate.from_messages([
    ("system", "당신은 문서 요약 전문가입니다. 입력받은 텍스트를 핵심 내용 위주로 요약합니다."),
    ("user", "{text}")
])

summary_prompt = summary_template.invoke({'text': news_article})

summary_prompt

ChatPromptValue(messages=[SystemMessage(content='당신은 문서 요약 전문가입니다. 입력받은 텍스트를 핵심 내용 위주로 요약합니다.', additional_kwargs={}, response_metadata={}), HumanMessage(content='\n"복잡한 납세 등 AI가 돕는다"…정부, 초거대 AI 공공서비스 개발\n입력2025.06.20. 오후 12:00  수정2025.06.20. 오후 1:39 \n\n[서울=뉴시스]윤현성 기자 = 정부가 공공분야에 도입할 초거대 인공지능(AI) 기반 국민 편의 서비스 본격 개발에 나선다. 세금 납부 시 생성형 AI 챗봇을 통해 어려운 세무 용어 등에 대한 설명·상담을 듣거나, 대량의 민원업무도 생성형 AI 기반 분석으로 빠르게 답변·응대하는 등의 형태다.\n\n과학기술정보통신부와 디지털플랫폼정부위원회는 2025년도 \'초거대 AI 서비스 개발 지원\' 사업을 본격 추진하기 위해 수행기업 공모를 실시한다고 20일 밝혔다. 이 사업은 공공분야에 초거대 AI를 도입·확산하고 이를 통해 행정 효율화, 대국민 서비스 혁신, 사회현안 해결이 가능한 서비스 개발을 목표로 추진된다.\n\n올해는 다양한 공공분야에서 초거대 AI 기술을 통해 국민이 체감할 수 있고 실질적인 변화를 가져올 수 있는 과제를 중점적으로 발굴했다. 중앙부처·지자체·공공기관을 대상으로 1~2월에 과제 공모를 추진했으며 총 5개 과제가 선정됐다.\n\n국민권익위원회의 \'생성형 AI 기반 국민소통·민원분석 체계 구축\'은 국민소통시스템에 생성형 AI 기반 민원분석 체계를 도입해 민원처리 행정 효율화와 답변품질을 향상시킨다. 이를 통해 대량의 민원업무를 신속·효율적으로 대응해 민원업무의 효율성을 증대하고 국민의 신뢰도 향상에도 기여할 것으로 기대된다.\n\n국세청의 \'생성형 AI 기반 국세 상담 지원 서비스\'는 납세자가 홈택스 이용 시 전자신고 관련한 문의사항을 즉시 해소할 수 있는 실시간 상담 서비스를 제공한다. 홈

In [30]:
model.invoke(summary_prompt)

AIMessage(content="정부는 공공분야에 초거대 인공지능(AI) 기반 국민 편의 서비스 개발을 추진한다. 2025년 '초거대 AI 서비스 개발 지원' 사업을 통해 민원 상담, 세무·국제인증·건강보험·지방재정 등 다양한 분야에서 AI 도입을 확대하며 행정 효율화와 국민 서비스 혁신을 목표로 한다. 선정된 5개 과제는 민원 분석, 세무 상담, 해외인증 지원, 맞춤형 민원 상담, 지방재정 지능화 서비스 등으로, 민간 기업과 협력하여 개발 및 입찰이 진행될 예정이다. 정부는 민·관 협력을 통해 실질적 성과 창출과 공공 서비스 품질 향상에 집중할 계획이다.", additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 170, 'prompt_tokens': 1166, 'total_tokens': 1336, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-4.1-nano-2025-04-14', 'system_fingerprint': 'fp_70fc5e01a5', 'id': 'chatcmpl-D6E8X5wtGOZxVRGk3twchTCqIwgLw', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--019c32ac-579d-7383-bcb1-d3f4f79dab80-0', tool_calls=[], invalid_tool_calls=[], usage_metadata=

# 4. 출력 파서 (Output Parser)
1. **역할과 기능**
    - 모델의 텍스트 출력을 구조화된 데이터로 변환
    - 채팅 모델과 LLM의 출력을 정규화
    - 다운스트림 작업을 위한 데이터 형식 변환

2. **사용 시 고려사항**
    - OpenAI function calling과 같은 기능이 있는 경우, 해당 기능을 우선 사용

`(1) StrOutputParser`

In [31]:
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import PromptTemplate
from langchain_openai import ChatOpenAI

# 기본적인 문자열 파서 사용
parser = StrOutputParser()

# 프롬프트 템플릿 설정
prompt = PromptTemplate.from_template("도시 {city}의 특징을 알려주세요")

# 모델 정의
model = ChatOpenAI(model='gpt-4.1-mini')

# LCEL 체인 구성
chain = prompt | model | parser

# 체인 실행
result = chain.invoke({"city": "서울"})

# 결과 출력
print(result)

서울은 대한민국의 수도이자 최대 도시로서 여러 가지 특징을 가지고 있습니다. 주요 특징을 정리하면 다음과 같습니다:

1. **정치와 행정의 중심지**  
   서울은 대한민국의 정부 청사, 대통령 집무실(청와대), 국회 등 주요 정치 기관이 위치한 곳으로 국가의 행정 중심지입니다.

2. **경제의 중심지**  
   국내외 대기업 본사, 금융기관, 증권시장(코스피)이 밀집해 있으며, 경제 활동이 매우 활발한 도시입니다.

3. **문화와 역사**  
   조선시대 궁궐(경복궁, 창덕궁 등), 전통 문화 공간과 현대적인 미술관, 박물관, 공연장 등이 공존하며 풍부한 역사와 문화를 경험할 수 있습니다.

4. **교육의 중심지**  
   서울에는 서울대학교, 연세대학교, 고려대학교 등 국내 최고 수준의 대학교와 다양한 연구기관이 위치해 교육과 연구의 중심지 역할을 합니다.

5. **교통 허브**  
   지하철, 버스, 고속철도(KTX), 공항(인천국제공항과 김포국제공항) 등 다양한 교통수단이 발달해 국내외로의 접근성이 뛰어납니다.

6. **인구와 도시 구조**  
   약 천만 명의 인구가 거주하며, 고층 빌딩과 아파트 단지가 많고, 강남 지역과 강북 지역으로 나뉘어 다양한 생활 양식과 경제적 차이를 보입니다.

7. **첨단 기술과 스마트시티**  
   IT 산업과 스타트업이 활성화되어 있으며, 스마트시티 프로젝트를 통해 첨단 정보통신기술(ICT)을 활용한 도시 관리가 이루어지고 있습니다.

서울은 이처럼 역사와 현대가 어우러진 국제도시이며, 정치, 경제, 문화, 교육 등 다양한 분야에서 대한민국을 대표하는 중심 도시입니다.


`(2) 구조화된 출력 (with_structured_output 메소드)`

In [None]:
from pydantic import BaseModel, Field
from typing import List

# Pydantic 클래스로 출력 구조를 정의
class NewsInfo(BaseModel):
    """뉴스 기사에 대한 정보"""
    title: str = Field(description="기사 제목")
    content: str = Field(description="기사 내용 (원문 그대로 추출)")
    press: str = Field(description="언론사")
    author: str = Field(description="작성자 이름")
    published_date: List[str] = Field(description="작성일(예: 2023년 1월 1일)")

In [28]:
# 뉴스 기사 예제 데이터
news_article = """
"복잡한 납세 등 AI가 돕는다"…정부, 초거대 AI 공공서비스 개발
입력2025.06.20. 오후 12:00  수정2025.06.20. 오후 1:39 

[서울=뉴시스]윤현성 기자 = 정부가 공공분야에 도입할 초거대 인공지능(AI) 기반 국민 편의 서비스 본격 개발에 나선다. 세금 납부 시 생성형 AI 챗봇을 통해 어려운 세무 용어 등에 대한 설명·상담을 듣거나, 대량의 민원업무도 생성형 AI 기반 분석으로 빠르게 답변·응대하는 등의 형태다.

과학기술정보통신부와 디지털플랫폼정부위원회는 2025년도 '초거대 AI 서비스 개발 지원' 사업을 본격 추진하기 위해 수행기업 공모를 실시한다고 20일 밝혔다. 이 사업은 공공분야에 초거대 AI를 도입·확산하고 이를 통해 행정 효율화, 대국민 서비스 혁신, 사회현안 해결이 가능한 서비스 개발을 목표로 추진된다.

올해는 다양한 공공분야에서 초거대 AI 기술을 통해 국민이 체감할 수 있고 실질적인 변화를 가져올 수 있는 과제를 중점적으로 발굴했다. 중앙부처·지자체·공공기관을 대상으로 1~2월에 과제 공모를 추진했으며 총 5개 과제가 선정됐다.

국민권익위원회의 '생성형 AI 기반 국민소통·민원분석 체계 구축'은 국민소통시스템에 생성형 AI 기반 민원분석 체계를 도입해 민원처리 행정 효율화와 답변품질을 향상시킨다. 이를 통해 대량의 민원업무를 신속·효율적으로 대응해 민원업무의 효율성을 증대하고 국민의 신뢰도 향상에도 기여할 것으로 기대된다.

국세청의 '생성형 AI 기반 국세 상담 지원 서비스'는 납세자가 홈택스 이용 시 전자신고 관련한 문의사항을 즉시 해소할 수 있는 실시간 상담 서비스를 제공한다. 홈택스에 상담전용 AI챗봇을 도입해 전화 상담 시 발생하는 장시간 대기 문제를 해결하고, 어려운 세무 용어 등으로 인한 불편사항을 개선할 예정이다.

산업통상자원부의 '해외인증 공공특화 AI 에이전트 서비스'는 모바일 플랫폼, 소셜네트워크서비스 등 사용자 친화적인 모바일 기반 해외인증 특화 AI 에이전트 서비스를 제공한다. 중소기업이 겪는 수출 관련 애로사항인 해외 인증과 관련된 정보와 질의 응답을 AI기반으로 제공하여 손쉽게 확인할 수 있을 것으로 기대된다.

국민건강보험공단의 '에이전틱 AI기반 전국민 맞춤형 민원 상담 서비스'는 국민 생활과 편익에 직결되는 건강보험 민원 상담업무에 AI를 도입해 24시간 개인 맞춤형 민원 상담 서비스를 구현한다. 기존의 전화 상담 방식의 대기 시간 문제 등을 해소하고, 고객센터 집중 상담을 분산시켜 업무의 효율성을 향상시키는데 기여할 것으로 전망이다.

한국지역정보개발원의 '지방재정 지능화 서비스'는 e호조+, 지방재정365 등 지방재정서비스에 생성형 AI를 접목시켜 대국민, 공무원 등 각자의 요구에 부합하는 융복합 재정정보서비스 환경을 제공하고자 한다. 이 서비스가 도입되면 지방정부의 사회현안 해결을 위한 정책 수립의 적시성 향상 및 전문성 확보, 지자체 정보 접근성 강화로 대국민의 사회 참여 기회를 확대할 것으로 예상된다.

이번 사업은 19일 국민권익위원회와 국세청 과제의 민간 전문기업 조달 공고를 시작으로, 5개 과제별 서비스 개발지원 사업이 순차적으로 입찰공고될 예정이다.

김경만 과기정통부 인공지능기반정책관은 "선정된 과제에 대해 민·관 협력을 기반으로 행정 현장의 변화와 국민이 체감할 수 있는 성과가 창출·확산될 수 있도록 적극 지원할 계획"이라며 "개발된 서비스는 공공분야에서 행정업무의 효율성을 높이고 대국민 서비스 품질을 높이는 데 실질적으로 기여할 수 있도록 민간에서도 많은 관심을 가져주실 것을 부탁드린다"고 말했다.

이승현 디플정위 인공지능·플랫폼혁신국장은 "이번 사업은 노동, 복지, 민원 등 다양한 공공 분야에 AI를 도입·활용하는데 중요한 역할을 하고 있다"며 "올해도 AI를 활용해 사회문제를 해결하고, 대국민 서비스를 혁신적으로 개선할 수 있는 서비스가 개발되길 기대한다"고 전했다．

윤현성 기자(hsyhs@newsis.com)
"""

In [40]:
# from langchain_core.prompts import PromptTemplate
# from langchain_openai import ChatOpenAI

# 프롬프트 템플릿 생성
prompt = PromptTemplate.from_template(
    """다음 뉴스 기사에서 관련 정보를 출력 스키마에 맞춰서 추출해주세요. 예시를 참고하세요.

    ## 뉴스 기사
    {news_content}

    ## 출력 스키마
    - title: 기사 제목
    - content: 기사 내용 (원문 그대로 추출)
    - press: 언론사
    - author: 작성자 이름. 반드시 '이름,성' 순서로 추출!!!(예: 길동,홍)
    - published_date: 작성일(예: 2023년 1월 1일)
    """
    )

# 모델 생성 및 구조화된 출력 바인딩
model = ChatOpenAI(model="gpt-4.1-mini", temperature=0)
structured_model = model.with_structured_output(NewsInfo)

# 프롬프트와 모델 체인 연결
chain = prompt | structured_model

# 체인 실행
result = chain.invoke({"news_content": news_article})

In [41]:
# 결과 출력 (NewsInfo 객체)
print(type(result))
print("-" * 20)
print(result)
print("-" * 20)
print(f"기사 제목: {result.title}")
print(f"언론사: {result.press}")
print(f"작성자: {result.author}")
print(f"작성일: {result.published_date}")

<class '__main__.NewsInfo'>
--------------------
title='"복잡한 납세 등 AI가 돕는다"…정부, 초거대 AI 공공서비스 개발' content='입력2025.06.20. 오후 12:00  수정2025.06.20. 오후 1:39 \n\n[서울=뉴시스]윤현성 기자 = 정부가 공공분야에 도입할 초거대 인공지능(AI) 기반 국민 편의 서비스 본격 개발에 나선다. 세금 납부 시 생성형 AI 챗봇을 통해 어려운 세무 용어 등에 대한 설명·상담을 듣거나, 대량의 민원업무도 생성형 AI 기반 분석으로 빠르게 답변·응대하는 등의 형태다.\n\n과학기술정보통신부와 디지털플랫폼정부위원회는 2025년도 \'초거대 AI 서비스 개발 지원\' 사업을 본격 추진하기 위해 수행기업 공모를 실시한다고 20일 밝혔다. 이 사업은 공공분야에 초거대 AI를 도입·확산하고 이를 통해 행정 효율화, 대국민 서비스 혁신, 사회현안 해결이 가능한 서비스 개발을 목표로 추진된다.\n\n올해는 다양한 공공분야에서 초거대 AI 기술을 통해 국민이 체감할 수 있고 실질적인 변화를 가져올 수 있는 과제를 중점적으로 발굴했다. 중앙부처·지자체·공공기관을 대상으로 1~2월에 과제 공모를 추진했으며 총 5개 과제가 선정됐다.\n\n국민권익위원회의 \'생성형 AI 기반 국민소통·민원분석 체계 구축\'은 국민소통시스템에 생성형 AI 기반 민원분석 체계를 도입해 민원처리 행정 효율화와 답변품질을 향상시킨다. 이를 통해 대량의 민원업무를 신속·효율적으로 대응해 민원업무의 효율성을 증대하고 국민의 신뢰도 향상에도 기여할 것으로 기대된다.\n\n국세청의 \'생성형 AI 기반 국세 상담 지원 서비스\'는 납세자가 홈택스 이용 시 전자신고 관련한 문의사항을 즉시 해소할 수 있는 실시간 상담 서비스를 제공한다. 홈택스에 상담전용 AI챗봇을 도입해 전화 상담 시 발생하는 장시간 대기 문제를 해결하고, 어려운 세무 용어 등으로 인한 불편사항을 개선할 예정이다.\n\n산업통상자원부의 \'해외인증

In [42]:
# 결과를 JSON으로 출력
result.model_dump()

{'title': '"복잡한 납세 등 AI가 돕는다"…정부, 초거대 AI 공공서비스 개발',
 'content': '입력2025.06.20. 오후 12:00  수정2025.06.20. 오후 1:39 \n\n[서울=뉴시스]윤현성 기자 = 정부가 공공분야에 도입할 초거대 인공지능(AI) 기반 국민 편의 서비스 본격 개발에 나선다. 세금 납부 시 생성형 AI 챗봇을 통해 어려운 세무 용어 등에 대한 설명·상담을 듣거나, 대량의 민원업무도 생성형 AI 기반 분석으로 빠르게 답변·응대하는 등의 형태다.\n\n과학기술정보통신부와 디지털플랫폼정부위원회는 2025년도 \'초거대 AI 서비스 개발 지원\' 사업을 본격 추진하기 위해 수행기업 공모를 실시한다고 20일 밝혔다. 이 사업은 공공분야에 초거대 AI를 도입·확산하고 이를 통해 행정 효율화, 대국민 서비스 혁신, 사회현안 해결이 가능한 서비스 개발을 목표로 추진된다.\n\n올해는 다양한 공공분야에서 초거대 AI 기술을 통해 국민이 체감할 수 있고 실질적인 변화를 가져올 수 있는 과제를 중점적으로 발굴했다. 중앙부처·지자체·공공기관을 대상으로 1~2월에 과제 공모를 추진했으며 총 5개 과제가 선정됐다.\n\n국민권익위원회의 \'생성형 AI 기반 국민소통·민원분석 체계 구축\'은 국민소통시스템에 생성형 AI 기반 민원분석 체계를 도입해 민원처리 행정 효율화와 답변품질을 향상시킨다. 이를 통해 대량의 민원업무를 신속·효율적으로 대응해 민원업무의 효율성을 증대하고 국민의 신뢰도 향상에도 기여할 것으로 기대된다.\n\n국세청의 \'생성형 AI 기반 국세 상담 지원 서비스\'는 납세자가 홈택스 이용 시 전자신고 관련한 문의사항을 즉시 해소할 수 있는 실시간 상담 서비스를 제공한다. 홈택스에 상담전용 AI챗봇을 도입해 전화 상담 시 발생하는 장시간 대기 문제를 해결하고, 어려운 세무 용어 등으로 인한 불편사항을 개선할 예정이다.\n\n산업통상자원부의 \'해외인증 공공특화 AI 에이전트 서비스\'는 모바일 플랫폼, 소셜네트워크서비스 

---

### [실습] 

- 구조화된 출력을 사용하여, 뉴스 기사에서 언론사, 기사 제목, 기사 내용, 작성자, 작성일을 추출해보세요.

In [None]:
# 실제 뉴스 기사를 복사하여 사용하세요.
# news_article은 위 Cell에 정의되어 있습니다.