## **챗 모델과 Message를 사용해 간단한 LLM 애플리케이션 구축하기**

In [1]:
import os
from dotenv import load_dotenv
load_dotenv()

True

In [15]:
# os.environ

## 언어 모델 사용하기

LangChain은 다양한 언어 모델을 지원하며, 이들을 서로 교체하여 사용할 수 있습니다.

In [3]:
from langchain.chat_models import init_chat_model

model = init_chat_model("gpt-5-nano", model_provider="openai")
# model = init_chat_model("gemini-2.5-flash", model_provider="google_genai")

ChatModels은 LangChain Runnables의 인스턴스로, 표준화된 인터페이스를 통해 상호작용할 수 있습니다. 모델을 간단히 호출하려면 `.invoke` 메서드에 Messages 목록을 전달하면 됩니다.

## 메시지 (Messages)

메시지(Messages) 는 LangChain에서 모델이 사용하는 컨텍스트의 기본 단위입니다.
이들은 모델의 입력(input) 과 출력(output) 을 나타내며, LLM과의 상호작용에서 대화의 상태(state)를 표현하는 데 필요한 콘텐츠(content) 와 메타데이터(metadata) 를 함께 포함합니다.

메시지는 다음 요소들로 구성됩니다:

- Role (역할)
→ 메시지의 유형을 식별합니다. 예: system, user, assistant 등  
- Content (내용)
→ 메시지의 실제 내용으로, 텍스트뿐만 아니라 이미지, 오디오, 문서 등 다양한 형식을 포함할 수 있습니다.  
- Metadata (메타데이터)
→ 선택적(optional) 필드로, 응답 정보(response info), 메시지 ID, 토큰 사용량(token usage) 등 부가 정보를 담습니다.

In [4]:
from langchain_core.messages import HumanMessage, SystemMessage

# 메시지 목록을 생성
messages = [
    # 시스템 메시지: 모델에게 수행할 작업이나 역할을 지시합니다.
    SystemMessage("다음을 영어에서 한국어로 번역하세요. 상세한 설명 말고 단순히 번역만 하세요."),
    # 사용자 메시지: 사용자가 모델에 보낼 실제 입력 내용입니다.
    HumanMessage("What is LangChain?"),
]

answer = model.invoke(messages)  # `invoke` 메서드를 사용해 모델을 호출합니다.
answer

AIMessage(content='LangChain이란 무엇입니까?', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 209, 'prompt_tokens': 40, 'total_tokens': 249, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 192, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-5-nano-2025-08-07', 'system_fingerprint': None, 'id': 'chatcmpl-Ce9015uzb1k3oxcNZFBfArL2maLX0', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--6e06e98c-2af9-4a3d-a8a3-5f0d5721ebea-0', usage_metadata={'input_tokens': 40, 'output_tokens': 209, 'total_tokens': 249, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 192}})

In [5]:
answer.pretty_print()


LangChain이란 무엇입니까?


### 텍스트 프롬프트 (Text prompts)

**텍스트 프롬프트(Text prompts)** 는 단순한 **문자열(string)** 형태로 제공됩니다.  
대화 기록(conversation history)을 유지할 필요가 없는 **단순한 생성 작업**(예: 요약, 문장 생성, 번역 등)에 적합합니다.

In [6]:
response = model.invoke("LLM 에 관한 시를 5줄 이내로 지어주세요.")
response.pretty_print()


토큰의 바다를 헤엄치는 LLM, 말의 심장을 울린다.
질문은 은빛 파도, 맥락은 그 위를 잇는 다리.
수정된 문장이 모여 이야기를 펼치고, 지식은 별처럼 빛난다.
우리는 물음과 답의 대화를 통해 서로의 상상을 넓힌다.


### 딕셔너리 형식 (Dictionary format)

OpenAI의 **Chat Completions 포맷**을 사용해 메시지를 **딕셔너리 형태로 직접 지정**할 수도 있습니다.

In [7]:
# OpenAI 형식
answer = model.invoke([
    {"role": "system", "content": "다음을 영어에서 한국어로 번역하세요. 상세한 설명 말고 단순히 번역만 하세요."},
    {"role": "user", "content": "What is LangChain?"},
])
answer.pretty_print()


LangChain이란 무엇인가요?


--------------
## 메시지 유형 (Message types)

* **System message (시스템 메시지)**
  → 모델이 어떻게 행동해야 하는지 지시하고, 상호작용의 **맥락(context)** 을 제공합니다.  
* **Human message (사용자 메시지)**
  → 사용자의 입력을 나타내며, 모델과의 **대화(interaction)** 를 구성합니다.  
* **AI message (AI 메시지)**
  → 모델이 생성한 응답으로, **텍스트 내용(text content)** 뿐 아니라
  **도구 호출(tool calls)** 및 **메타데이터(metadata)** 를 포함할 수 있습니다.  
* **Tool message (도구 메시지)**
  → 모델이 호출한 **도구의 실행 결과(outputs)** 를 나타냅니다.

In [8]:
from langchain.messages import SystemMessage, HumanMessage

system_msg = SystemMessage("""
당신은 웹 프레임워크에 전문성을 가진 시니어 Python 개발자입니다.
설명은 간결하게 5줄 이내로 설명하세요.
""")

messages = [
    system_msg,
    HumanMessage("REST API를 어떻게 만들 수 있나요?")
]
response = model.invoke(messages)
response.pretty_print()


- 프레임워크 선택: FastAPI(현대적이고 문서화 자동) 또는 Django REST Framework 등.
- 모델/리소스 정의와 RESTful 엔드포인트 설계: 예를 들어 /items, /items/{id}를 GET/POST/PUT/PATCH/DELETE로 매핑.
- 직렬화 및 유효성 검증: FastAPI의 Pydantic 또는 DRF Serializer 활용.
- DB 연결/비즈니스 로직: ORM으로 모델링, 마이그레이션, 인증(JWT 등) 추가.
- 테스트와 배포: 자동 문서(OpenAPI/Swagger), Uvicorn/Gunicorn 같은 서버로 배포 및 모니터링.


### AI 메시지 (AI Message)

**AIMessage** 는 **모델 호출(model invocation)** 의 **출력 결과**를 나타냅니다.
이 메시지에는 다음과 같은 요소들을 포함할 수 있습니다:

* **멀티모달 데이터 (Multimodal data)** — 텍스트뿐만 아니라 이미지, 오디오 등의 출력
* **도구 호출 (Tool calls)** — 모델이 외부 도구를 실행한 기록
* **제공자별 메타데이터 (Provider-specific metadata)** — 모델 제공자(OpenAI, Anthropic 등)에 따라 추가로 제공되는 정보

이러한 메타데이터는 나중에 접근하거나 분석할 수 있습니다.

In [9]:
response = model.invoke("AI에 대해서 한줄로 설명해줘.")
print(type(response))  
response

<class 'langchain_core.messages.ai.AIMessage'>


AIMessage(content='AI(인공지능)은 데이터를 기반으로 학습하고 패턴을 인식해 인간처럼 문제를 해결하거나 의사결정을 도와주는 컴퓨터 시스템의 능력이다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 304, 'prompt_tokens': 16, 'total_tokens': 320, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 256, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-5-nano-2025-08-07', 'system_fingerprint': None, 'id': 'chatcmpl-Ce90vt3zmAN0NrZU8ThMH4WDPK1wj', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--9ba1a778-314d-4ebd-bdcc-e8234dcb62eb-0', usage_metadata={'input_tokens': 16, 'output_tokens': 304, 'total_tokens': 320, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 256}})

In [10]:
from langchain.messages import AIMessage, SystemMessage, HumanMessage

# AI 메시지를 수동으로 생성 (예: 대화 기록에 추가하기 위해)
ai_msg = AIMessage("그 질문에 기꺼이 도움을 드리겠습니다!")

# 대화 기록에 추가
messages = [
    SystemMessage("당신은 도움이 되는 어시스턴트입니다."),
    HumanMessage("저를 도와주실 수 있나요?"),
    ai_msg,  # 모델이 이전에 응답한 것처럼 삽입
    HumanMessage("좋아요! 그럼 2 + 2는 얼마인가요?")
]

response = model.invoke(messages)
response.pretty_print()


2 + 2 = 4 입니다.


### 토큰 사용량 (Token usage)

**AIMessage** 객체는 `usage_metadata` 필드에
**토큰 사용량(token counts)** 및 기타 **사용 관련 메타데이터(metadata)** 를 저장할 수 있습니다.

In [12]:
response = model.invoke("Hello!")
response.usage_metadata

{'input_tokens': 8,
 'output_tokens': 355,
 'total_tokens': 363,
 'input_token_details': {'audio': 0, 'cache_read': 0},
 'output_token_details': {'audio': 0, 'reasoning': 256}}

### batch interface 이용 여러개의 메시지 일괄 처리

In [13]:
# 메시지 목록을 생성
batch_messages = [
    [
        SystemMessage("다음을 영어에서 한국어로 번역하세요. 상세한 설명 말고 단순히 번역만 하세요."),
        HumanMessage("What is LangChain?")
    ],
    [
        SystemMessage("다음을 영어에서 한국어로 번역하세요. 상세한 설명 말고 단순히 번역만 하세요."),
        HumanMessage("How does LangChain work?")
    ],
    [
        SystemMessage("다음을 영어에서 한국어로 번역하세요. 상세한 설명 말고 단순히 번역만 하세요."),
        HumanMessage("What are the key features of LangChain?")
    ]
]

# `model.batch()`을 사용하여 여러 개의 메시지를 한 번에 처리
# LangChain은 각 입력을 독립된 invoke() 호출처럼 처리
answers = model.batch(batch_messages)
answers

[AIMessage(content='LangChain이 무엇인가요?', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 208, 'prompt_tokens': 40, 'total_tokens': 248, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 192, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-5-nano-2025-08-07', 'system_fingerprint': None, 'id': 'chatcmpl-Ce9AtIdhbfiIjAaV54GZhdAc6SwfF', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--996cfa1a-7b37-4ef2-9734-8025c9c43cd4-0', usage_metadata={'input_tokens': 40, 'output_tokens': 208, 'total_tokens': 248, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 192}}),
 AIMessage(content='LangChain은 어떻게 작동합니까?', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 274, 'prompt_toke

In [14]:
# 결과 출력
for idx, ans in enumerate(answers):
    print(f"번역 {idx + 1}: {ans.content}")

번역 1: LangChain이 무엇인가요?
번역 2: LangChain은 어떻게 작동합니까?
번역 3: LangChain의 주요 특징은 무엇입니까?


### stream inferface 를 이용한 출력 

In [16]:
# 스트리밍 중에 받아온 chunk 들을 저장할 리스트
chunks = []

# 전체 메시지를 누적할 변수
full_message = None

# model.stream() 은 토큰(혹은 chunk)을 스트리밍 방식으로 하나씩 생성
for chunk in model.stream("LangChain의 주요 기능은 무엇인가요?"):
    
    chunks.append(chunk)
    print(chunk.text)   # 현재 chunk 의 텍스트 출력 
    
    # full_message 에 chunk 를 누적
    # 첫 chunk 일 경우 full_message 가 None 이므로 그대로 저장
    # 이후부터는 기존 full_message 에 chunk 를 더해(concat) 전체 메시지를 구성
    full_message = chunk if full_message is None else full_message + chunk


여
러
 가지
 L
LM
 기반
 애
플
리
케
이션
을
 쉽게
 구축
하도록
 돕
는
 프
레
임
워크
가
 Lang
Chain
입니다
.
 주요
 기능
을
 요
약
하면
 다음
과
 같습니다
.


-
 L
LM
 및
 프
롬
프트
 관리


 
 -
 다양한
 L
LM
 공급
자
와
의
 래
퍼
 지원
(Open
AI
,
 Coh
ere
,
 Hug
ging
Face
 등
)

 
 -
 Prompt
Template
,
 Chat
Prompt
Template
 등을
 이용
한
 재
사용
 가능한
 프
롬
프트
 구성



-
 체
인
(
Chain
)
 기반
 파
이
프
라인


 
 -
 L
LM
Chain
,
 Simple
Sequential
Chain
,
 Sequential
Chain
 등
으로
 여러
 L
LM
 호출
을
 순
차
적으로
 연결


 
 -
 파
이
프
라인
 형태
의
 로
직
을
 손
쉽
게
 구성
하고
 재
사용
 가능



-
 도
구
(T
ools
)
와
 에
이
전
트
(
Agents
)

 
 -
 외
부
 API
 호출
,
 계산
기
,
 웹
 검색
 등
 외
부
 기능
에
 접근
하는
 Tools
 제공


 
 -
 에
이
전
트
가
 도
구
를
 선택
하고
 실행
하도록
 하는
 Agent
Executor
/
Re
Act
 스타일
의
 패
턴
 지원


 
 -
 계획
(plan
)
–
행
동
(act
)
 순
환
 구조
를
 구현
하기
 쉬
움



-
 메
모
리
(M
emory
)

 
 -
 Conversation
Buffer
Memory
,
 Conversation
Summary
Memory
 등
으로
 대
화
 맥
락
을
 유지
하고
 활용


 
 -
 대
화
 상태
를
 세
션
 간
에
 공유
하거나
 요
약
해
 저장
하는
 기능
 포함



-
 문
서
 로
더
 및
 벡
터
 스
토
어
(R
AG
)

 
 -
 문
서를
 수
집
/
전
처
리
하는
 Document
 Load
ers


 

In [17]:
full_message

AIMessageChunk(content='여러 가지 LLM 기반 애플리케이션을 쉽게 구축하도록 돕는 프레임워크가 LangChain입니다. 주요 기능을 요약하면 다음과 같습니다.\n\n- LLM 및 프롬프트 관리\n  - 다양한 LLM 공급자와의 래퍼 지원(OpenAI, Cohere, HuggingFace 등)\n  - PromptTemplate, ChatPromptTemplate 등을 이용한 재사용 가능한 프롬프트 구성\n\n- 체인(Chain) 기반 파이프라인\n  - LLMChain, SimpleSequentialChain, SequentialChain 등으로 여러 LLM 호출을 순차적으로 연결\n  - 파이프라인 형태의 로직을 손쉽게 구성하고 재사용 가능\n\n- 도구(Tools)와 에이전트(Agents)\n  - 외부 API 호출, 계산기, 웹 검색 등 외부 기능에 접근하는 Tools 제공\n  - 에이전트가 도구를 선택하고 실행하도록 하는 AgentExecutor/ReAct 스타일의 패턴 지원\n  - 계획(plan)–행동(act) 순환 구조를 구현하기 쉬움\n\n- 메모리(Memory)\n  - ConversationBufferMemory, ConversationSummaryMemory 등으로 대화 맥락을 유지하고 활용\n  - 대화 상태를 세션 간에 공유하거나 요약해 저장하는 기능 포함\n\n- 문서 로더 및 벡터 스토어(RAG)\n  - 문서를 수집/전처리하는 Document Loaders\n  - 임베딩 생성 및 벡터 검색을 위한 Vector Store(예: FAISS, Pinecone, Milvus 등) 연동\n  - 검색 기반 응답 생성 등 Retrieval-Augmented Generation 분야에 용이\n\n- 임베딩 및 검색\n  - 임베딩 모델 연결 및 유사도 기반 검색 기능 제공\n\n- 출력 파서(Output Parsers) 및 형식화\n  - LLM 출력의 텍스트를 구조화된 데이터로 파싱하고, 파이프라인 다음 단계에 쉽게 전

### 도구 메시지 (Tool Message)

도구 호출(tool calling)을 지원하는 모델의 경우,
**AI 메시지(AIMessage)** 안에 **도구 호출 정보(tool calls)** 가 포함될 수 있습니다.

**Tool Message(도구 메시지)** 는
**단일 도구 실행의 결과(result)** 를 모델에게 다시 전달하기 위해 사용됩니다.

또한, 도구는 직접 **`ToolMessage` 객체**를 생성하여
실행 결과를 LangChain 에이전트나 모델로 반환할 수 있습니다.

In [None]:
from langchain.messages import ToolMessage

# 모델이 도구 호출을 수행한 후
ai_message = AIMessage(
    content=[],
    tool_calls=[{
        "name": "get_weather",                   # 호출된 도구 이름
        "args": {"location": "San Francisco"},   # 도구에 전달된 인자
        "id": "call_123"                         # 도구 호출 ID
    }]
)

# 도구 실행 후 결과 메시지 생성
weather_result = "맑음, 72°F"
tool_message = ToolMessage(
    content=weather_result,
    tool_call_id="call_123"  # 반드시 호출 ID와 일치해야 함
)

# 대화 이어가기
messages = [
    HumanMessage("샌프란시스코의 날씨는 어때?"),
    ai_message,     # 모델이 도구 호출을 요청한 메시지
    tool_message,   # 도구 실행 결과를 모델에 전달
]

response = model.invoke(messages)  # 모델이 도구 결과를 반영하여 후속 응답 생성
response.pretty_print()