## **챗 모델과 Message를 사용해 간단한 LLM 애플리케이션 구축하기**

In [1]:
import os
from dotenv import load_dotenv
load_dotenv()

True

In [2]:
# os.environ

## 언어 모델 사용하기

LangChain은 다양한 언어 모델을 지원하며, 이들을 서로 교체하여 사용할 수 있습니다.

In [3]:
from langchain.chat_models import init_chat_model

model = init_chat_model("gpt-5-nano", model_provider="openai")
# model = init_chat_model("gemini-2.5-flash", model_provider="google_genai")

ChatModels은 LangChain Runnables의 인스턴스로, 표준화된 인터페이스를 통해 상호작용할 수 있습니다. 모델을 간단히 호출하려면 `.invoke` 메서드에 Messages 목록을 전달하면 됩니다.

## 메시지 (Messages)

메시지(Messages) 는 LangChain에서 모델이 사용하는 컨텍스트의 기본 단위입니다.
이들은 모델의 입력(input) 과 출력(output) 을 나타내며, LLM과의 상호작용에서 대화의 상태(state)를 표현하는 데 필요한 콘텐츠(content) 와 메타데이터(metadata) 를 함께 포함합니다.

메시지는 다음 요소들로 구성됩니다:

- Role (역할)
→ 메시지의 유형을 식별합니다. 예: system, user, assistant 등  
- Content (내용)
→ 메시지의 실제 내용으로, 텍스트뿐만 아니라 이미지, 오디오, 문서 등 다양한 형식을 포함할 수 있습니다.  
- Metadata (메타데이터)
→ 선택적(optional) 필드로, 응답 정보(response info), 메시지 ID, 토큰 사용량(token usage) 등 부가 정보를 담습니다.

In [4]:
from langchain_core.messages import HumanMessage, SystemMessage

# 메시지 목록을 생성
messages = [
    # 시스템 메시지: 모델에게 수행할 작업이나 역할을 지시합니다.
    SystemMessage("다음을 영어에서 한국어로 번역하세요. 상세한 설명 말고 단순히 번역만 하세요."),
    # 사용자 메시지: 사용자가 모델에 보낼 실제 입력 내용입니다.
    HumanMessage("What is LangChain?"),
]

answer = model.invoke(messages)  # `invoke` 메서드를 사용해 모델을 호출합니다.
answer

AIMessage(content='LangChain이 무엇인가요?', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 144, 'prompt_tokens': 40, 'total_tokens': 184, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 128, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-5-nano-2025-08-07', 'system_fingerprint': None, 'id': 'chatcmpl-CnYpsV8qUiULls6PhszZbNC1dPSf4', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--22cc70dd-65d6-4372-a87c-067be90ca2b7-0', usage_metadata={'input_tokens': 40, 'output_tokens': 144, 'total_tokens': 184, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 128}})

In [5]:
answer.pretty_print()


LangChain이 무엇인가요?


### 텍스트 프롬프트 (Text prompts)

**텍스트 프롬프트(Text prompts)** 는 단순한 **문자열(string)** 형태로 제공됩니다.  
대화 기록(conversation history)을 유지할 필요가 없는 **단순한 생성 작업**(예: 요약, 문장 생성, 번역 등)에 적합합니다.

In [6]:
response = model.invoke("LLM 에 관한 시를 5줄 이내로 지어주세요.")
response.pretty_print()


데이터의 바다에서 자란 말의 씨앗  
확률의 길로 문장을 엮고 노래하네  
학습의 밤을 지나 비추는 작은 빛  
물음이 다가오면 숨 쉬듯 대답의 길을 열고  
우리 말과 생각을 잇는 조용한 다리, LLM


### 딕셔너리 형식 (Dictionary format)

OpenAI의 **Chat Completions 포맷**을 사용해 메시지를 **딕셔너리 형태로 직접 지정**할 수도 있습니다.

In [7]:
# OpenAI 형식
answer = model.invoke([
    {"role": "system", "content": "다음을 영어에서 한국어로 번역하세요. 상세한 설명 말고 단순히 번역만 하세요."},
    {"role": "user", "content": "What is LangChain?"},
])
answer.pretty_print()


LangChain이 무엇인가요?


--------------
## 메시지 유형 (Message types)

* **System message (시스템 메시지)**
  → 모델이 어떻게 행동해야 하는지 지시하고, 상호작용의 **맥락(context)** 을 제공합니다.  
* **Human message (사용자 메시지)**
  → 사용자의 입력을 나타내며, 모델과의 **대화(interaction)** 를 구성합니다.  
* **AI message (AI 메시지)**
  → 모델이 생성한 응답으로, **텍스트 내용(text content)** 뿐 아니라
  **도구 호출(tool calls)** 및 **메타데이터(metadata)** 를 포함할 수 있습니다.  
* **Tool message (도구 메시지)**
  → 모델이 호출한 **도구의 실행 결과(outputs)** 를 나타냅니다.

In [8]:
from langchain.messages import SystemMessage, HumanMessage

system_msg = SystemMessage("""
당신은 웹 프레임워크에 전문성을 가진 시니어 Python 개발자입니다.
설명은 간결하게 5줄 이내로 설명하세요.
""")

messages = [
    system_msg,
    HumanMessage("REST API를 어떻게 만들 수 있나요?")
]
response = model.invoke(messages)
response.pretty_print()


- FastAPI나 Django REST Framework 같은 프레임워크로 프로젝트를 시작합니다.
- 자원(예: /users, /items)과 CRUD를 HTTP 메서드로 매핑해 REST 엔드포인트를 설계합니다.
- 입력/출력을 Pydantic(또는 DRF Serializer)으로 검증하고 직렬화합니다.
- SQLAlchemy나 Django ORM으로 데이터를 저장하고 비즈니스 로직을 구현합니다.
- JWT 인증/권한, 테스트 작성, 컨테이너 배포(Gunicorn/uvicorn, Docker)로 운영을 준비합니다.


### AI 메시지 (AI Message)

**AIMessage** 는 **모델 호출(model invocation)** 의 **출력 결과**를 나타냅니다.
이 메시지에는 다음과 같은 요소들을 포함할 수 있습니다:

* **멀티모달 데이터 (Multimodal data)** — 텍스트뿐만 아니라 이미지, 오디오 등의 출력
* **도구 호출 (Tool calls)** — 모델이 외부 도구를 실행한 기록
* **제공자별 메타데이터 (Provider-specific metadata)** — 모델 제공자(OpenAI, Anthropic 등)에 따라 추가로 제공되는 정보

이러한 메타데이터는 나중에 접근하거나 분석할 수 있습니다.

In [9]:
response = model.invoke("AI에 대해서 한줄로 설명해줘.")
print(type(response))  
response

<class 'langchain_core.messages.ai.AIMessage'>


AIMessage(content='데이터를 통해 학습하고 판단·문제 해결을 보조하는, 인간 지능의 일부를 모방한 컴퓨팅 기술.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 424, 'prompt_tokens': 16, 'total_tokens': 440, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 384, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-5-nano-2025-08-07', 'system_fingerprint': None, 'id': 'chatcmpl-CnYqONLIWlLASVldGeZDKOpTTb9dT', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--d971c81b-fcc6-4f79-a544-9d398b24b665-0', usage_metadata={'input_tokens': 16, 'output_tokens': 424, 'total_tokens': 440, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 384}})

In [10]:
from langchain.messages import AIMessage, SystemMessage, HumanMessage

# AI 메시지를 수동으로 생성 (예: 대화 기록에 추가하기 위해)
ai_msg = AIMessage("그 질문에 기꺼이 도움을 드리겠습니다!")

# 대화 기록에 추가
messages = [
    SystemMessage("당신은 도움이 되는 어시스턴트입니다."),
    HumanMessage("저를 도와주실 수 있나요?"),
    ai_msg,  # 모델이 이전에 응답한 것처럼 삽입
    HumanMessage("좋아요! 그럼 2 + 2는 얼마인가요?")
]

response = model.invoke(messages)
response.pretty_print()


4입니다. 다른 수학 문제도 도와드릴까요?


### 토큰 사용량 (Token usage)

**AIMessage** 객체는 `usage_metadata` 필드에
**토큰 사용량(token counts)** 및 기타 **사용 관련 메타데이터(metadata)** 를 저장할 수 있습니다.

In [11]:
response = model.invoke("Hello!")
response.usage_metadata

{'input_tokens': 8,
 'output_tokens': 311,
 'total_tokens': 319,
 'input_token_details': {'audio': 0, 'cache_read': 0},
 'output_token_details': {'audio': 0, 'reasoning': 256}}

### batch interface 이용 여러개의 메시지 일괄 처리

In [12]:
# 메시지 목록을 생성
batch_messages = [
    [
        SystemMessage("다음을 영어에서 한국어로 번역하세요. 상세한 설명 말고 단순히 번역만 하세요."),
        HumanMessage("What is LangChain?")
    ],
    [
        SystemMessage("다음을 영어에서 한국어로 번역하세요. 상세한 설명 말고 단순히 번역만 하세요."),
        HumanMessage("How does LangChain work?")
    ],
    [
        SystemMessage("다음을 영어에서 한국어로 번역하세요. 상세한 설명 말고 단순히 번역만 하세요."),
        HumanMessage("What are the key features of LangChain?")
    ]
]

# `model.batch()`을 사용하여 여러 개의 메시지를 한 번에 처리
# LangChain은 각 입력을 독립된 invoke() 호출처럼 처리
answers = model.batch(batch_messages)
answers

[AIMessage(content='LangChain이란 무엇인가요?', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 209, 'prompt_tokens': 40, 'total_tokens': 249, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 192, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-5-nano-2025-08-07', 'system_fingerprint': None, 'id': 'chatcmpl-CnYqbMldvrdg5Nphn3NOWFm6uEBNj', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--56c074f9-de59-4584-933b-c50bac30ef5b-0', usage_metadata={'input_tokens': 40, 'output_tokens': 209, 'total_tokens': 249, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 192}}),
 AIMessage(content='LangChain은 어떻게 작동합니까?', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 210, 'prompt_tok

In [13]:
# 결과 출력
for idx, ans in enumerate(answers):
    print(f"번역 {idx + 1}: {ans.content}")

번역 1: LangChain이란 무엇인가요?
번역 2: LangChain은 어떻게 작동합니까?
번역 3: LangChain의 주요 특징은 무엇인가요?


### stream inferface 를 이용한 출력 

In [14]:
# 스트리밍 중에 받아온 chunk 들을 저장할 리스트
chunks = []

# 전체 메시지를 누적할 변수
full_message = None

# model.stream() 은 토큰(혹은 chunk)을 스트리밍 방식으로 하나씩 생성
for chunk in model.stream("LangChain의 주요 기능은 무엇인가요?"):
    
    chunks.append(chunk)
    print(chunk.text)   # 현재 chunk 의 텍스트 출력 
    
    # full_message 에 chunk 를 누적
    # 첫 chunk 일 경우 full_message 가 None 이므로 그대로 저장
    # 이후부터는 기존 full_message 에 chunk 를 더해(concat) 전체 메시지를 구성
    full_message = chunk if full_message is None else full_message + chunk


Lang
Chain
은
 L
LM
(
대
형
 언
어
 모델
)
 기반
 애
플
리
케
이션
을
 easier
하게
 만들
기
 위한
 프
레
임
워크
로
,
 여러
 구성
 요소
를
 표
준
화
해
 체
인
처럼
 연결
하고
 도
구
를
 활용
하도록
 돕
습니다
.
 주요
 기능
은
 다음
과
 같습니다
.


-
 프
롬
프트
 관리
와
 템
플
릿


 
 -
 Prompt
Template
/
Chat
Prompt
Template
 등을
 이용
해
 프
롬
프트
를
 체
계
적으로
 구성
하고
 재
사용
할
 수
 있습니다
.

 
 -
 단
일
 프
롬
프트
,
 다
중
 라
운
드
 프
롬
프트
,
 Few
-shot
 프
롬
프트
 등을
 쉽게
 만들
 수
 있습니다
.


-
 체
인
(
Chain
)
 기반
 처리
 파
이
프
라인


 
 -
 L
LM
Chain
,
 Sequential
Chain
 등
으로
 여러
 단
계를
 순
서
대로
 연결
해
 복
잡
한
 처리
 흐
름
을
 구성
합니다
.

 
 -
 다
단
계
 의
사
결
정
,
 데이터
 가
공
,
 출력
 포
맷
팅
 등을
 한
 묶
음
으로
 관리
합니다
.


-
 에
이
전
트
와
 도
구
(T
ool
)
 시스템


 
 -
 에
이
전
트
가
 상황
에
 맞
춰
 도
구
를
 선택
하고
 호출
하도록
 구성
할
 수
 있습니다
.

 
 -
 API
 호출
,
 데이터
베
이스
 질
의
,
 파일
 시스템
 접근
 등
 외
부
 도
구
와
의
 상
호
작
용
을
 추
상
화
하여
 구현
이
 쉬
워
집
니다
.


-
 메
모
리
와
 대
화
 컨
텍
스트
 관리


 
 -
 컨
텍
스트
 유지
(memory
)
 기능
으로
 대
화를
 기억
하고
 요
약
하는
 메
모
리
 모
듈
을
 제공합니다
(
예
:
 Conversation
Buffer
Memory
,
 Conversation
Summary
Memory
 등
).

 
 -
 롱
텀
 컨
텍
스트
 관리

In [15]:
full_message

AIMessageChunk(content='LangChain은 LLM(대형 언어 모델) 기반 애플리케이션을 easier하게 만들기 위한 프레임워크로, 여러 구성 요소를 표준화해 체인처럼 연결하고 도구를 활용하도록 돕습니다. 주요 기능은 다음과 같습니다.\n\n- 프롬프트 관리와 템플릿\n  - PromptTemplate/ChatPromptTemplate 등을 이용해 프롬프트를 체계적으로 구성하고 재사용할 수 있습니다.\n  - 단일 프롬프트, 다중 라운드 프롬프트, Few-shot 프롬프트 등을 쉽게 만들 수 있습니다.\n\n- 체인(Chain) 기반 처리 파이프라인\n  - LLMChain, SequentialChain 등으로 여러 단계를 순서대로 연결해 복잡한 처리 흐름을 구성합니다.\n  - 다단계 의사결정, 데이터 가공, 출력 포맷팅 등을 한 묶음으로 관리합니다.\n\n- 에이전트와 도구(Tool) 시스템\n  - 에이전트가 상황에 맞춰 도구를 선택하고 호출하도록 구성할 수 있습니다.\n  - API 호출, 데이터베이스 질의, 파일 시스템 접근 등 외부 도구와의 상호작용을 추상화하여 구현이 쉬워집니다.\n\n- 메모리와 대화 컨텍스트 관리\n  - 컨텍스트 유지(memory) 기능으로 대화를 기억하고 요약하는 메모리 모듈을 제공합니다(예: ConversationBufferMemory, ConversationSummaryMemory 등).\n  - 롱텀 컨텍스트 관리 및 대화 흐름의 자연스러운 연속성 확보에 활용됩니다.\n\n- 데이터 소스 로딩 및 전처리\n  - 텍스트/문서 로더(Document Loaders)로 다양한 파일 형식이나 웹 콘텐츠를 불러와 처리할 수 있습니다.\n  - PDF, 텍스트, CSV, JSON 등 여러 형식을 지원합니다.\n\n- 벡터 스토어 기반의 검색(RAG)\n  - 임베딩을 이용해 벡터 저장소(VectorStore)에 문서를 인덱싱하고, 질의에 대해 유사도 기반으로 문서를 검색한 뒤 LLM과 함께 답을 구성합니다.\n 

### 도구 메시지 (Tool Message)

도구 호출(tool calling)을 지원하는 모델의 경우,
**AI 메시지(AIMessage)** 안에 **도구 호출 정보(tool calls)** 가 포함될 수 있습니다.

**Tool Message(도구 메시지)** 는
**단일 도구 실행의 결과(result)** 를 모델에게 다시 전달하기 위해 사용됩니다.

또한, 도구는 직접 **`ToolMessage` 객체**를 생성하여
실행 결과를 LangChain 에이전트나 모델로 반환할 수 있습니다.

In [16]:
from langchain.messages import ToolMessage

# 모델이 도구 호출을 수행한 후
ai_message = AIMessage(
    content=[],
    tool_calls=[{
        "name": "get_weather",                   # 호출된 도구 이름
        "args": {"location": "San Francisco"},   # 도구에 전달된 인자
        "id": "call_123"                         # 도구 호출 ID
    }]
)

# 도구 실행 후 결과 메시지 생성
weather_result = "맑음, 72°F"
tool_message = ToolMessage(
    content=weather_result,
    tool_call_id="call_123"  # 반드시 호출 ID와 일치해야 함
)

# 대화 이어가기
messages = [
    HumanMessage("샌프란시스코의 날씨는 어때?"),
    ai_message,     # 모델이 도구 호출을 요청한 메시지
    tool_message,   # 도구 실행 결과를 모델에 전달
]

response = model.invoke(messages)  # 모델이 도구 결과를 반영하여 후속 응답 생성
response.pretty_print()


샌프란시스코는 맑습니다. 현재 기온은 화씨 72도(섭씨 약 22°C)예요. 더 자세한 오늘 전망이나 주간 예보가 필요하시면 말씀해 주세요.
