#  LangChain의 개념과 주요 컴포넌트 이해

---

## LangChain이란 

- **LangChain**은 LLM 기반 애플리케이션 개발을 위한 프레임워크

- **Chain**은 작업을 순차적으로 실행하는 파이프라인 구조를 제공

- **Agent**는 자율적 의사결정이 가능한 실행 단위

## LangChain 컴포넌트 

- LangChain **주요 컴포넌트**: LLM/ChatModel, Prompt, Memory, Tool, Document Loader, Text Splitter, Embedding, Vectorstore

- **언어 처리 기능**은 LLM/ChatModel이 중심이 되며, Prompt와 Memory로 대화를 관리

- **문서 처리와 검색**은 Document Loader, Text Splitter, Embedding, Vectorstore가 담당

- **모듈성**이 핵심 특징으로, 독립적인 컴포넌트들을 조합해 RAG와 같은 복잡한 시스템을 구현 가능 

- Tool을 통한 확장성과 컴포넌트의 재사용성으로 다양한 LLM 애플리케이션 개발이 가능

---

# 환경 설정 및 준비

In [1]:
# 환경 변수 로드
from dotenv import load_dotenv
load_dotenv()

True

# 1. 모델 (Models)
- LLM, ChatModel 등으로 구분
- OpenAI, Anthropic, Google 등 다양한 모델을 지원
- 텍스트 생성, 대화, 요약 등의 작업을 수행

In [2]:
from langchain_openai import ChatOpenAI

model = ChatOpenAI(model="gpt-4.1-mini")
response = model.invoke("안녕하세요!")

In [3]:
# 응답 객체 
response

AIMessage(content='안녕하세요! 무엇을 도와드릴까요?', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 11, 'prompt_tokens': 10, 'total_tokens': 21, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4.1-mini-2025-04-14', 'system_fingerprint': None, 'id': 'chatcmpl-Bw7Gxx0fJon7fJWJtkFxoAgJTfmmJ', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--c3df3e68-d4b6-45ca-8f6b-2ca430f62f48-0', usage_metadata={'input_tokens': 10, 'output_tokens': 11, 'total_tokens': 21, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [4]:
print("답변: ", response.content)

답변:  안녕하세요! 무엇을 도와드릴까요?


In [5]:
print("메타데이터: ", response.response_metadata)

메타데이터:  {'token_usage': {'completion_tokens': 11, 'prompt_tokens': 10, 'total_tokens': 21, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4.1-mini-2025-04-14', 'system_fingerprint': None, 'id': 'chatcmpl-Bw7Gxx0fJon7fJWJtkFxoAgJTfmmJ', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}


# 2. 메시지 (Messages)
- Chat Model에서 사용할 수 있는 통합된 메시지 형식을 제공
- 각 모델 제공자의 특정 메시지 형식을 신경 쓰지 않고도 다양한 채팅 모델을 활용 가능

`1. HumanMessage`
- 사용자 역할에 해당
- 사용자의 입력을 처리

In [6]:
from langchain_core.messages import HumanMessage

# 사용자 메시지 생성
human_message = HumanMessage(content="Glory를 한국어로 번역해주세요.")

# 번역 요청
response = model.invoke([human_message])

# 답변 출력
print("답변: ", response.content)

답변:  "Glory"는 한국어로 보통 "영광"이라고 번역합니다. 상황에 따라 "명예", "찬란함", "영예" 등으로도 번역될 수 있습니다.


In [7]:
# 문자열을 입력하면, 자동으로 HumanMessage로 변환하여 요청
model.invoke("Glory를 한국어로 번역해주세요.")

AIMessage(content='"Glory"는 한국어로 보통 "영광"이라고 번역됩니다. 문맥에 따라 "영예", "명예" 등으로도 번역될 수 있습니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 40, 'prompt_tokens': 17, 'total_tokens': 57, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4.1-mini-2025-04-14', 'system_fingerprint': None, 'id': 'chatcmpl-Bw7H5zrQRjRGovJiM1fFgR6PLkiNQ', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--6f12c5f8-4f95-4e12-bedf-769913ce8f3a-0', usage_metadata={'input_tokens': 17, 'output_tokens': 40, 'total_tokens': 57, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

`2. AIMessage`
- AI 모델의 응답을 표현


In [None]:
# AI 모델의 응답 객체를 출력 
response

In [None]:
# 모델 응답 텍스트 부분을 출력
response.content

In [None]:
# 토큰 사용량 출력
response.usage_metadata

`3. SystemMessage`
- 시스템 역할에 해당
- AI 모델의 동작과 제약사항을 정의하는데 사용


In [None]:
from langchain_core.messages import SystemMessage 

# 시스템 메시지 생성
system_msg = SystemMessage(content="당신은 영어를 한국어로 번역하는 AI 어시스턴트입니다.")

system_msg

In [None]:
# 번역 요청
human_message = HumanMessage(content="Glory")

messages = [system_msg, human_message]

response = model.invoke(messages)

# 답변 출력
print("답변: ", response.content)

# 3. 프롬프트 템플릿 (Prompt Template)
- 프롬프트 템플릿을 통해 일관된 입력 형식을 제공
    1. 사용자의 입력과 파라미터를 언어 모델이 이해할 수 있는 형태로 변환하는 도구
    2. 언어 모델에게 전달할 지시문을 만드는 틀
- 변수를 포함한 동적 프롬프트 생성이 가능
    1. 모든 템플릿은 딕셔너리 형태의 입력을 받아서 처리
    2. 출력은 PromptValue 형태로 반환되며, 이는 문자열이나 메시지 리스트로 변환 가능

`1. 문자열 프롬프트 템플릿 (String PromptTemplate)`
- 가장 기본적인 형태
- 단일 문자열을 형식화하는데 사용

In [None]:
from langchain_core.prompts import PromptTemplate

# 템플릿 생성
template = PromptTemplate.from_template("{주제}에 대한 이야기를 해줘")

# 템플릿 사용
prompt = template.invoke({"주제": "고양이"})

# 출력
prompt

`2. 채팅 프롬프트 템플릿 (ChatPromptTemplate)`
- 여러 메시지를 포함하는 대화형 템플릿을 만들 때 사용

In [None]:
from langchain_core.prompts import ChatPromptTemplate

# 채팅 템플릿 생성
template = ChatPromptTemplate.from_messages([
    ("system", "당신은 도움이 되는 비서입니다"),
    ("user", "{subject}에 대해 설명해주세요")
])

# 템플릿 사용
prompt = template.invoke({"subject": "인공지능"})

# 출력
prompt

`3. 메시지 플레이스홀더 (MessagesPlaceholder)`
- 기존 메시지 목록을 템플릿의 특정 위치에 삽입할 때 사용

In [None]:
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.messages import HumanMessage

# 메시지 플레이스홀더가 있는 템플릿
template = ChatPromptTemplate.from_messages([
    ("system", "당신은 도움이 되는 비서입니다"),
    MessagesPlaceholder("chat_history")
])

# 템플릿 사용
prompt = template.invoke({
    "chat_history": [HumanMessage(content="안녕하세요!")]
})

# 출력
prompt.messages

# 4. 출력 파서 (Output Parser)
1. **역할과 기능**
    - 모델의 텍스트 출력을 구조화된 데이터로 변환
    - 채팅 모델과 LLM의 출력을 정규화
    - 다운스트림 작업을 위한 데이터 형식 변환

2. **사용 시 고려사항**
    - OpenAI function calling과 같은 기능이 있는 경우, 해당 기능을 우선 사용

`(1) StrOutputParser`

In [None]:
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import PromptTemplate
from langchain_openai import ChatOpenAI

# 기본적인 문자열 파서 사용
parser = StrOutputParser()

# 프롬프트 템플릿 설정
prompt = PromptTemplate.from_template("도시 {city}의 특징을 알려주세요")

# 모델 정의
model = ChatOpenAI(model='gpt-4.1-mini')

# 체인 구성
chain = prompt | model | parser

# 체인 실행
result = chain.invoke({"city": "서울"})

# 결과 출력
print(result)

`(2) 구조화된 출력 (with_structured_output 메소드)`

In [None]:
from pydantic import BaseModel, Field

# Pydantic 클래스로 출력 구조를 정의
class CityInfo(BaseModel):
    name: str = Field(description="도시 이름")
    description: str = Field(description="도시의 특징")

In [None]:
from pydantic import BaseModel, Field
from langchain_core.prompts import PromptTemplate
from langchain_openai import ChatOpenAI

# 1. 출력 스키마 정의
class CityInfo(BaseModel):
    name: str = Field(description="도시 이름")
    description: str = Field(description="도시의 특징")

# 2. 프롬프트 템플릿 생성
prompt = PromptTemplate.from_template("도시 {city}의 특징을 알려주세요.")

# 3. 모델 생성 및 구조화된 출력 바인딩
model = ChatOpenAI(model="gpt-4.1-mini", temperature=0)
structured_model = model.with_structured_output(CityInfo)

# 4. 프롬프트와 모델 체인 연결
chain = prompt | structured_model

# 5. 체인 실행
result = chain.invoke({"city": "서울"})

# 6. 결과 출력 (CityInfo 객체)
print(f"도시 이름: {result.name}")
print(f"특징: {result.description}")

# 5. 메모리 (Memory)
- 대화 기록을 저장하고 관리
- 컨텍스트 유지를 위한 다양한 메모리 타입을 제공
- 대화 요약, 버퍼링 등의 기능을 포함

In [None]:
from langchain_core.chat_history import BaseChatMessageHistory
from langchain_core.messages import BaseMessage
from pydantic import BaseModel, Field
from typing import List

# 메모리 기반 히스토리 구현
class InMemoryHistory(BaseChatMessageHistory, BaseModel):
    messages: List[BaseMessage] = Field(default_factory=list)
    
    def add_messages(self, messages: List[BaseMessage]) -> None:
        self.messages.extend(messages)
    
    def clear(self) -> None:
        self.messages = []

# 세션 저장소
store = {}

# 세션 ID로 히스토리 가져오기
def get_session_history(session_id: str) -> BaseChatMessageHistory:
    if session_id not in store:
        store[session_id] = InMemoryHistory()
    return store[session_id]

In [None]:
# 채팅 모델과 프롬프트 설정
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.runnables.history import RunnableWithMessageHistory

prompt = ChatPromptTemplate.from_messages([
    ("system", "당신은 {subject}에 능숙한 비서입니다"),
    MessagesPlaceholder(variable_name="history"),
    ("human", "{question}")
])

chain = prompt | ChatOpenAI(model='gpt-4.1-mini')

# 히스토리 관리 추가
chain_with_history = RunnableWithMessageHistory(
    chain,
    get_session_history,
    input_messages_key="question",
    history_messages_key="history"
)

In [None]:
# 체인 실행
response = chain_with_history.invoke(
    {"subject": "수학", "question": "1+2는 얼마인가요?"},
    config={"configurable": {"session_id": "user1"}}
)

# 결과 출력
print(response)

In [None]:
# 세션 ID로 히스토리 가져오기
get_session_history("user1").messages

In [None]:
# 히스토리 이용해서 대화 진행
response = chain_with_history.invoke(
    {"subject": "수학", "question": "여기에 숫자 2를 곱하면 얼마인가요?"},
    config={"configurable": {"session_id": "user1"}}
)

# 결과 출력
print(response)

In [None]:
# 세션 ID로 히스토리 가져오기
get_session_history("user1").messages

# 6. 에이전트 (Agent)
- 자율적 의사결정이 가능한 실행 단위
- LangChain에서는 Agent 클래스를 통해 에이전트 구현

In [8]:
from langchain.agents import AgentExecutor, create_tool_calling_agent
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.tools import tool

# 프롬프트 템플릿 생성 - ReAct 에이전트에 필요한 변수들 포함
prompt = ChatPromptTemplate.from_messages([
    ("system", "당신은 친절한 수학 선생님입니다."),
    ("user", "{input}"),
    MessagesPlaceholder(variable_name="agent_scratchpad")
])

# 도구 정의
@tool
def add(a: float, b: float) -> float:
    """두 숫자를 더하는 도구"""
    return a + b

@tool
def subtract(a: float, b: float) -> float:
    """두 숫자를 빼는 도구"""
    return a - b

# 도구 목록 생성
tools = [
    add,
    subtract
]

# 에이전트 생성 (도구 호출)
agent = create_tool_calling_agent(
    llm=ChatOpenAI(model='gpt-4.1-mini'),
    tools=tools,
    prompt=prompt
)

# 에이전트 실행 도구 정의
agent_executor = AgentExecutor(
    agent=agent,      # 도구 호출 에이전트
    tools=tools,      # 도구 목록
    verbose=True,     # 상세 로그 출력
    )

# 에이전트 실행
agent_executor.invoke({"input": "100과 200을 더하면 얼마인가요?"})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `add` with `{'a': 100, 'b': 200}`


[0m[36;1m[1;3m300.0[0m[32;1m[1;3m100과 200을 더하면 300입니다. 더 궁금한 것이 있으면 물어보세요![0m

[1m> Finished chain.[0m


{'input': '100과 200을 더하면 얼마인가요?',
 'output': '100과 200을 더하면 300입니다. 더 궁금한 것이 있으면 물어보세요!'}

In [11]:
add.name, add.description, add.args

('add',
 '두 숫자를 더하는 도구',
 {'a': {'title': 'A', 'type': 'number'},
  'b': {'title': 'B', 'type': 'number'}})