`01_langchain_intro`

# Langchain Intro ⛓️⛓️
- LLM powered 어플리케이션 제작을 위한 프레임 워크

In [None]:
%pip install -q langchain langchain-openai

Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 24.3.1 -> 25.2
[notice] To update, run: python.exe -m pip install --upgrade pip


In [None]:
from dotenv import load_dotenv

load_dotenv()

In [None]:
from langchain_openai import ChatOpenAI

llm = ChatOpenAI()
llm.invoke("Hello, world!")

AIMessage(content='Hello! How can I assist you today?', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 9, 'prompt_tokens': 11, 'total_tokens': 20, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'id': 'chatcmpl-CAoOThJesBTBU2dw4A7HbyTCmOoLN', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--fe668a2d-4853-4d2f-b030-3906ff2b90ab-0', usage_metadata={'input_tokens': 11, 'output_tokens': 9, 'total_tokens': 20, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [5]:
# 만약 우리가 외국어로 메세지가 들어오면, 한국어로 번역을 해주는 AI를 만들고 싶다면?

msg = input('외국어를 넣으세요')

res = llm.invoke(f'한국어로 번역해줘: {msg}')

res.content

'나 집에 가고 싶어.'

In [21]:
from langchain_core.messages import HumanMessage, SystemMessage

messages = [
    # 채팅 세션의 전체적인 안내 사항
    SystemMessage(content='한국어를 일본어로 번역해줘'),
    HumanMessage(content='혈귀가 되어라, 쿄쥬로')
]

llm.invoke(messages)

AIMessage(content='吸血鬼になれ、キョジュロ', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 16, 'prompt_tokens': 43, 'total_tokens': 59, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'id': 'chatcmpl-CAqTITcas7094RyY9MIOs8bboJeyd', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--4cecca8b-a36d-44e1-ab4d-68c8b1ea0683-0', usage_metadata={'input_tokens': 43, 'output_tokens': 16, 'total_tokens': 59, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [12]:
messages = [
    # 채팅 세션의 전체적인 안내 사항
    {'role': 'system', 'content': '한국어를 일본어로 번역해줘'},
    {'role': 'user', 'content': '제 이름은 코난, 탐정이죠'},
]

llm.invoke(messages)

AIMessage(content='私の名前はコナン、探偵です。', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 15, 'prompt_tokens': 42, 'total_tokens': 57, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'id': 'chatcmpl-CAqLYWjWR3160gNU0s3kxBLddxWR4', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--5c6c4b90-8c12-44b8-8e99-9ca134cb0c84-0', usage_metadata={'input_tokens': 42, 'output_tokens': 15, 'total_tokens': 57, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [14]:
print(type(llm))
for token in llm.stream(messages):
    print(token.content, end="|")

<class 'langchain_openai.chat_models.base.ChatOpenAI'>
|私|の|名|前|は|コ|ナ|ン|です|、|探|偵|です|。||

## Prompt Template
- 고정된 문자열과 변수를 조합하여 프롬프트를 만드는 방법

## Chain
- Langchain의 각 구성요소를 묶어서(chaining)하여 한 번에 실행(invoke)할 수 있도록 하는 기능
- `a | b | c` 형태로 나옴. 이건 Python 문법이 아니라 Langchain 문법(LCEL-LangChain Expression Language)

In [None]:
# 채팅을 할 경우에는 ChatPromptTemplate
from langchain_core.prompts import ChatPromptTemplate

messages = [
    {'role': 'system', 'content': 'Translate Korean to {lang}'},
    {'role': 'human', 'content': '{text}'}
]

prompt_template = ChatPromptTemplate.from_messages(messages)

prompt = prompt_template.invoke({'lang': '일본어', 'text': '미래에서 기다릴게'})

llm.invoke(prompt)

AIMessage(content='未来で待ってるね', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 8, 'prompt_tokens': 26, 'total_tokens': 34, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'id': 'chatcmpl-CAqdhDBjxh0piUVLzC1yu7qLc1nUj', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--ec8fcacf-39de-405e-beb5-87f2f0c0a501-0', usage_metadata={'input_tokens': 26, 'output_tokens': 8, 'total_tokens': 34, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [26]:
prompt = prompt_template.invoke({'lang': '영어', 'text': '내 생일이다 !'})

llm.invoke(prompt)

AIMessage(content='Happy birthday!', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 3, 'prompt_tokens': 23, 'total_tokens': 26, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'id': 'chatcmpl-CAqervXe38CJggojZ6ZyBb3V0V7rk', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--cf41bdf7-a36b-4374-89ef-ba62d2bb25d3-0', usage_metadata={'input_tokens': 23, 'output_tokens': 3, 'total_tokens': 26, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [34]:
from langchain_core.output_parsers import StrOutputParser

output_parser = StrOutputParser()

chain = prompt_template | llm | output_parser

chain.invoke({'lang': '일본어', 'text': '날씨가 미쳤어'})

'天気が狂ってる。'

In [46]:
# 단발성 명령 수행
from langchain_core.prompts import PromptTemplate

template = """
당신은 10년차 K-유명밴드, 데이식스입니다. 상황에 맞게 [FORMAT]에 영어 회화를 작성해 주세요.

상황: {question}

FORMAT:
- 영어 회화 문장:
- 한글 번역 문장:
"""

prompt = PromptTemplate.from_template(template)

chain = prompt | llm | output_parser

res = chain.invoke({'question': '제일 좋아하는 노래에 대해서 설명할 때'})

print(res)

- 영어 회화 문장: My favorite song is "Shoot Me" by DAY6. The lyrics are so powerful and relatable. The instrumental is also amazing, especially the guitar riffs in the chorus.
- 한글 번역 문장: 나의 제일 좋아하는 노래는 데이식스의 "Shoot Me" 입니다. 가사가 너무 강렬하고 공감이 가고요. 악기 연주도 훌륭한데요, 특히 후렴부의 기타 리프가 좋아요.


In [47]:
# 단발성 명령 수행
from langchain_core.prompts import PromptTemplate

template = """
당신은 클라이언트 요구사항을 분석해서 단계를 나눠주는 데이터분석 전문가입니다.
사용자의 질문을 EDA에 활용할 수 있도록 단계를 나눠주세요.

질문: {question}
"""

prompt = PromptTemplate.from_template(template)

chain = prompt | llm | output_parser

res = chain.invoke({'question': '이번 2025년 전반기 매출 분석'})

print(res)

1. 데이터 수집: 2025년 전반기의 매출 데이터를 수집합니다. 이 데이터는 매출액, 제품별 매출액, 지역별 매출액, 시간별 매출액 등 다양한 정보를 포함해야 합니다.

2. 데이터 정제: 수집한 데이터를 정제하여 이상치나 결측치를 처리합니다. 정확한 분석을 위해 데이터의 일관성을 유지하는 것이 중요합니다.

3. 탐색적 데이터 분석(EDA): 정제된 데이터를 활용하여 다양한 분석을 진행합니다. 요구사항에 맞게 매출액의 추이, 트렌드, 제품별, 지역별 등 다양한 차원으로 데이터를 탐색합니다.

4. 시각화: EDA를 통해 얻은 결과를 적절한 시각화 방법을 사용하여 시각적으로 표현합니다. 그래프, 차트, 히트맵 등을 활용하여 결과를 명확하게 전달합니다.

5. 결과 해석: 분석된 데이터를 바탕으로 2025년 전반기의 매출에 대한 해석을 수행합니다. 이를 토대로 추후 전략 수립이나 의사 결정에 도움이 되도록 결과를 해석합니다.

6. 보고서 작성: 분석 결과를 종합하여 보고서를 작성합니다. 이를 통해 클라이언트에게 전반기 매출에 대한 분석 내용을 상세히 전달할 수 있습니다.


In [48]:
for token in chain.stream({'question': '이번 2025년 전반기 매출 분석'}):
    print(token, end='', flush=True)

1. 데이터 수집: 2025년 전반기 매출 데이터를 수집합니다. 이는 주로 회계시스템이나 판매 시스템에서 얻을 수 있습니다.

2. 데이터 전처리: 수집된 데이터를 정제하고 필요한 형식에 맞게 가공합니다. 이는 결측치 처리, 이상치 제거, 데이터 형식 변환 등을 포함합니다.

3. 탐색적 데이터 분석(EDA): 데이터 시각화 및 기술 통계를 사용하여 2025년 전반기 매출에 대한 패턴 및 트렌드를 분석합니다. 이를 통해 매출의 증감 원인을 파악할 수 있습니다.

4. 데이터 분석: EDA 결과를 바탕으로 2025년 전반기 매출에 대한 통계 분석 및 예측을 수행합니다. 이를 통해 매출의 예상 변동과 원인을 더 깊게 이해할 수 있습니다.

5. 결과 해석 및 시각화: 최종 결과를 쉽게 이해할 수 있는 형태로 시각화하고 해석하여 클라이언트에게 전달합니다. 이를 통해 향후 전략 수립에 도움을 줄 수 있습니다.

In [49]:
prompt = PromptTemplate.from_template('{topic}에 대해서 3문장으로 설명해줘')
llm = ChatOpenAI(model='gpt-4.1-nano')

chain = prompt | llm | StrOutputParser()

chain.batch([
    {'topic': 'Langchain'},
    {'topic': 'Langsmith'},
    {'topic': 'Langgraph'},
])

['Langchain은 자연어 처리 및 대화형 AI 애플리케이션 개발을 위한 프레임워크로, 다양한 언어 모델과 도구들을 쉽게 통합할 수 있게 도와줍니다. 이 플랫폼은 텍스트 생성, 질문 응답, 정보 검색 등의 기능을 효율적으로 구현할 수 있도록 설계되어 있습니다. 또한, 사용자 정의 파이프라인과 데이터 연동 기능을 제공하여 맞춤형 AI 솔루션 개발을 지원합니다.',
 'Langsmith는 자연어 처리 및 AI 기반 언어 모델 개발을 지원하는 플랫폼입니다. 사용자들이 쉽게 맞춤형 챗봇이나 언어 모델을 구축하고 관리할 수 있도록 도와줍니다. 또한, 직관적인 인터페이스와 다양한 도구를 제공하여 개발자가 효율적으로 AI 애플리케이션을 구현할 수 있게 합니다.',
 'Langgraph는 자연어 처리와 그래프 이론을 결합한 기술로, 텍스트 데이터를 그래프 구조로 표현하여 의미 관계를 분석하는 방식입니다. 이를 통해 문장 간의 유사성이나 의미 연결성을 효율적으로 파악할 수 있으며, 정보 검색과 추천 시스템 등에 활용됩니다. 또한, Langgraph는 딥러닝과 결합하여 더 정교한 자연어 이해와 의미 추론을 가능하게 합니다.']