# LangChain 소개

## 1. LangChain이란?

 - LangChain은 LLM(거대 언어 모델)을 활용하여 실제 애플리케이션을 쉽고 강력하게 구축할 수 있도록 도와주는 프레임워크입니다. 
 - 단순히 모델을 호출하는 것을 넘어, 데이터 연결, 에이전트 생성, 체인 구성 등 LLM 애플리케이션에 필요한 다양한 기능을 모듈화하여 제공합니다.
### 핵심 정의
- LLM 기반 애플리케이션의 전체 라이프사이클을 단순화
- 개발부터 배포까지 종합적인 솔루션 제공
- 다양한 LLM 제공업체와의 표준화된 인터페이스 구현

#### 우리가 주로 사용할 LangChain 모듈들
1. PromptTemplate
2. OutputParser
3. Model
4. DocumentLoader
5. TextSpliter
6. Embedding
7. VectorStore


### 기본 사용 예제

#### 1. API 키 설정

In [3]:
%pip install dotenv

Note: you may need to restart the kernel to use updated packages.


In [1]:
import os
from dotenv import load_dotenv

# .env 파일에서 환경변수 로드
load_dotenv()
# OpenAI API 환경변수 값 확인
openai_api_key = os.getenv('OPENAI_API_KEY')
print(f"OPENAI_API_KEY가 설정되어 있나요?: {openai_api_key[:10]}...")

ModuleNotFoundError: No module named 'dotenv'

In [2]:
%pip install dotenv

Collecting dotenv
  Downloading dotenv-0.9.9-py2.py3-none-any.whl.metadata (279 bytes)
Collecting python-dotenv (from dotenv)
  Downloading python_dotenv-1.2.1-py3-none-any.whl.metadata (25 kB)
Downloading dotenv-0.9.9-py2.py3-none-any.whl (1.9 kB)
Downloading python_dotenv-1.2.1-py3-none-any.whl (21 kB)
Installing collected packages: python-dotenv, dotenv

   ---------------------------------------- 2/2 [dotenv]

Successfully installed dotenv-0.9.9 python-dotenv-1.2.1
Note: you may need to restart the kernel to use updated packages.


#### 2. 채팅 모델 초기화


In [11]:
%pip install langchain openai langchain-openai

Collecting openai
  Downloading openai-2.15.0-py3-none-any.whl.metadata (29 kB)
Collecting langchain-openai
  Downloading langchain_openai-1.1.7-py3-none-any.whl.metadata (2.6 kB)
Collecting distro<2,>=1.7.0 (from openai)
  Downloading distro-1.9.0-py3-none-any.whl.metadata (6.8 kB)
Collecting jiter<1,>=0.10.0 (from openai)
  Downloading jiter-0.12.0-cp312-cp312-win_amd64.whl.metadata (5.3 kB)
Collecting sniffio (from openai)
  Downloading sniffio-1.3.1-py3-none-any.whl.metadata (3.9 kB)
Collecting tqdm>4 (from openai)
  Downloading tqdm-4.67.1-py3-none-any.whl.metadata (57 kB)
Collecting tiktoken<1.0.0,>=0.7.0 (from langchain-openai)
  Downloading tiktoken-0.12.0-cp312-cp312-win_amd64.whl.metadata (6.9 kB)
Collecting regex>=2022.1.18 (from tiktoken<1.0.0,>=0.7.0->langchain-openai)
  Downloading regex-2026.1.15-cp312-cp312-win_amd64.whl.metadata (41 kB)
Downloading openai-2.15.0-py3-none-any.whl (1.1 MB)
   ---------------------------------------- 0.0/1.1 MB ? eta -:--:--
   ----------

In [12]:
from langchain.chat_models import init_chat_model

# model provider : 모델 제공사
# temperature : 창의성 정도
llm = init_chat_model("gpt-4o-mini", model_provider="openai", temperature=0.5)

print("모델이 성공적으로 초기화되었습니다!")

모델이 성공적으로 초기화되었습니다!


#### 3.LLM 호출

In [13]:
# 간단한 메시지 전송
# invoke : 실행명령어
response = llm.invoke("안녕하세요! LangChain에 대해 간단히 설명해주세요.")

print("AI 응답:")
print(response.content)


AI 응답:
안녕하세요! LangChain은 자연어 처리(NLP)와 관련된 다양한 작업을 수행하기 위한 프레임워크입니다. 주로 대화형 AI 애플리케이션을 구축하는 데 사용되며, 언어 모델과 다른 데이터 소스(예: 데이터베이스, API 등)를 통합하여 복잡한 작업을 수행할 수 있도록 돕습니다.

LangChain의 주요 기능은 다음과 같습니다:

1. **체인**: 여러 개의 언어 모델이나 도구를 연결하여 복잡한 작업을 수행할 수 있는 체인을 구성할 수 있습니다.
2. **프롬프트 템플릿**: 사용자 입력을 기반으로 동적으로 프롬프트를 생성하여 언어 모델을 효과적으로 활용할 수 있습니다.
3. **메모리**: 대화의 맥락을 유지하고 이전 대화 내용을 기억하여 더 자연스러운 상호작용을 가능하게 합니다.
4. **도구 통합**: API 호출, 데이터베이스 쿼리 등 다양한 외부 도구와의 통합을 지원하여 언어 모델의 기능을 확장할 수 있습니다.

LangChain은 다양한 NLP 애플리케이션을 쉽게 개발할 수 있도록 도와주는 강력한 도구입니다.


In [14]:
print(response)

content='안녕하세요! LangChain은 자연어 처리(NLP)와 관련된 다양한 작업을 수행하기 위한 프레임워크입니다. 주로 대화형 AI 애플리케이션을 구축하는 데 사용되며, 언어 모델과 다른 데이터 소스(예: 데이터베이스, API 등)를 통합하여 복잡한 작업을 수행할 수 있도록 돕습니다.\n\nLangChain의 주요 기능은 다음과 같습니다:\n\n1. **체인**: 여러 개의 언어 모델이나 도구를 연결하여 복잡한 작업을 수행할 수 있는 체인을 구성할 수 있습니다.\n2. **프롬프트 템플릿**: 사용자 입력을 기반으로 동적으로 프롬프트를 생성하여 언어 모델을 효과적으로 활용할 수 있습니다.\n3. **메모리**: 대화의 맥락을 유지하고 이전 대화 내용을 기억하여 더 자연스러운 상호작용을 가능하게 합니다.\n4. **도구 통합**: API 호출, 데이터베이스 쿼리 등 다양한 외부 도구와의 통합을 지원하여 언어 모델의 기능을 확장할 수 있습니다.\n\nLangChain은 다양한 NLP 애플리케이션을 쉽게 개발할 수 있도록 도와주는 강력한 도구입니다.' additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 269, 'prompt_tokens': 20, 'total_tokens': 289, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_c4585b5b9c', 'id':


#### AIMessage
- LangChain에서 LLM 호출 시 `AIMessage` 객체가 반환됩니다. 
- LangChain 프레임워크에서 AI 언어 모델이 생성한 메시지를 나타내는 데이터 구조(클래스)입니다.
---
**주요 구성 요소**
1. content
- 모델이 실제로 생성한 답변 텍스트
2. additional_kwargs
- 부가 옵션 (예: 거부 여부 `refusal`)
3. response_metadata
- 모델 관련 상세 정보
  - 사용된 모델 이름 (`model_name`)
  - 토큰 사용량 (`prompt_tokens`, `completion_tokens`, `total_tokens`)
  - 응답 종료 이유 (`finish_reason`)
4. usage_metadata
- LangChain이 정리한 토큰 사용량 요약


In [15]:
print(response.content)

안녕하세요! LangChain은 자연어 처리(NLP)와 관련된 다양한 작업을 수행하기 위한 프레임워크입니다. 주로 대화형 AI 애플리케이션을 구축하는 데 사용되며, 언어 모델과 다른 데이터 소스(예: 데이터베이스, API 등)를 통합하여 복잡한 작업을 수행할 수 있도록 돕습니다.

LangChain의 주요 기능은 다음과 같습니다:

1. **체인**: 여러 개의 언어 모델이나 도구를 연결하여 복잡한 작업을 수행할 수 있는 체인을 구성할 수 있습니다.
2. **프롬프트 템플릿**: 사용자 입력을 기반으로 동적으로 프롬프트를 생성하여 언어 모델을 효과적으로 활용할 수 있습니다.
3. **메모리**: 대화의 맥락을 유지하고 이전 대화 내용을 기억하여 더 자연스러운 상호작용을 가능하게 합니다.
4. **도구 통합**: API 호출, 데이터베이스 쿼리 등 다양한 외부 도구와의 통합을 지원하여 언어 모델의 기능을 확장할 수 있습니다.

LangChain은 다양한 NLP 애플리케이션을 쉽게 개발할 수 있도록 도와주는 강력한 도구입니다.


In [16]:
print(response.response_metadata)

{'token_usage': {'completion_tokens': 269, 'prompt_tokens': 20, 'total_tokens': 289, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_c4585b5b9c', 'id': 'chatcmpl-CyXUUen3tLTRVFq8d9WMl8TRlfcZf', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}


## 2.LCEL (Langchain Chain Expression Language)
**LCEL이란?**
- Langchain에서 프롬프트, 체인, LLM 호출 등 다양한 구성요소를 함수형으로 조합할 수 있음.
- 파이프라인처럼 여러 단계를 연결하여 복잡한 워크플로우를 간결하게 체인형태로 구현할 수 있다.
- 각 단계는 함수(또는 객체)로 표현되며, 입력과 출력을 연결 가능하다.
- 예시: (프롬프트 → LLM → 후처리) 과정을 한 줄로 연결하여 작성 가능합니다
- `chain = prompt | model | output`

In [17]:
from langchain_core.prompts import PromptTemplate

prompt = PromptTemplate.from_template("{input}가 무엇인가요?")

In [18]:
# chain 만들기
chain = prompt | llm

In [22]:
# 유저 입력
input = "오리너구리"

# 응답 출력
response = chain.invoke(input)
print(response.content)

오리너구리(Platypus)는 호주와 타스마니아에서 주로 서식하는 독특한 포유류입니다. 이 동물은 여러 가지 특징을 가지고 있어 매우 특별한 생물로 여겨집니다. 오리너구리는 다음과 같은 주요 특징을 가지고 있습니다:

1. **외형**: 오리너구리는 오리의 부리와 비슷한 평평한 부리를 가지고 있으며, 몸은 다람쥐와 비슷한 형태입니다. 또한, 물갈퀴가 있는 발과 털이 있는 몸을 가지고 있습니다.

2. **알을 낳는 포유류**: 오리너구리는 유일하게 알을 낳는 포유류 중 하나입니다. 이들은 알을 낳고, 부화한 후에는 새끼를 젖으로 기릅니다.

3. **수영 능력**: 오리너구리는 수영을 잘하며, 물속에서 먹이를 찾는 데 능숙합니다. 주로 갑각류, 곤충, 작은 물고기 등을 먹습니다.

4. **전기 감각**: 오리너구리는 부리의 전기 수용체를 통해 물속에서 전기 신호를 감지할 수 있어, 어두운 물속에서도 먹이를 찾을 수 있습니다.

오리너구리는 그 독특한 생김새와 생태적 특성 덕분에 많은 사람들에게 관심을 받고 있으며, 호주의 상징적인 동물 중 하나로 여겨집니다.


### 공식 리소스
- **공식 문서**: [python.langchain.com](https://python.langchain.com)