# LangChain 소개

## 1. LangChain이란?

 - LangChain은 LLM(거대 언어 모델)을 활용하여 실제 애플리케이션을 쉽고 강력하게 구축할 수 있도록 도와주는 프레임워크입니다. 
 - 단순히 모델을 호출하는 것을 넘어, 데이터 연결, 에이전트 생성, 체인 구성 등 LLM 애플리케이션에 필요한 다양한 기능을 모듈화하여 제공합니다.
### 핵심 정의
- LLM 기반 애플리케이션의 전체 라이프사이클을 단순화
- 개발부터 배포까지 종합적인 솔루션 제공
- 다양한 LLM 제공업체와의 표준화된 인터페이스 구현

#### 우리가 주로 사용할 LangChain 모듈들
1. PromptTemplate
2. OutputParser
3. Model
4. DocumentLoader
5. TextSpliter
6. Embedding
7. VectorStore


### 기본 사용 예제

#### 1. API 키 설정

In [2]:

%pip install dotenv

Note: you may need to restart the kernel to use updated packages.


In [7]:
import os
from dotenv import load_dotenv

# .env 파일에서 환경변수 로드
load_dotenv()

# OpenAI API 환경변수 값 확인
openai_api_key = os.getenv('OPENAI_API_KEY')
print(f"OPENAI_API_KEY가 설정되어 있나요?: {openai_api_key[:10]}...")

OPENAI_API_KEY가 설정되어 있나요?: sk-proj-7l...


#### 2. 채팅 모델 초기화


In [8]:
from langchain.chat_models import init_chat_model

# model provider : 모델 제공사
# temperature : 창의성 정도
llm = init_chat_model("gpt-4o-mini", model_provider="openai", temperature=0.5)

print("모델이 성공적으로 초기화되었습니다!")

모델이 성공적으로 초기화되었습니다!


In [5]:
%pip install langchain openai langchain-openai

Collecting openai
  Downloading openai-2.15.0-py3-none-any.whl.metadata (29 kB)
Collecting langchain-openai
  Downloading langchain_openai-1.1.7-py3-none-any.whl.metadata (2.6 kB)
Collecting distro<2,>=1.7.0 (from openai)
  Downloading distro-1.9.0-py3-none-any.whl.metadata (6.8 kB)
Collecting jiter<1,>=0.10.0 (from openai)
  Downloading jiter-0.12.0-cp312-cp312-win_amd64.whl.metadata (5.3 kB)
Collecting sniffio (from openai)
  Downloading sniffio-1.3.1-py3-none-any.whl.metadata (3.9 kB)
Collecting tqdm>4 (from openai)
  Downloading tqdm-4.67.1-py3-none-any.whl.metadata (57 kB)
Collecting tiktoken<1.0.0,>=0.7.0 (from langchain-openai)
  Downloading tiktoken-0.12.0-cp312-cp312-win_amd64.whl.metadata (6.9 kB)
Collecting regex>=2022.1.18 (from tiktoken<1.0.0,>=0.7.0->langchain-openai)
  Downloading regex-2026.1.15-cp312-cp312-win_amd64.whl.metadata (41 kB)
Downloading openai-2.15.0-py3-none-any.whl (1.1 MB)
   ---------------------------------------- 0.0/1.1 MB ? eta -:--:--
   ----------

#### 3.LLM 호출

In [9]:
# 간단한 메시지 전송
# invoke : 실행명령어
response = llm.invoke("안녕하세요! LangChain에 대해 간단히 설명해주세요.")

print("AI 응답:")
print(response.content)


AI 응답:
안녕하세요! LangChain은 자연어 처리(NLP)와 관련된 다양한 작업을 보다 쉽게 수행할 수 있도록 돕는 프레임워크입니다. 주로 대화형 AI 애플리케이션, 챗봇, 정보 검색 시스템 등에서 사용됩니다.

LangChain의 주요 특징은 다음과 같습니다:

1. **모듈화**: LangChain은 다양한 구성 요소(예: 언어 모델, 데이터베이스, API 등)를 모듈화하여 사용자가 필요에 맞게 조합할 수 있도록 합니다.

2. **체인**: 여러 작업을 순차적으로 연결하여 복잡한 작업을 수행할 수 있는 '체인' 개념을 제공합니다. 예를 들어, 입력을 받아 처리하고, 그 결과를 기반으로 추가 작업을 수행하는 방식입니다.

3. **확장성**: 다양한 언어 모델과 데이터 소스와의 통합을 지원하여, 사용자가 원하는 방식으로 시스템을 확장할 수 있습니다.

4. **사용자 친화적**: 직관적인 API와 문서를 제공하여, 개발자들이 쉽게 사용할 수 있도록 설계되었습니다.

LangChain은 이러한 기능들을 통해 NLP 기반 애플리케이션 개발을 더욱 효율적이고 유연하게 만들어줍니다.


In [10]:
print(response)

content="안녕하세요! LangChain은 자연어 처리(NLP)와 관련된 다양한 작업을 보다 쉽게 수행할 수 있도록 돕는 프레임워크입니다. 주로 대화형 AI 애플리케이션, 챗봇, 정보 검색 시스템 등에서 사용됩니다.\n\nLangChain의 주요 특징은 다음과 같습니다:\n\n1. **모듈화**: LangChain은 다양한 구성 요소(예: 언어 모델, 데이터베이스, API 등)를 모듈화하여 사용자가 필요에 맞게 조합할 수 있도록 합니다.\n\n2. **체인**: 여러 작업을 순차적으로 연결하여 복잡한 작업을 수행할 수 있는 '체인' 개념을 제공합니다. 예를 들어, 입력을 받아 처리하고, 그 결과를 기반으로 추가 작업을 수행하는 방식입니다.\n\n3. **확장성**: 다양한 언어 모델과 데이터 소스와의 통합을 지원하여, 사용자가 원하는 방식으로 시스템을 확장할 수 있습니다.\n\n4. **사용자 친화적**: 직관적인 API와 문서를 제공하여, 개발자들이 쉽게 사용할 수 있도록 설계되었습니다.\n\nLangChain은 이러한 기능들을 통해 NLP 기반 애플리케이션 개발을 더욱 효율적이고 유연하게 만들어줍니다." additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 268, 'prompt_tokens': 20, 'total_tokens': 288, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fing


#### AIMessage
- LangChain에서 LLM 호출 시 `AIMessage` 객체가 반환됩니다. 
- LangChain 프레임워크에서 AI 언어 모델이 생성한 메시지를 나타내는 데이터 구조(클래스)입니다.
---
**주요 구성 요소**
1. content
- 모델이 실제로 생성한 답변 텍스트
2. additional_kwargs
- 부가 옵션 (예: 거부 여부 `refusal`)
3. response_metadata
- 모델 관련 상세 정보
  - 사용된 모델 이름 (`model_name`)
  - 토큰 사용량 (`prompt_tokens`, `completion_tokens`, `total_tokens`)
  - 응답 종료 이유 (`finish_reason`)
4. usage_metadata
- LangChain이 정리한 토큰 사용량 요약


In [None]:
print(response.content)

In [None]:
print(response.response_metadata)

## 2.LCEL (Langchain Chain Expression Language)
**LCEL이란?**
- Langchain에서 프롬프트, 체인, LLM 호출 등 다양한 구성요소를 함수형으로 조합할 수 있음.
- 파이프라인처럼 여러 단계를 연결하여 복잡한 워크플로우를 간결하게 체인형태로 구현할 수 있다.
- 각 단계는 함수(또는 객체)로 표현되며, 입력과 출력을 연결 가능하다.
- 예시: (프롬프트 → LLM → 후처리) 과정을 한 줄로 연결하여 작성 가능합니다
- `chain = prompt | model | output`

In [11]:
from langchain_core.prompts import PromptTemplate

prompt = PromptTemplate.from_template("{input}가 무엇인가요?")

In [12]:
# chain 만들기
chain = prompt | llm

In [19]:
# 유저 입력
input = "고양이"

# 응답 출력
response = chain.invoke(input)
print(response.content)

고양이는 고양이과에 속하는 포유류로, 일반적으로 애완동물로 많이 기르는 동물입니다. 학명은 *Felis catus*이며, 다양한 품종과 색상을 가지고 있습니다. 고양이는 독립적인 성격을 가지고 있으며, 뛰어난 사냥 능력과 민첩성으로 유명합니다. 또한, 고양이는 사람과의 사회적 상호작용을 즐기기도 하며, 다양한 소리(예: 야옹, 그르릉거림 등)를 통해 의사소통을 합니다. 고양이는 주로 육식성으로, 작은 동물이나 곤충을 사냥하여 먹습니다. 그들의 행동과 습성은 매우 다양하며, 많은 사람들에게 사랑받는 반려동물입니다.


### 공식 리소스
- **공식 문서**: [python.langchain.com](https://python.langchain.com)