# LangChain 소개

## 1. LangChain이란?

 - LangChain은 LLM(거대 언어 모델)을 활용하여 실제 애플리케이션을 쉽고 강력하게 구축할 수 있도록 도와주는 프레임워크입니다. 
 - 단순히 모델을 호출하는 것을 넘어, 데이터 연결, 에이전트 생성, 체인 구성 등 LLM 애플리케이션에 필요한 다양한 기능을 모듈화하여 제공합니다.
### 핵심 정의
- LLM 기반 애플리케이션의 전체 라이프사이클을 단순화
- 개발부터 배포까지 종합적인 솔루션 제공
- 다양한 LLM 제공업체와의 표준화된 인터페이스 구현

#### 우리가 주로 사용할 LangChain 모듈들
1. PromptTemplate
2. OutputParser
3. Model
4. DocumentLoader
5. TextSpliter
6. Embedding
7. VectorStore


### 기본 사용 예제

#### 1. API 키 설정

In [5]:
%pip install dotenv

Note: you may need to restart the kernel to use updated packages.


In [6]:
import os
from dotenv import load_dotenv

# .env 파일에서 환경변수 로드
load_dotenv()

# OpenAI API 환경변수 값 확인
openai_api_key = os.getenv('OPENAI_API_KEY')
print(f"OPENAI_API_KEY가 설정되어 있나요?: {openai_api_key[:10]}...")

OPENAI_API_KEY가 설정되어 있나요?: sk-proj-7l...


#### 2. 채팅 모델 초기화


In [10]:
%pip install langchain openai langchain-openai

Collecting openai
  Downloading openai-2.15.0-py3-none-any.whl.metadata (29 kB)
Collecting langchain-openai
  Downloading langchain_openai-1.1.7-py3-none-any.whl.metadata (2.6 kB)
Collecting distro<2,>=1.7.0 (from openai)
  Downloading distro-1.9.0-py3-none-any.whl.metadata (6.8 kB)
Collecting jiter<1,>=0.10.0 (from openai)
  Downloading jiter-0.12.0-cp312-cp312-win_amd64.whl.metadata (5.3 kB)
Collecting sniffio (from openai)
  Downloading sniffio-1.3.1-py3-none-any.whl.metadata (3.9 kB)
Collecting tqdm>4 (from openai)
  Downloading tqdm-4.67.1-py3-none-any.whl.metadata (57 kB)
Collecting tiktoken<1.0.0,>=0.7.0 (from langchain-openai)
  Downloading tiktoken-0.12.0-cp312-cp312-win_amd64.whl.metadata (6.9 kB)
Collecting regex>=2022.1.18 (from tiktoken<1.0.0,>=0.7.0->langchain-openai)
  Downloading regex-2026.1.15-cp312-cp312-win_amd64.whl.metadata (41 kB)
Downloading openai-2.15.0-py3-none-any.whl (1.1 MB)
   ---------------------------------------- 0.0/1.1 MB ? eta -:--:--
   ----------

In [11]:
from langchain.chat_models import init_chat_model

# model provider : 모델 제공사
# temperature : 창의성 정도
llm = init_chat_model("gpt-4o-mini", model_provider="openai", temperature=0.5)

print("모델이 성공적으로 초기화되었습니다!")

모델이 성공적으로 초기화되었습니다!


#### 3.LLM 호출

In [13]:
# 간단한 메시지 전송
# invoke : 실행명령어
response = llm.invoke("안녕하세요! LangChain에 대해 간단히 설명해주세요.")

print("AI 응답:")
print(response.content)


AI 응답:
안녕하세요! LangChain은 자연어 처리(NLP)와 관련된 다양한 작업을 수행할 수 있도록 돕는 프레임워크입니다. 주로 언어 모델을 활용하여 애플리케이션을 구축하는 데 사용되며, 다음과 같은 주요 기능을 제공합니다:

1. **체인**: 여러 작업을 순차적으로 연결하여 복잡한 작업을 수행할 수 있는 체인을 구성할 수 있습니다. 예를 들어, 텍스트 생성 후 그 결과를 분석하는 등의 작업을 체인으로 연결할 수 있습니다.

2. **프롬프트 관리**: 자연어 모델에 대한 입력 프롬프트를 효율적으로 관리하고 최적화할 수 있는 도구를 제공합니다.

3. **메모리**: 대화형 애플리케이션에서 이전 대화 내용을 기억하고 활용할 수 있는 메모리 기능을 지원합니다.

4. **API 통합**: 다양한 데이터 소스와 API를 통합하여 언어 모델의 기능을 확장할 수 있습니다.

5. **모듈화**: 다양한 언어 모델과 도구를 손쉽게 결합하여 맞춤형 솔루션을 만들 수 있도록 설계되었습니다.

LangChain은 개발자들이 언어 모델을 활용한 애플리케이션을 보다 쉽게 구축하고 관리할 수 있도록 돕는 강력한 도구입니다.


In [14]:
print(response)

content='안녕하세요! LangChain은 자연어 처리(NLP)와 관련된 다양한 작업을 수행할 수 있도록 돕는 프레임워크입니다. 주로 언어 모델을 활용하여 애플리케이션을 구축하는 데 사용되며, 다음과 같은 주요 기능을 제공합니다:\n\n1. **체인**: 여러 작업을 순차적으로 연결하여 복잡한 작업을 수행할 수 있는 체인을 구성할 수 있습니다. 예를 들어, 텍스트 생성 후 그 결과를 분석하는 등의 작업을 체인으로 연결할 수 있습니다.\n\n2. **프롬프트 관리**: 자연어 모델에 대한 입력 프롬프트를 효율적으로 관리하고 최적화할 수 있는 도구를 제공합니다.\n\n3. **메모리**: 대화형 애플리케이션에서 이전 대화 내용을 기억하고 활용할 수 있는 메모리 기능을 지원합니다.\n\n4. **API 통합**: 다양한 데이터 소스와 API를 통합하여 언어 모델의 기능을 확장할 수 있습니다.\n\n5. **모듈화**: 다양한 언어 모델과 도구를 손쉽게 결합하여 맞춤형 솔루션을 만들 수 있도록 설계되었습니다.\n\nLangChain은 개발자들이 언어 모델을 활용한 애플리케이션을 보다 쉽게 구축하고 관리할 수 있도록 돕는 강력한 도구입니다.' additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 291, 'prompt_tokens': 20, 'total_tokens': 311, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-4o-mini-2024-07-18


#### AIMessage
- LangChain에서 LLM 호출 시 `AIMessage` 객체가 반환됩니다. 
- LangChain 프레임워크에서 AI 언어 모델이 생성한 메시지를 나타내는 데이터 구조(클래스)입니다.
---
**주요 구성 요소**
1. content
- 모델이 실제로 생성한 답변 텍스트
2. additional_kwargs
- 부가 옵션 (예: 거부 여부 `refusal`)
3. response_metadata
- 모델 관련 상세 정보
  - 사용된 모델 이름 (`model_name`)
  - 토큰 사용량 (`prompt_tokens`, `completion_tokens`, `total_tokens`)
  - 응답 종료 이유 (`finish_reason`)
4. usage_metadata
- LangChain이 정리한 토큰 사용량 요약


In [15]:
print(response.content)

안녕하세요! LangChain은 자연어 처리(NLP)와 관련된 다양한 작업을 수행할 수 있도록 돕는 프레임워크입니다. 주로 언어 모델을 활용하여 애플리케이션을 구축하는 데 사용되며, 다음과 같은 주요 기능을 제공합니다:

1. **체인**: 여러 작업을 순차적으로 연결하여 복잡한 작업을 수행할 수 있는 체인을 구성할 수 있습니다. 예를 들어, 텍스트 생성 후 그 결과를 분석하는 등의 작업을 체인으로 연결할 수 있습니다.

2. **프롬프트 관리**: 자연어 모델에 대한 입력 프롬프트를 효율적으로 관리하고 최적화할 수 있는 도구를 제공합니다.

3. **메모리**: 대화형 애플리케이션에서 이전 대화 내용을 기억하고 활용할 수 있는 메모리 기능을 지원합니다.

4. **API 통합**: 다양한 데이터 소스와 API를 통합하여 언어 모델의 기능을 확장할 수 있습니다.

5. **모듈화**: 다양한 언어 모델과 도구를 손쉽게 결합하여 맞춤형 솔루션을 만들 수 있도록 설계되었습니다.

LangChain은 개발자들이 언어 모델을 활용한 애플리케이션을 보다 쉽게 구축하고 관리할 수 있도록 돕는 강력한 도구입니다.


In [None]:
print(response.response_metadata)

## 2.LCEL (Langchain Chain Expression Language)
**LCEL이란?**
- Langchain에서 프롬프트, 체인, LLM 호출 등 다양한 구성요소를 함수형으로 조합할 수 있음.
- 파이프라인처럼 여러 단계를 연결하여 복잡한 워크플로우를 간결하게 체인형태로 구현할 수 있다.
- 각 단계는 함수(또는 객체)로 표현되며, 입력과 출력을 연결 가능하다.
- 예시: (프롬프트 → LLM → 후처리) 과정을 한 줄로 연결하여 작성 가능합니다
- `chain = prompt | model | output`

In [16]:
from langchain_core.prompts import PromptTemplate

prompt = PromptTemplate.from_template("{input}가 무엇인가요?")

In [17]:
# chain 만들기
chain = prompt | llm

In [22]:
# 유저 입력
input = "고양이"

# 응답 출력
response = chain.invoke(input)
print(response.content)

고양이는 포유류에 속하는 동물로, 과학적으로는 '펠리스 카투스' (Felis catus)로 분류됩니다. 고양이는 일반적으로 작은 체구와 유연한 몸, 날카로운 발톱과 뛰어난 감각을 가진 육식성 동물입니다. 주로 집에서 기르는 애완동물로 알려져 있으며, 사람들과의 유대감이 강하고 다양한 성격을 가지고 있습니다.

고양이는 뛰어난 사냥 능력을 가지고 있어 작은 설치류나 곤충을 잡는 데 능숙하며, 그들의 독립적인 성격 때문에 주인과의 관계에서도 자율성을 중요시하는 경향이 있습니다. 또한, 고양이는 다양한 품종이 있으며, 각 품종마다 특징적인 외모와 성격을 가지고 있습니다. 

고양이는 사람들에게 사랑과 동반자로서 큰 행복을 주는 존재입니다.


### 공식 리소스
- **공식 문서**: [python.langchain.com](https://python.langchain.com)