# LangChain 소개

## 1. LangChain이란?

 - LangChain은 LLM(거대 언어 모델)을 활용하여 실제 애플리케이션을 쉽고 강력하게 구축할 수 있도록 도와주는 프레임워크입니다. 
 - 단순히 모델을 호출하는 것을 넘어, 데이터 연결, 에이전트 생성, 체인 구성 등 LLM 애플리케이션에 필요한 다양한 기능을 모듈화하여 제공합니다.
### 핵심 정의
- LLM 기반 애플리케이션의 전체 라이프사이클을 단순화
- 개발부터 배포까지 종합적인 솔루션 제공
- 다양한 LLM 제공업체와의 표준화된 인터페이스 구현

#### 우리가 주로 사용할 LangChain 모듈들
1. PromptTemplate
2. OutputParser
3. Model
4. DocumentLoader
5. TextSpliter
6. Embedding
7. VectorStore


### 기본 사용 예제

#### 1. API 키 설정

In [2]:
%pip install dotenv

Collecting dotenv
  Downloading dotenv-0.9.9-py2.py3-none-any.whl.metadata (279 bytes)
Collecting python-dotenv (from dotenv)
  Downloading python_dotenv-1.2.1-py3-none-any.whl.metadata (25 kB)
Downloading dotenv-0.9.9-py2.py3-none-any.whl (1.9 kB)
Downloading python_dotenv-1.2.1-py3-none-any.whl (21 kB)
Installing collected packages: python-dotenv, dotenv

   ---------------------------------------- 2/2 [dotenv]

Successfully installed dotenv-0.9.9 python-dotenv-1.2.1
Note: you may need to restart the kernel to use updated packages.


In [15]:
import os
from dotenv import load_dotenv

# .env 파일에서 환경변수 로드
load_dotenv()

# OpenAI API 환경변수 값 확인
openai_api_key = os.getenv('OPENAI_API_KEY')
print(f"OPENAI_API_KEY가 설정되어 있나요?: {openai_api_key[:10]}...")

OPENAI_API_KEY가 설정되어 있나요?: sk-proj-7l...


#### 2. 채팅 모델 초기화


In [1]:
%pip install langchain

Collecting langchain
  Downloading langchain-1.2.4-py3-none-any.whl.metadata (4.9 kB)
Collecting langchain-core<2.0.0,>=1.2.1 (from langchain)
  Downloading langchain_core-1.2.7-py3-none-any.whl.metadata (3.7 kB)
Collecting langgraph<1.1.0,>=1.0.2 (from langchain)
  Downloading langgraph-1.0.6-py3-none-any.whl.metadata (7.4 kB)
Collecting pydantic<3.0.0,>=2.7.4 (from langchain)
  Downloading pydantic-2.12.5-py3-none-any.whl.metadata (90 kB)
Collecting jsonpatch<2.0.0,>=1.33.0 (from langchain-core<2.0.0,>=1.2.1->langchain)
  Downloading jsonpatch-1.33-py2.py3-none-any.whl.metadata (3.0 kB)
Collecting langsmith<1.0.0,>=0.3.45 (from langchain-core<2.0.0,>=1.2.1->langchain)
  Downloading langsmith-0.6.4-py3-none-any.whl.metadata (15 kB)
Collecting uuid-utils<1.0,>=0.12.0 (from langchain-core<2.0.0,>=1.2.1->langchain)
  Downloading uuid_utils-0.13.0-cp39-abi3-win_amd64.whl.metadata (5.5 kB)
Collecting langgraph-checkpoint<5.0.0,>=2.1.0 (from langgraph<1.1.0,>=1.0.2->langchain)
  Downloading

In [8]:
%pip install langchain openai langchain-openai

Note: you may need to restart the kernel to use updated packages.


In [16]:
from langchain.chat_models import init_chat_model

# model provider : 모델 제공사
# temperature : 창의성 정도
llm = init_chat_model("gpt-4o-mini", model_provider="openai", temperature=0.5)

print("모델이 성공적으로 초기화되었습니다!")

모델이 성공적으로 초기화되었습니다!


#### 3.LLM 호출

In [17]:
# 간단한 메시지 전송
# invoke : 실행명령어
response = llm.invoke("안녕하세요! LangChain에 대해 간단히 설명해주세요.")

print("AI 응답:")
print(response.content)


AI 응답:
안녕하세요! LangChain은 자연어 처리(NLP) 애플리케이션을 개발하기 위한 프레임워크입니다. 주로 대화형 AI, 챗봇, 정보 검색 시스템 등을 구축하는 데 사용됩니다. LangChain은 다양한 언어 모델과 데이터 소스, API를 통합하여 복잡한 작업을 수행할 수 있도록 도와줍니다.

주요 특징은 다음과 같습니다:

1. **모듈화**: LangChain은 다양한 구성 요소(예: 프롬프트, 체인, 메모리 등)를 모듈화하여 개발자가 필요에 따라 조합할 수 있습니다.
2. **유연성**: 여러 언어 모델과 데이터 소스를 지원하여 다양한 사용 사례에 맞게 조정할 수 있습니다.
3. **체인**: 여러 작업을 연결하여 복잡한 작업 흐름을 구축할 수 있는 체인 기능을 제공합니다.
4. **통합**: 외부 API나 데이터베이스와 쉽게 통합할 수 있어, 실제 애플리케이션에서 유용하게 사용할 수 있습니다.

이러한 기능 덕분에 LangChain은 개발자들이 보다 쉽게 고급 NLP 애플리케이션을 구축할 수 있도록 도와줍니다.


In [19]:
print(response)

content='안녕하세요! LangChain은 자연어 처리(NLP) 애플리케이션을 개발하기 위한 프레임워크입니다. 주로 대화형 AI, 챗봇, 정보 검색 시스템 등을 구축하는 데 사용됩니다. LangChain은 다양한 언어 모델과 데이터 소스, API를 통합하여 복잡한 작업을 수행할 수 있도록 도와줍니다.\n\n주요 특징은 다음과 같습니다:\n\n1. **모듈화**: LangChain은 다양한 구성 요소(예: 프롬프트, 체인, 메모리 등)를 모듈화하여 개발자가 필요에 따라 조합할 수 있습니다.\n2. **유연성**: 여러 언어 모델과 데이터 소스를 지원하여 다양한 사용 사례에 맞게 조정할 수 있습니다.\n3. **체인**: 여러 작업을 연결하여 복잡한 작업 흐름을 구축할 수 있는 체인 기능을 제공합니다.\n4. **통합**: 외부 API나 데이터베이스와 쉽게 통합할 수 있어, 실제 애플리케이션에서 유용하게 사용할 수 있습니다.\n\n이러한 기능 덕분에 LangChain은 개발자들이 보다 쉽게 고급 NLP 애플리케이션을 구축할 수 있도록 도와줍니다.' additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 265, 'prompt_tokens': 20, 'total_tokens': 285, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_c4585b5b9c', 'id': 'ch


#### AIMessage
- LangChain에서 LLM 호출 시 `AIMessage` 객체가 반환됩니다. 
- LangChain 프레임워크에서 AI 언어 모델이 생성한 메시지를 나타내는 데이터 구조(클래스)입니다.
---
**주요 구성 요소**
1. content
- 모델이 실제로 생성한 답변 텍스트
2. additional_kwargs
- 부가 옵션 (예: 거부 여부 `refusal`)
3. response_metadata
- 모델 관련 상세 정보
  - 사용된 모델 이름 (`model_name`)
  - 토큰 사용량 (`prompt_tokens`, `completion_tokens`, `total_tokens`)
  - 응답 종료 이유 (`finish_reason`)
4. usage_metadata
- LangChain이 정리한 토큰 사용량 요약


In [None]:
print(response.content)

In [None]:
print(response.response_metadata)

## 2.LCEL (Langchain Chain Expression Language)
**LCEL이란?**
- Langchain에서 프롬프트, 체인, LLM 호출 등 다양한 구성요소를 함수형으로 조합할 수 있음.
- 파이프라인처럼 여러 단계를 연결하여 복잡한 워크플로우를 간결하게 체인형태로 구현할 수 있다.
- 각 단계는 함수(또는 객체)로 표현되며, 입력과 출력을 연결 가능하다.
- 예시: (프롬프트 → LLM → 후처리) 과정을 한 줄로 연결하여 작성 가능합니다
- `chain = prompt | model | output`

In [20]:
from langchain_core.prompts import PromptTemplate

prompt = PromptTemplate.from_template("{input}가 무엇인가요?")

In [21]:
# chain 만들기
chain = prompt | llm

In [29]:
# 유저 입력
input = "고양이"

# 응답 출력
response = chain.invoke(input)
print(response.content)

고양이는 포유류 중 하나로, 고양이과(Felidae)에 속하는 동물입니다. 일반적으로 집에서 기르는 반려동물로 잘 알려져 있으며, 다양한 품종과 색상을 가지고 있습니다. 고양이는 독립적인 성격을 가지고 있으며, 뛰어난 사냥 능력과 민첩성을 자랑합니다.

고양이는 주로 육식을 하며, 작은 포유류, 새, 곤충 등을 사냥하여 먹습니다. 또한, 고양이는 사회적 동물로서 사람과의 상호작용을 즐기기도 하지만, 개보다 더 독립적인 경향이 있습니다. 고양이는 다양한 소리(예: 울음, 야옹)를 내며 의사소통을 하고, 그루밍을 통해 자신의 털을 관리합니다. 

고양이는 전 세계적으로 사랑받는 동물로, 많은 사람들에게 애완동물로 기르거나 동물원에서 관찰되는 등 다양한 형태로 존재하고 있습니다.


### 공식 리소스
- **공식 문서**: [python.langchain.com](https://python.langchain.com)