# LangChain과 Hugging Face

### 주요 학습 내용:
1. LangChain과 Hugging Face 통합 개념
2. Chat Models 사용법
3. LLMs (Large Language Models) 사용법


## LangChain과 Hugging Face가 무엇인가요?

### LangChain이란?
- 정의: 언어 모델을 사용하여 애플리케이션을 구축하기 위한 프레임워크
- 목적: AI 모델들을 쉽게 연결하고 복잡한 AI 워크플로우를 구축
- 특징: 모듈화된 구조로 다양한 AI 모델과 도구들을 조합 가능

### Hugging Face란?
- 정의: 오픈소스 AI 모델과 데이터셋을 제공하는 플랫폼
- 특징: 75,000개 이상의 데이터셋, 다양한 사전 훈련된 모델 제공
- 장점: 무료로 사용 가능한 고품질 AI 모델들

### 왜 둘을 함께 사용할까요?
- 풍부한 모델: Hugging Face의 다양한 모델을 LangChain에서 쉽게 사용
- 간편한 구현: 복잡한 AI 파이프라인을 간단한 코드로 구현
- 비용 효율성: 오픈소스 모델 사용으로 API 비용 절약


## 설치 및 설정

LangChain과 Hugging Face를 함께 사용하기 위해 필요한 패키지들을 설치해보겠습니다.


In [9]:
# 필요한 패키지 설치 (이미 requirements.txt에 포함되어 있음)
# !pip install langchain-huggingface langchain-community transformers datasets torch

# 필요한 라이브러리 import
import os
import warnings
warnings.filterwarnings('ignore')

In [10]:
from dotenv import load_dotenv

# .env 파일 불러오기
load_dotenv()

True

## Chat Models - ChatHuggingFace
Chat Models는 대화형 AI 모델로, 사용자와 자연스러운 대화를 나눌 수 있습니다.

### 특징
- 대화형 인터페이스: 질문-답변 형태의 상호작용
- 문맥 이해: 이전 대화 내용을 기억하고 활용
- 다양한 모델 지원: Hugging Face의 다양한 대화 모델 사용 가능


In [11]:
from langchain_huggingface import ChatHuggingFace, HuggingFacePipeline
from langchain.schema import HumanMessage, SystemMessage


# 1. 로컬 모델을 사용한 ChatHuggingFace 설정
try:
    repo_id = 'beomi/llama-2-ko-7b'
    # 가벼운 모델로 파이프라인 생성 (로컬에서 실행 가능)
    llm = HuggingFacePipeline.from_model_id(
        model_id=repo_id, #"microsoft/DialoGPT-medium",  # 대화형 모델
        task="text-generation",
        device=-1,  # CPU 사용 (GPU가 없는 경우)
        model_kwargs={
            "temperature": 0.7,
            "max_length": 200,
            "do_sample": True
        }
    )
    
    # ChatHuggingFace 래퍼로 감싸기
    chat_model = ChatHuggingFace(llm=llm)
    
    print("모델이 성공적으로 로드되었습니다!")
    
except Exception as e:
    print(f"모델 로드 중 오류가 발생했습니다: {e}")

tokenizer_config.json:   0%|          | 0.00/842 [00:00<?, ?B/s]

tokenizer.json: 0.00B [00:00, ?B/s]

special_tokens_map.json:   0%|          | 0.00/414 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/606 [00:00<?, ?B/s]

model.safetensors.index.json: 0.00B [00:00, ?B/s]

Fetching 15 files:   0%|          | 0/15 [00:00<?, ?it/s]

model-00001-of-00015.safetensors:   0%|          | 0.00/919M [00:00<?, ?B/s]

model-00002-of-00015.safetensors:   0%|          | 0.00/990M [00:00<?, ?B/s]

model-00004-of-00015.safetensors:   0%|          | 0.00/967M [00:00<?, ?B/s]

model-00003-of-00015.safetensors:   0%|          | 0.00/967M [00:00<?, ?B/s]

model-00005-of-00015.safetensors:   0%|          | 0.00/990M [00:00<?, ?B/s]

model-00008-of-00015.safetensors:   0%|          | 0.00/967M [00:00<?, ?B/s]

model-00007-of-00015.safetensors:   0%|          | 0.00/990M [00:00<?, ?B/s]

model-00006-of-00015.safetensors:   0%|          | 0.00/944M [00:00<?, ?B/s]

Cancellation requested; stopping current tasks.


KeyboardInterrupt: 

In [None]:
# 2. 대화 예제 실행
messages = [
    SystemMessage(content="당신은 친근하고 도움이 되는 AI 어시스턴트입니다."),
    HumanMessage(content="안녕하세요! 파이썬 공부에 대한 조언을 해주세요.")
]

response = chat_model.invoke(messages)
print(response.content if hasattr(response, 'content') else response)


## LLMs (Large Language Models)
LLM은 대규모 언어 모델로, 텍스트 생성, 요약, 번역 등 다양한 언어 작업을 수행할 수 있습니다.

### 두 가지 주요 방법:
1. `HuggingFaceEndpoint`: 서버리스 추론 API 사용 (클라우드)
2. `HuggingFacePipeline`: 로컬에서 모델 실행

### 각 방법의 장단점:

| 구분 | HuggingFaceEndpoint | HuggingFacePipeline |
|------|-------------------|-------------------|
| **장점** | - 서버 관리 불필요<br>- 확장성 좋음<br>- 최신 모델 사용 | - 비용 무료<br>- 데이터 보안<br>- 오프라인 사용 가능 |
| **단점** | - API 비용 발생<br>- 인터넷 필요 | - 로컬 리소스 필요<br>- 모델 다운로드 시간 |


In [None]:
from langchain_huggingface import HuggingFaceEndpoint

# 참고: 실제 사용시에는 Hugging Face API 토큰이 필요합니다
# os.environ["HUGGINGFACEHUB_API_TOKEN"] = "your-api-token-here"

try:
    repo_id = 'beomi/llama-2-ko-7b'
    # 서버리스 추론 API를 통한 모델 사용
    endpoint_llm = HuggingFaceEndpoint(
        repo_id=repo_id, #"huggingfaceh4/zephyr-7b-beta",  # 인기 있는 대화형 모델
        temperature=0.7,
        max_length=100
    )
    
    # 텍스트 생성 예제
    prompt = "인공지능의 미래에 대해 설명해주세요:"
    response = endpoint_llm.invoke(prompt)
    
    print(f"프롬프트: {prompt}")
    print(f"응답: {response}")
    
except Exception as e:
    print("API 토큰이 필요하거나 네트워크 오류가 발생했습니다.")


In [None]:
from langchain_huggingface import HuggingFacePipeline

try:
    repo_id = 'beomi/llama-2-ko-7b'
    # 로컬에서 실행 가능한 가벼운 모델 사용
    local_llm = HuggingFacePipeline.from_model_id(
        model_id=repo_id,  # 가벼운 GPT-2 모델
        task="text-generation",
        device=-1,  # CPU 사용
        model_kwargs={
            "temperature": 0.8,
            "max_length": 100,
            "do_sample": True,
            "pad_token_id": 50256  # GPT-2의 EOS 토큰
        }
    )
    
    print("로컬 모델이 성공적으로 로드되었습니다!")
    
    # 텍스트 생성 예제
    prompt = "Machine learning is"
    response = local_llm.invoke(prompt)
    
    print(f"프롬프트: {prompt}")
    print(f"응답: {response}")
    
except Exception as e:
    print(f"모델 로드 중 오류: {e}")