### 📌 임베딩(Embeddings) 개요
- 텍스트 → 고차원 벡터(Vector)로 변환하는 과정
- 비슷한 의미의 문장은 가까운 벡터로 매핑됨
- 활용처:
  - **RAG(Retrieval-Augmented Generation)**: 문서 검색
  - **클러스터링 / 분류**: 의미 기반 그룹화
  - **추천 시스템**: 유사 문서/콘텐츠 탐색
- OpenAI, HuggingFace, Upstage 등 다양한 임베딩 모델 지원

### 📌 OpenAIEmbeddings
- OpenAI에서 제공하는 임베딩 모델
- 대표 모델:
  - **text-embedding-3-small (1536차원, 저렴, 빠름)**
  - **text-embedding-3-large (3072차원, 더 정확)**
- 사용 예시:
  - `embed_query()` → 한 문장
  - `embed_documents()` → 여러 문서

### 📌 캐시 임베딩(CacheBackedEmbeddings)
- 같은 텍스트 → 임베딩을 다시 계산하지 않고 **캐시에 저장/재사용**
- 비용 절감 + 속도 향상
- 저장소 타입:
  - InMemoryStore (휘발성)
  - LocalFileStore (디스크)
  - Redis, DB 등 확장 가능

### 📌 HuggingFaceEmbeddings
- 로컬/오픈소스 임베딩 모델
- 대표 모델: `sentence-transformers` 계열
- 장점:
  - 인터넷 없이 실행 가능
  - 특정 언어(한국어 등)에 특화된 모델 활용 가능
- 단점:
  - OpenAI보다 정확도/성능이 낮을 수 있음

### 📌 UpstageEmbeddings
- 한국 기업 **업스테이지(Upstage)** 제공 임베딩
- 한국어 문서 처리에 강점
- 모델: `solar-embedding-1-large` 등
- 활용: 한국어 RAG, 금융/공공 데이터 처리에 적합

### 📌 OllamaEmbeddings
- **로컬에서 실행되는 Ollama LLM**을 통한 임베딩
- 특징:
  - 인터넷 없이 로컬에서 임베딩 생성
  - `nomic-embed-text`, `mxbai-embed-large` 등 지원
- 장점:
  - 프라이버시 강화
  - 서버 비용 절감
- 단점:
  - 설치 및 환경 설정 필요 (Ollama 실행 중이어야 함)

# ✅ 최종 정리
- **OpenAIEmbeddings** → 가장 범용적, 빠르고 안정적  
- **CacheBackedEmbeddings** → 비용 절감/속도 개선  
- **HuggingFaceEmbeddings** → 로컬/특화 언어 모델  
- **UpstageEmbeddings** → 한국어 특화  
- **OllamaEmbeddings** → 로컬 LLM 기반, 프라이버시 강화  