## Vector Store Retriever

### Vector Store Retriever 개요

**Vector Store Retriever**는 벡터 저장소(Vector Store)를 활용하여 사용자의 쿼리에 대한 **가장 유사한 문서를 검색**하는 도구입니다.

- 벡터 임베딩을 기반으로 코사인 유사도(Cosine Similarity), 유클리드 거리(Euclidean Distance) 등을 이용해 검색합니다.
- 단일 쿼리를 입력하면 해당 쿼리와 가장 유사한 벡터를 빠르게 찾아 연관된 문서를 반환합니다.
- **장점**: 빠른 검색 속도와 간결한 구현
- **단점**: 단일 쿼리만을 사용하므로 **다양한 관점에서의 검색이 어려울 수 있음**

In [None]:
from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.schema import Document

# 문서 리스트 생성
documents = [
    Document(page_content="LangChain은 LLM 기반 애플리케이션을 쉽게 구축할 수 있도록 지원합니다."),
    Document(page_content="벡터 저장소는 문서를 벡터화하여 빠른 검색을 가능하게 합니다."),
    Document(page_content="멀티 쿼리 검색은 한 가지 질문을 여러 방식으로 변형하여 검색 효율을 높입니다."),
    Document(page_content="LangChain은 해리슨 체이스(Harrison Chase)가 2022년 10월에 개발되었습니다."),
    Document(page_content="LangChain의 주요 기능 중 하나는 다양한 LLM 모델과의 연동입니다."),
    Document(page_content="LangChain Core 라이브러리는 기본 추상화 및 LangChain 표현 언어"),
    Document(page_content="LangChain Community 라이브러리는 서드파티 통합"),
]

# 임베딩 모델 설정
embedding_model = OpenAIEmbeddings()

# FAISS 기반 벡터 저장소 생성
vector_store = FAISS.from_documents(documents, embedding_model)

# search_kwargs의 기본값은 {"k": 4} 기본적으로 최대 4개의 문서를 검색
# 필요에 따라 k 값을 조정하여 검색 문서 개수를 변경할 수 있음
retriever = vector_store.as_retriever(search_kwargs={"k": 3})

# 검색 실행
query = "LangChain 이란?"
retrieved_docs = retriever.invoke(query)

# 검색된 문서 출력
for doc in retrieved_docs:
    print(doc.page_content)