In [1]:
# MMR 검색

벡터 데이터베이스 검색에서 similarity_search와 max_marginal_relevance_search (MMR)는 서로 다른 접근 방식을 사용하여 검색 결과를 제공합니다. 두 방법의 주요 차이점은 다음과 같습니다:

## 검색 방식의 차이

### Similarity Search

Similarity Search는 전통적인 의미론적 유사도 검색 방법입니다[1]. 이 방법은:

- 쿼리와 가장 유사한 문서들을 순서대로 반환합니다.
- 단순히 쿼리와의 유사도만을 기준으로 결과를 선택합니다.
- 결과의 다양성을 고려하지 않습니다.

### Maximum Marginal Relevance (MMR) Search

MMR 검색은 유사도와 다양성을 동시에 고려하는 더 복잡한 알고리즘입니다[1][2]. 이 방법은:

- 쿼리와의 유사성뿐만 아니라 이미 선택된 문서들과의 차별성도 고려합니다.
- 결과의 다양성을 촉진하여 중복된 정보를 줄입니다.
- 유사성과 다양성 사이의 균형을 조절할 수 있습니다.

## 작동 원리

### Similarity Search 작동 원리

1. 쿼리 벡터와 데이터베이스의 모든 문서 벡터 간의 유사도를 계산합니다.
2. 유사도가 가장 높은 순서대로 문서를 정렬합니다.
3. 상위 k개의 문서를 결과로 반환합니다.

### MMR 작동 원리

1. 초기 필터링: 쿼리와 가장 유사한 문서들을 선별합니다[1].
2. 반복 선택: 다음 수식을 사용하여 문서를 선택합니다[2][3]:

   $$ MMR = \lambda \cdot Sim(d, Q) - (1 - \lambda) \cdot \max_{d' \in S} Sim(d, d') $$

   여기서:
   - $$d$$는 후보 문서
   - $$Q$$는 쿼리
   - $$S$$는 이미 선택된 문서 집합
   - $$\lambda$$는 유사성과 다양성의 균형을 조절하는 매개변수

3. 다양성 촉진: 이미 선택된 문서와 유사한 문서에 페널티를 부여합니다[1].

## 주요 차이점

1. **결과의 다양성**: MMR은 다양한 정보를 제공하는 반면, Similarity Search는 유사한 정보를 반복할 수 있습니다[1][2].

2. **복잡성**: MMR은 더 복잡한 계산을 수행하므로 Similarity Search보다 계산 비용이 높습니다.

3. **매개변수**: MMR은 $$\lambda$$ 매개변수를 통해 유사성과 다양성의 균형을 조절할 수 있습니다[3].

4. **사용 사례**: Similarity Search는 단순히 가장 유사한 결과가 필요할 때 적합하고, MMR은 다양한 관점이나 정보가 필요한 경우에 유용합니다.

5. **결과의 품질**: MMR은 일반적으로 더 포괄적이고 다양한 정보를 제공하여 사용자 만족도를 높일 수 있습니다[1][2].

이러한 차이점을 고려할 때, 검색 요구사항과 응용 프로그램의 특성에 따라 적절한 방법을 선택해야 합니다.

Citations:
[1] https://www.restack.io/p/similarity-search-answer-similarity-vs-mmr-cat-ai
[2] https://www.restack.io/p/similarity-search-answer-langchain-mmr-cat-ai
[3] https://wikidocs.net/231585

In [2]:
texts = [
    """ChatGPT 열풍으로 인해 생성형 AI에 대한 관심이 뜨겁다. 생성형 AI는 이용자의 특정 요구에 따라 결과를 능동적으로 생성해 내는 인공지능 기술이다.""",
    """특히, 생성형 AI는 대량의 데이터(Hyper-scale Data)를 학습하여 인간의 영역이라고 할 수 있는 창작의 영역까지 넘보고 있다.""",
    """베타 버전 출시2개월 만에 MAU(월간 활성 이용자 수)가 무려 1억 명을 넘어섰다. 또한 구글, 메타 등 글로벌 빅테크 기업들이 앞다투어 천문학적인 규모의 투자와 유사 서비스 출시 계획을발표하고 있다.""",
    """이 서비스의 핵심은 서비스 이용자의 질문을 이해하고 분석하여 수많은 정보 중 답이 될 만한 필요정보를 스스로 찾아서 이를 적절히 요약과 정리해 제공하는 것이다 """,
    """특히 앞서 질문한 내용의 맥락을 잇거나 구체적인 사례를 들어 질문할수록 더 정확한 답을 얻을 수 있는데, 이는 마치 사람과 대화하는 것처럼 맥락을 이해하여 답을 제공한다는 점에서 이전과 차원이 다른 정보 검색 서비스를 체감하게 한다."""
]

In [3]:
from langchain.vectorstores import Chroma
from langchain.embeddings.openai import OpenAIEmbeddings

embedding = OpenAIEmbeddings(model="text-embedding-ada-002", openai_api_key="sk-")

  warn_deprecated(


In [5]:
from langchain.vectorstores import Chroma
import os
os.environ["GOOGLE_API_KEY"] = "AIzaSyCRNu3bAi56bwx_f34ehrBVfEZ7XuA7x7M"

# 임베딩 설정
from langchain_google_genai import GoogleGenerativeAIEmbeddings
embeddings = GoogleGenerativeAIEmbeddings(model="models/text-embedding-004")

In [7]:
smalldb = Chroma.from_texts(texts, embedding=embeddings)
question = "생성형 AI에 대해 언급된 내용은?"

In [11]:
smalldb.max_marginal_relevance_search(question,k=2, fetch_k=3) #fetch(simility search)로 3개 문서를 찾은 후에 다양성 기준으로 2개를 출력

[Document(metadata={}, page_content='ChatGPT 열풍으로 인해 생성형 AI에 대한 관심이 뜨겁다. 생성형 AI는 이용자의 특정 요구에 따라 결과를 능동적으로 생성해 내는 인공지능 기술이다.'),
 Document(metadata={}, page_content='특히, 생성형 AI는 대량의 데이터(Hyper-scale Data)를 학습하여 인간의 영역이라고 할 수 있는 창작의 영역까지 넘보고 있다.')]

In [9]:
# similarity searcha 검색 결과
question = "생성형 AI 핵심 기능은?"
docs_ss = smalldb.similarity_search(question,k=2)
print(docs_ss[0].page_content[:100])
print('\n\n', docs_ss[1].page_content[:100])



ChatGPT 열풍으로 인해 생성형 AI에 대한 관심이 뜨겁다. 생성형 AI는 이용자의 특정 요구에 따라 결과를 능동적으로 생성해 내는 인공지능 기술이다.


 특히, 생성형 AI는 대량의 데이터(Hyper-scale Data)를 학습하여 인간의 영역이라고 할 수 있는 창작의 영역까지 넘보고 있다.


In [10]:
#Maximum Marginal Relevance(MMR) 검색
docs_mmr = smalldb.max_marginal_relevance_search(question,k=2)
print(docs_mmr[0].page_content[:100])
print('\n\n',docs_mmr[1].page_content[:100])

Number of requested results 20 is greater than number of elements in index 5, updating n_results = 5


ChatGPT 열풍으로 인해 생성형 AI에 대한 관심이 뜨겁다. 생성형 AI는 이용자의 특정 요구에 따라 결과를 능동적으로 생성해 내는 인공지능 기술이다.


 특히, 생성형 AI는 대량의 데이터(Hyper-scale Data)를 학습하여 인간의 영역이라고 할 수 있는 창작의 영역까지 넘보고 있다.
