# Reciprocal-Rank-Fusion outperforms Condorcet and individual Rank Learning Methods

https://plg.uwaterloo.ca/~gvcormac/cormacksigir09-rrf.pdf


In [2]:
%pip install llama-index-llms-openai
%pip install llama-index-retrievers-bm25

Note: you may need to restart the kernel to use updated packages.
Collecting llama-index-retrievers-bm25
  Downloading llama_index_retrievers_bm25-0.4.0-py3-none-any.whl.metadata (742 bytes)
Collecting bm25s<0.3.0,>=0.2.0 (from llama-index-retrievers-bm25)
  Downloading bm25s-0.2.1-py3-none-any.whl.metadata (18 kB)
Collecting pystemmer<3.0.0.0,>=2.2.0.1 (from llama-index-retrievers-bm25)
  Downloading PyStemmer-2.2.0.1.tar.gz (303 kB)
  Installing build dependencies ... [?25ldone
[?25h  Getting requirements to build wheel ... [?25ldone
[?25h  Installing backend dependencies ... [?25ldone
[?25h  Preparing metadata (pyproject.toml) ... [?25ldone
Downloading llama_index_retrievers_bm25-0.4.0-py3-none-any.whl (3.6 kB)
Downloading bm25s-0.2.1-py3-none-any.whl (50 kB)
Building wheels for collected packages: pystemmer
  Building wheel for pystemmer (pyproject.toml) ... [?25ldone
[?25h  Created wheel for pystemmer: filename=PyStemmer-2.2.0.1-cp310-cp310-macosx_12_0_arm64.whl size=2217

In [1]:
from llama_index.core import SimpleDirectoryReader

documents = SimpleDirectoryReader("../data/").load_data()

In [3]:
from llama_index.core import VectorStoreIndex
from llama_index.core.node_parser import SentenceSplitter

splitter = SentenceSplitter(chunk_size=256)

index = VectorStoreIndex.from_documents(documents, transformations=[splitter])

In [4]:
from llama_index.retrievers.bm25 import BM25Retriever

vector_retriever = index.as_retriever(similarity_top_k=2)

bm25_retriever = BM25Retriever.from_defaults(
    docstore=index.docstore, similarity_top_k=2
)

  from .autonotebook import tqdm as notebook_tqdm


In [5]:
from llama_index.core.retrievers import QueryFusionRetriever

retriever = QueryFusionRetriever(
    [vector_retriever, bm25_retriever],
    similarity_top_k=2,
    num_queries=4,  # set this to 1 to disable query generation
    mode="reciprocal_rerank",
    use_async=True,
    verbose=True,
    # query_gen_prompt="...",  # we could override the query generation prompt here
)

In [6]:
# apply nested async to run in a notebook
import nest_asyncio

nest_asyncio.apply()

In [7]:
nodes_with_scores = retriever.retrieve(
    "Các cunh mệnh nào phù hợp với cơ nghiệp ?"
)

print(nodes_with_scores)

Generated queries:
1. Các cung mệnh phù hợp với ngành nghề nào?
2. Cách chọn cung mệnh phù hợp với công việc?
3. Cung mệnh nào thích hợp với sở thích và năng lực của mình?
[NodeWithScore(node=TextNode(id_='1ebd8ef3-2832-40f9-9896-a41f42e71390', embedding=None, metadata={'file_path': '/Users/ngocp/Documents/projects/tu-vi-bot/research/../data/cung-menh.txt', 'file_name': 'cung-menh.txt', 'file_type': 'text/plain', 'file_size': 406165, 'creation_date': '2024-10-03', 'last_modified_date': '2024-10-03'}, excluded_embed_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], excluded_llm_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='e169f7ae-7108-4a0f-86fb-bc911ad8c0ae', node_type=<ObjectType.DOCUMENT: '4'>, metadata={'file_path': '/Users/ngocp/Documents/projects/tu-vi-bot/research/../data/cu

In [8]:
for node in nodes_with_scores:
    print(f"Score: {node.score:.2f} - {node.text}...\n-----\n")


Score: 0.05 - - Cự Môn độc tọa cung Tị hoặc Hợi, vì cung quan lộc là Thiên Cơ nên khá thích hợp với các công việc về văn và lập kế hoạch.
- Cự Môn ở cung Thìn hoặc Tuất, cung quan lộc là Thái Âm; trường hợp Thái Dương ở cung Thìn là cung vượng, thích hợp làm công chức hay giảng sư; trường hợp Thái Dương ở cung Tuất thì làm công chức là bất lợi, có thể làm nghề môi giới bảo hiểm, tổ chức sự kiện, chủ trì hội trường....
-----

Score: 0.03 - thích hợp với những nghề nghiệp cần phải động khẩu, động não, có tính cạnh tranh cao độ như thầy giáo, giáo sư, luật sư, quảng bá, mở rộng thị trường, nhân viên bán hàng, văn hóa, xuất bản, hoặc mậu dịch xuất nhập khẩu, đại lí bán hàng, môi giới mua bán chuyên nghiệp, quan hệ công cộng, bảo hiểm, hướng dẫn viên du lịch nghệ thuật biểu diễn, ẩm thực, v.v. đều rất thích hợp. Nhưng Cự Môn dễ bị bài xích, cần phải tránh họa xuất phát từ cái miệng....
-----



In [9]:
from llama_index.core.query_engine import RetrieverQueryEngine

query_engine = RetrieverQueryEngine.from_args(retriever)

In [12]:
response = query_engine.query(
    "Các cunh mệnh nào phù hợp với cơ nghiệp ?"
)

print(response)

Generated queries:
1. Các cung mệnh nào phù hợp với ngành nghề kinh doanh?
2. Tìm hiểu về cung mệnh phù hợp với cơ nghiệp
3. Cách xác định cung mệnh phù hợp với lĩnh vực công việc
Các cung mệnh phù hợp với ngành nghề kinh doanh giải trí, công nghiệp nghỉ mát, du lịch, giải trí, quan hệ công cộng, nghệ thuật biểu diễn bao gồm Thiên Đồng đồng cung với Kình Dương. Các cung mệnh thích hợp với công việc về văn và lập kế hoạch bao gồm Cự Môn độc tọa cung Tị hoặc Hợi, cung Thìn hoặc Tuất với cung quan lộc là Thái Âm, và trường hợp Thái Dương ở cung Thìn hoặc Tuất.
