# Settings

In [2]:
import weaviate
from pyvi import ViTokenizer
from llama_index.core import VectorStoreIndex
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
from llama_index.core.response.notebook_utils import display_source_node
from CustomClass.CustomWeaviateVectorStore import CustomWeaviateVectorStore
from llama_index.vector_stores.postgres import PGVectorStore

WEAVIATE_URL = "http://localhost:9090"
DATA_COLLECTION = "LawVectorDB"
DEVICE = "cuda:0"
embed_model = HuggingFaceEmbedding(model_name="qducnguyen/vietnamese-bi-encoder", 
                                   max_length=256,
                                   device=DEVICE)

ModuleNotFoundError: No module named 'llama_index.vector_stores.weaviate'

# Getting work done

In [2]:
# load from disk
client = weaviate.Client(WEAVIATE_URL)

vector_store = CustomWeaviateVectorStore(weaviate_client=client, index_name=DATA_COLLECTION)

index = VectorStoreIndex.from_vector_store(
    vector_store,
    embed_model=embed_model,
)

            Please consider upgrading to the latest version. See https://weaviate.io/developers/weaviate/client-libraries/python for details.


In [3]:
## Test each type of retrieval
                                    
# base_retriever = index.as_retriever(similarity_top_k=100,
#                                     vector_store_query_mode="default")

# base_retriever = index.as_retriever(similarity_top_k=100,
#                                     vector_store_query_mode="sparse")


base_retriever = index.as_retriever(similarity_top_k=100,
                                    vector_store_query_mode="hybrid",
                                    alpha=0.5)

TEST_QUESTION = "Mình đi xe máy không đội mũ bảo hiểm bị phạt bao nhiêu tiền?".lower()
# TEST_QUESTION = "Xin chào".lower()
# TEST_QUESTION = "Làm thế nào để xử lý việc mất sổ đỏ? ".lower()


retrievals = base_retriever.retrieve(
    ViTokenizer.tokenize(TEST_QUESTION)
)

for n in retrievals[:5]:
    display_source_node(n, source_length=1000)

**Node ID:** 4cd7ef9f-4085-4e9c-82c8-ddc7de961050<br>**Similarity:** 0.984611742<br>**Text:** b ) phạt tiền đến 15.000.000 đồng đối_với hành_vi vi_phạm trong lĩnh_vực giao_thông đường_bộ , đường_sắt ; b ) phạt tiền đến 75.000.000 đồng đối_với hành_vi vi_phạm trong lĩnh_vực giao_thông đường_bộ , đường_sắt ; 
 o ) chở người ngồi trên xe không đội “ mũ bảo_hiểm cho người đi mô_tô , xe_máy ” hoặc đội “ mũ bảo_hiểm cho người đi mô_tô , xe_máy ” không cài quai đúng quy_cách , trừ trường_hợp chở người_bệnh đi cấp_cứu , trẻ_em dưới 06 tuổi , áp_giải người có hành_vi vi_phạm_pháp_luật . ” ; 
 c ) sửa_đổi khoản 5 điều 6 như sau : “ 5 . phạt tiền từ 1.000.000 đồng đến 2.000.000 đồng đối_với người điều_khiển xe thực_hiện một trong các hành_vi vi_phạm sau đây : c ) điều_khiển xe ô_tô tải ( kể_cả rơ_moóc và sơ_mi rơ_moóc ) có kích_thước thùng_xe không đúng với thông_số kỹ_thuật được ghi trong giấy chứng_nhận kiểm_định an_toàn kỹ_thuật và bảo_vệ môi_trường của xe ; c ) thực_hiện_hành_vi quy_định tại điểm a khoản 3 điều này bị tịch_thu giấy_phép lưu_hành đã hết giá_trị sử_dụng hoặc không do...<br>

**Node ID:** aa931d77-6922-472c-aae7-3010d9bdb892<br>**Similarity:** 0.984953964<br>**Text:** 2 . người điều_khiển , người ngồi trên xe mô_tô , xe gắn_máy ( kể_cả xe_máy_điện ) , xe_đạp máy khi tham_gia giao_thông vi_phạm_quy_định về đội mũ bảo_hiểm thì bị xử_phạt vi_phạm hành_chính theo quy_định của chính_phủ về xử_phạt vi_phạm hành_chính trong lĩnh_vực giao_thông đường_bộ .<br>

**Node ID:** d794f7a7-1fe2-4207-964d-c58a0a3ea032<br>**Similarity:** 0.985021238<br>**Text:** điều 8 . trách_nhiệm của người điều_khiển , người ngồi trên xe mô_tô , xe gắn_máy , xe_đạp máy . người điều_khiển , người ngồi trên xe mô_tô , xe gắn_máy ( kể_cả xe_máy_điện ) , xe_đạp máy khi tham_gia giao_thông có trách_nhiệm : 
 1 . đội mũ bảo_hiểm theo đúng quy_định của pháp_luật . 
 2 . cài quai mũ theo quy_định sau đây : 
 a ) kéo quai mũ bảo_hiểm sang hai bên rồi đội mũ và đóng khóa mũ lại . không được để quai mũ lỏng_lẻo mà phải đóng khít với cằm ; 
 b ) sau khi đội mũ bảo_hiểm cần kiểm_tra lại bằng cách : dùng tay kéo mũ từ đằng sau ra đằng trước hoặc nâng phần trên trước trán ( hoặc phần_cằm đối_với mũ cả hàm ) lên rồi kéo ra đằng sau , mũ không được bật ra khỏi đầu .<br>

**Node ID:** 28576e60-d87f-444e-9ba9-e0229074a655<br>**Similarity:** 0.985224332<br>**Text:** 4 . phạt tiền từ 100.000 đồng đến 200.000 đồng đối_với một trong các hành_vi vi_phạm sau đây : 
 a ) điều_khiển xe lạng_lách , đánh_võng ; đuổi nhau trên đường ; 
 b ) đi xe bằng một bánh đối_với xe_đạp , xe_đạp máy ; đi xe bằng hai bánh đối_với xe xích_lô ; 
 c ) gây tai_nạn giao_thông không dừng lại , không giữ nguyên hiện_trường , bỏ trốn không đến trình_báo với cơ_quan có thẩm_quyền , không tham_gia cấp_cứu người bị nạn ; 
 d ) người điều_khiển , người ngồi trên xe_đạp máy không đội “ mũ bảo_hiểm cho người đi mô_tô , xe_máy ” hoặc đội “ mũ bảo_hiểm cho người đi mô_tô , xe_máy ” không cài quai đúng quy_cách khi tham_gia giao_thông trên đường_bộ ; 
 đ ) chở người ngồi trên xe_đạp máy không đội “ mũ bảo_hiểm cho người đi mô_tô , xe_máy ” hoặc đội “ mũ bảo_hiểm cho người đi mô_tô , xe_máy ” không cài quai đúng quy_cách , trừ trường_hợp chở người_bệnh đi cấp_cứu , trẻ_em dưới 06 tuổi , áp_giải người có hành_vi vi_phạm<br>

**Node ID:** f2b585d8-1623-4ff0-a824-8f4e62de8ad5<br>**Similarity:** 0.985858386<br>**Text:** trên phần đường dành cho người đi bộ qua đường ; dừng xe nơi có biển “ cấm dừng xe và đỗ xe ” ; đỗ xe tại nơi có biển “ cấm đỗ xe ” hoặc biển “ cấm dừng xe và đỗ xe ” ; không tuân_thủ các quy_định về dừng xe , đỗ xe tại nơi đường_bộ giao nhau cùng mức với đường_sắt ; dừng xe , đỗ xe trong phạm_vi an_toàn của đường_sắt , trừ hành_vi vi_phạm_quy_định tại điểm b khoản 2 , điểm b khoản 3 điều 49 nghị_định này ; 
 i ) không đội “ mũ bảo_hiểm cho người đi mô_tô , xe_máy ” hoặc đội “ mũ bảo_hiểm cho người đi mô_tô , xe_máy ” không cài quai đúng quy_cách khi điều_khiển xe tham_gia giao_thông trên đường_bộ ; 
 k ) chở người ngồi trên xe không đội “ mũ bảo_hiểm cho người đi mô_tô , xe_máy ” hoặc đội “ mũ bảo_hiểm cho người đi mô_tô , xe_máy ” không cài quai đúng quy_cách , trừ trường_hợp chở người_bệnh đi cấp_cứu , trẻ_em dưới 06 tuổi ,<br>

: 

In [22]:
retrievals

[NodeWithScore(node=TextNode(id_='3ad46600-7e02-48a1-b57e-035f7a0af811', embedding=[-0.0764819, -0.007540169, -0.0065454342, -0.0068601593, 0.03629884, -0.0014083547, 0.0029011783, 0.03672687, -0.028731102, 0.0009378981, -0.006136614, 0.04952909, -0.0045745075, 0.025263285, -0.0013612926, 0.011342022, -0.005877061, 0.015702402, -0.03993083, 0.025391066, 0.03775596, -0.071796365, -0.0043594404, 0.015094202, -0.017509455, 0.0056359214, -0.004502792, 0.053848602, 0.018207563, -0.03814217, -0.030926272, -0.022005772, 0.04167089, 0.043524254, -0.03523226, -0.00710921, 0.054618113, -0.05690352, 0.0035038032, 0.01683564, -0.006250196, -0.0055173934, -0.012452498, 0.016841237, -0.025307536, 0.049508642, -0.032998342, -0.0029002014, 0.031888213, 0.007563096, -0.024477344, -0.021469722, -0.039590664, -0.015221432, 0.037427016, -0.027118092, 0.07819661, -0.009734237, 0.036988102, -0.012190568, -0.008002259, 0.0683557, 0.01118136, 0.012640932, -0.02447866, -0.0039581177, 0.03478017, -0.032950085, 

In [23]:
retrievals[0]

NodeWithScore(node=TextNode(id_='3ad46600-7e02-48a1-b57e-035f7a0af811', embedding=[-0.0764819, -0.007540169, -0.0065454342, -0.0068601593, 0.03629884, -0.0014083547, 0.0029011783, 0.03672687, -0.028731102, 0.0009378981, -0.006136614, 0.04952909, -0.0045745075, 0.025263285, -0.0013612926, 0.011342022, -0.005877061, 0.015702402, -0.03993083, 0.025391066, 0.03775596, -0.071796365, -0.0043594404, 0.015094202, -0.017509455, 0.0056359214, -0.004502792, 0.053848602, 0.018207563, -0.03814217, -0.030926272, -0.022005772, 0.04167089, 0.043524254, -0.03523226, -0.00710921, 0.054618113, -0.05690352, 0.0035038032, 0.01683564, -0.006250196, -0.0055173934, -0.012452498, 0.016841237, -0.025307536, 0.049508642, -0.032998342, -0.0029002014, 0.031888213, 0.007563096, -0.024477344, -0.021469722, -0.039590664, -0.015221432, 0.037427016, -0.027118092, 0.07819661, -0.009734237, 0.036988102, -0.012190568, -0.008002259, 0.0683557, 0.01118136, 0.012640932, -0.02447866, -0.0039581177, 0.03478017, -0.032950085, -

In [24]:
# Custom fusion 
import numpy as np
from llama_index.core.retrievers import BaseRetriever


class HybridRetriever(BaseRetriever):
    def __init__(self, index, top_k, retrieval_top_k):
        self.top_k = top_k
        self.retrieval_top_k = retrieval_top_k
        self.dense_retrieval = index.as_retriever(similarity_top_k=self.top_k,
                                                  vector_store_query_mode="default")
        
        self.bm25_retrieval = index.as_retriever(similarity_top_k=self.top_k,
                                                 vector_store_query_mode="sparse")
        super().__init__()

    def _retrieve(self, query, **kwargs):
        """
        query should be segmented and refined
        """
        vector_nodes = self.dense_retrieval.retrieve(query, **kwargs)
        bm25_nodes = self.bm25_retrieval.retrieve(query, **kwargs)

        # Reciprocal Rerank Fusion Retriever
        # Dictionary: node_id --> NodeWithScore + metadata 
        # Sort values based on score values of dictionary 
        all_nodes_dict = {}
        for idx, n in enumerate(vector_nodes):
            n.metadata["dense_rank"] = float(idx + 1)
            n.metadata["dense_score"] = n.score
            # 1 / rank
            n.score = 1  / (n.metadata["dense_rank"] + 60)
            # dictionary 
            all_nodes_dict[n.node_id] = n
            n.metadata["bm25_rank"] = np.inf
            n.metadata["bm25_score"] = 0.0

        ## All nodes in BM25 are in dict now 
        for idx, n in enumerate(bm25_nodes):
            node_id = n.node_id
            if node_id in all_nodes_dict:
                refer_node = all_nodes_dict[node_id]
            else:
                all_nodes_dict[node_id] = n
                refer_node = n
                refer_node.metadata["dense_rank"] = np.inf
                refer_node.metadata["dense_score"] = 0.0
                refer_node.score = 0.0

            refer_node.metadata["bm25_rank"] = float(idx + 1)
            refer_node.metadata["bm25_score"] = n.score

            # 1 / rank
            refer_node.score = refer_node.score + 1 / (refer_node.metadata["bm25_rank"] + 60)

        ## Return list of sorted nodes based on score 
        all_nodes = sorted(all_nodes_dict.values(), key = lambda x: -x.score)
        
        return all_nodes[:self.retrieval_top_k]


In [29]:
hybrid_retriever = HybridRetriever(index, top_k=100, retrieval_top_k=20)

TEST_QUESTION = "Phạt tiền bao nhiêu khi đi xe máy mà không đội mũ bảo hiểm?"
hybrid_retrievals = hybrid_retriever.retrieve(
    ViTokenizer.tokenize(TEST_QUESTION.lower()))

for n in hybrid_retrievals[:5]:
    display_source_node(n, source_length=1000, show_source_metadata=True)

**Node ID:** 3ad46600-7e02-48a1-b57e-035f7a0af811<br>**Similarity:** 0.032018442622950824<br>**Text:** 3 . phạt tiền từ 200.000 đồng đến 300.000 đồng đối_với người điều_khiển xe thực_hiện một trong các hành_vi vi_phạm sau đây : 
 a ) điều_khiển xe lạng_lách , đánh_võng ; đuổi nhau trên đường ; 
 b ) đi xe bằng một bánh đối_với xe_đạp , xe_đạp máy ; đi xe bằng hai bánh đối_với xe xích_lô ; 
 c ) đi vào khu_vực cấm ; đường có biển_báo_hiệu nội_dung cấm đi vào đối_với loại phương_tiện đang điều_khiển ; đi ngược chiều đường của đường một_chiều , đường có biển “ cấm đi ngược chiều ” ; 
 d ) người điều_khiển xe_đạp máy ( kể_cả xe_đạp điện ) không đội “ mũ bảo_hiểm cho người đi mô_tô , xe_máy ” hoặc đội “ mũ bảo_hiểm cho người đi mô_tô , xe_máy ” không cài quai đúng quy_cách khi tham_gia giao_thông trên đường_bộ ; 
 đ ) chở người ngồi trên xe_đạp máy ( kể_cả xe_đạp điện ) không đội “ mũ bảo_hiểm cho người đi mô_tô , xe_máy ” hoặc đội “ mũ bảo_hiểm cho người đi mô_tô , xe_máy ” không cài quai đúng quy_cách , trừ trường_hợp chở người_bệnh đi cấp_cứu , trẻ_em dưới 06 tuổi , áp_giải người có hà...<br>**Metadata:** {'filename': 'Nghị_định_100_2019_NĐ-CP_quy_định_về_xử_phạt_vi_ph.json', 'source': '100/2019/NĐ-CP, Chương II, Điều 8, Khoản 3', 'len_tokenizer': 249, 'full_text': '3. Phạt tiền từ 200.000 đồng đến 300.000 đồng đối với người điều khiển xe thực hiện một trong các hành vi vi phạm sau đây:\n\ta) Điều khiển xe lạng lách, đánh võng; đuổi nhau trên đường;\n\tb) Đi xe bằng một bánh đối với xe đạp, xe đạp máy; đi xe bằng hai bánh đối với xe xích lô;\n\tc) Đi vào khu vực cấm; đường có biển báo hiệu nội dung cấm đi vào đối với loại phương tiện đang điều khiển; đi ngược chiều đường của đường một chiều, đường có biển “Cấm đi ngược chiều”;\n\td) Người điều khiển xe đạp máy (kể cả xe đạp điện) không đội “mũ bảo hiểm cho người đi mô tô, xe máy” hoặc đội “mũ bảo hiểm cho người đi mô tô, xe máy” không cài quai đúng quy cách khi tham gia giao thông trên đường bộ;\n\tđ) Chở người ngồi trên xe đạp máy (kể cả xe đạp điện) không đội “mũ bảo hiểm cho người đi mô tô, xe máy” hoặc đội “mũ bảo hiểm cho người đi mô tô, xe máy” không cài quai đúng quy cách, trừ trường hợp chở người bệnh đi cấp cứu, trẻ em dưới 06 tuổi, áp giải người có hành vi vi phạm pháp luật;\n\te) Điều khiển xe trên đường mà trong máu hoặc hơi thở có nồng độ cồn vượt quá 50 miligam đến 80 miligam/100 mililít máu hoặc vượt quá 0,25 miligam đến 0,4 miligam/1 lít khí thở.', 'dense_rank': 4.0, 'dense_score': 0.60734212, 'bm25_rank': 1.0, 'bm25_score': 22.406425}<br>

**Node ID:** 16dbdeae-89dc-4af5-ba0f-c18dcc2edf3f<br>**Similarity:** 0.03128054740957967<br>**Text:** điều 8 . trách_nhiệm của người điều_khiển , người ngồi trên xe mô_tô , xe gắn_máy , xe_đạp máy . người điều_khiển , người ngồi trên xe mô_tô , xe gắn_máy ( kể_cả xe_máy_điện ) , xe_đạp máy khi tham_gia giao_thông có trách_nhiệm : 
 1 . đội mũ bảo_hiểm theo đúng quy_định của pháp_luật . 
 2 . cài quai mũ theo quy_định sau đây : 
 a ) kéo quai mũ bảo_hiểm sang hai bên rồi đội mũ và đóng khóa mũ lại . không được để quai mũ lỏng_lẻo mà phải đóng khít với cằm ; 
 b ) sau khi đội mũ bảo_hiểm cần kiểm_tra lại bằng cách : dùng tay kéo mũ từ đằng sau ra đằng trước hoặc nâng phần trên trước trán ( hoặc phần_cằm đối_với mũ cả hàm ) lên rồi kéo ra đằng sau , mũ không được bật ra khỏi đầu .<br>**Metadata:** {'filename': 'Thông_tư_liên_tịch_06_2013_TTLT-BKHCN-BCT-BCA-BGTV.json', 'source': '06/2013/TTLT-BKHCN-BCT-BCA-BGTVT, Chương 2, Điều 8', 'len_tokenizer': 154, 'full_text': 'Điều 8. Trách nhiệm của người điều khiển, người ngồi trên xe mô tô, xe gắn máy, xe đạp máy. Người điều khiển, người ngồi trên xe mô tô, xe gắn máy (kể cả xe máy điện), xe đạp máy khi tham gia giao thông có trách nhiệm:\n1. Đội mũ bảo hiểm theo đúng quy định của pháp luật.\n2. Cài quai mũ theo quy định sau đây:\n\ta) Kéo quai mũ bảo hiểm sang hai bên rồi đội mũ và đóng khóa mũ lại. Không được để quai mũ lỏng lẻo mà phải đóng khít với cằm;\n\tb) Sau khi đội mũ bảo hiểm cần kiểm tra lại bằng cách: dùng tay kéo mũ từ đằng sau ra đằng trước hoặc nâng phần trên trước trán (hoặc phần cằm đối với mũ cả hàm) lên rồi kéo ra đằng sau, mũ không được bật ra khỏi đầu.', 'dense_rank': 2.0, 'dense_score': 0.6843717, 'bm25_rank': 6.0, 'bm25_score': 19.046532}<br>

**Node ID:** e01e576d-7032-475b-8ec6-c0fcb579c9bf<br>**Similarity:** 0.03076923076923077<br>**Text:** điều 11 . xử_phạt các hành_vi vi_phạm khác về quy_tắc giao_thông đường_bộ 
 1 . phạt tiền từ 80.000 đồng đến 100.000 đồng đối_với người được chở trên xe_đạp , xe_đạp máy sử_dụng ô ( dù ) . 
 2 . phạt tiền từ 100.000 đồng đến 200.000 đồng đối_với cá_nhân thực_hiện một trong các hành_vi vi_phạm sau đây : 
 a ) tập_trung đông người trái_phép , nằm , ngồi trên đường_bộ gây cản_trở giao_thông ; 
 b ) đá bóng , đá cầu , chơi cầu_lông hoặc các hoạt_động thể_thao khác trái_phép trên đường_bộ ; sử_dụng bàn trượt , pa - tanh , các thiết_bị tương_tự trên phần đường xe chạy ; 
 c ) người được chở trên xe mô_tô , xe gắn_máy ( kể_cả xe_máy_điện ) , các loại xe tương_tự xe mô_tô và các loại xe tương_tự xe gắn_máy sử_dụng ô ( dù ) ; 
 d ) người được chở trên xe_đạp , xe_đạp máy bám , kéo , đẩy xe khác , vật khác , mang vác vật cồng_kềnh . 
 3 . phạt tiền từ 200.000 đồng đến 300.000 đồng đối_với người được chở trên xe mô_tô , xe gắn_máy ( kể_cả xe_máy_điện ) , các loại xe tương_tự xe mô_tô , các loạ...<br>**Metadata:** {'filename': 'Nghị_định_100_2019_NĐ-CP_quy_định_về_xử_phạt_vi_ph.json', 'source': '100/2019/NĐ-CP, Chương II, Điều 11', 'len_tokenizer': 803, 'full_text': 'Điều 11. Xử phạt các hành vi vi phạm khác về quy tắc giao thông đường bộ\n1. Phạt tiền từ 80.000 đồng đến 100.000 đồng đối với người được chở trên xe đạp, xe đạp máy sử dụng ô (dù).\n2. Phạt tiền từ 100.000 đồng đến 200.000 đồng đối với cá nhân thực hiện một trong các hành vi vi phạm sau đây:\n\ta) Tập trung đông người trái phép, nằm, ngồi trên đường bộ gây cản trở giao thông;\n\tb) Đá bóng, đá cầu, chơi cầu lông hoặc các hoạt động thể thao khác trái phép trên đường bộ; sử dụng bàn trượt, pa-tanh, các thiết bị tương tự trên phần đường xe chạy;\n\tc) Người được chở trên xe mô tô, xe gắn máy (kể cả xe máy điện), các loại xe tương tự xe mô tô và các loại xe tương tự xe gắn máy sử dụng ô (dù);\n\td) Người được chở trên xe đạp, xe đạp máy bám, kéo, đẩy xe khác, vật khác, mang vác vật cồng kềnh.\n3. Phạt tiền từ 200.000 đồng đến 300.000 đồng đối với người được chở trên xe mô tô, xe gắn máy (kể cả xe máy điện), các loại xe tương tự xe mô tô, các loại xe tương tự xe gắn máy, xe đạp máy (kể cả xe đạp điện) không đội “mũ bảo hiểm cho người đi mô tô, xe máy” hoặc đội “mũ bảo hiểm cho người đi mô tô, xe máy” không cài quai đúng quy cách khi tham gia giao thông trên đường bộ.\n4. Phạt tiền từ 200.000 đồng đến 400.000 đồng đối với cá nhân, từ 400.000 đồng đến 800.000 đồng đối với tổ chức để vật che khuất biển báo, đèn tín hiệu giao thông.\n5. Phạt tiền từ 300.000 đồng đến 500.000 đồng đối với người được chở trên xe ô tô không thắt dây an toàn (tại vị trí có trang bị dây an toàn) khi xe đang chạy.\n6. Phạt tiền từ 400.000 đồng đến 600.000 đồng đối với người được chở trên xe mô tô, xe gắn máy (kể cả xe máy điện), các loại xe tương tự xe mô tô, các loại xe tương tự xe gắn máy bám, kéo, đẩy xe khác, vật khác, dẫn dắt súc vật, mang vác vật cồng kềnh, đứng trên yên, giá đèo hàng hoặc ngồi trên tay lái.\n7. Phạt tiền từ', 'dense_rank': 5.0, 'dense_score': 0.58399022, 'bm25_rank': 5.0, 'bm25_score': 20.045578}<br>

**Node ID:** 1b54a24f-896a-4786-988f-bb76239db7e7<br>**Similarity:** 0.03009207275993712<br>**Text:** 2 . người điều_khiển , người ngồi trên xe mô_tô , xe gắn_máy ( kể_cả xe_máy_điện ) , xe_đạp máy khi tham_gia giao_thông vi_phạm_quy_định về đội mũ bảo_hiểm thì bị xử_phạt vi_phạm hành_chính theo quy_định của chính_phủ về xử_phạt vi_phạm hành_chính trong lĩnh_vực giao_thông đường_bộ .<br>**Metadata:** {'filename': 'Thông_tư_liên_tịch_06_2013_TTLT-BKHCN-BCT-BCA-BGTV.json', 'source': '06/2013/TTLT-BKHCN-BCT-BCA-BGTVT, Chương 2, Điều 10, Khoản 2', 'len_tokenizer': 52, 'full_text': '2. Người điều khiển, người ngồi trên xe mô tô, xe gắn máy (kể cả xe máy điện), xe đạp máy khi tham gia giao thông vi phạm quy định về đội mũ bảo hiểm thì bị xử phạt vi phạm hành chính theo quy định của Chính phủ về xử phạt vi phạm hành chính trong lĩnh vực giao thông đường bộ.', 'dense_rank': 1.0, 'dense_score': 0.77383465, 'bm25_rank': 13.0, 'bm25_score': 16.08769}<br>

**Node ID:** 2d8395ce-0934-452e-bd06-38243fa3059c<br>**Similarity:** 0.03007688828584351<br>**Text:** đường_bộ ; b ) không nhường đường hoặc gây cản_trở xe được quyền ưu_tiên đang phát tín_hiệu ưu_tiên đi làm nhiệm_vụ . ” ; b ) điều_khiển xe ( kể_cả rơ_moóc và sơ_mi rơ_moóc ) không gắn biển số ( đối_với loại xe có quy_định phải gắn biển số ) ; b ) người điều_khiển xe ô_tô , máy_kéo và các loại xe tương_tự xe ô_tô không có hoặc không mang theo giấy chứng_nhận bảo_hiểm trách_nhiệm dân_sự của chủ xe cơ_giới còn hiệu_lực . b ) thực_hiện_hành_vi quy_định tại khoản 2 , khoản 3 điều này bị tước quyền sử_dụng giấy_phép lái_xe từ 02 tháng đến 04 tháng ; b ) điều_khiển xe có giấy_phép lưu_hành còn giá_trị sử_dụng nhưng tổng trọng_lượng ( khối_lượng toàn_bộ ) của xe hoặc tải_trọng trục xe ( bao_gồm cả hàng_hóa xếp trên xe nếu có ) vượt quá quy_định trong giấy_phép lưu_hành ; b ) lưu_hành phương_tiện trên lãnh_thổ việt nam quá thời_hạn quy_định dưới 30 ngày . b ) phạt tiền đến 15.000.000 đồng đối_với hành_vi vi_phạm trong lĩnh_vực giao_thông đường_bộ , đường_sắt ; b ) phạt tiền đến 75.000.000 đ...<br>**Metadata:** {'filename': 'Nghị_định_123_2021_NĐ-CP_sửa_đổi_các_Nghị_định_quy.json', 'source': '123/2021/NĐ-CP, Điều 2', 'len_tokenizer': 16663, 'full_text': 'đường bộ; b) Không nhường đường hoặc gây cản trở xe được quyền ưu tiên đang phát tín hiệu ưu tiên đi làm nhiệm vụ.”; b) Điều khiển xe (kể cả rơ moóc và sơ mi rơ moóc) không gắn biển số (đối với loại xe có quy định phải gắn biển số); b) Người điều khiển xe ô tô, máy kéo và các loại xe tương tự xe ô tô không có hoặc không mang theo Giấy chứng nhận bảo hiểm trách nhiệm dân sự của chủ xe cơ giới còn hiệu lực. b) Thực hiện hành vi quy định tại khoản 2, khoản 3 Điều này bị tước quyền sử dụng Giấy phép lái xe từ 02 tháng đến 04 tháng; b) Điều khiển xe có Giấy phép lưu hành còn giá trị sử dụng nhưng tổng trọng lượng (khối lượng toàn bộ) của xe hoặc tải trọng trục xe (bao gồm cả hàng hóa xếp trên xe nếu có) vượt quá quy định trong Giấy phép lưu hành; b) Lưu hành phương tiện trên lãnh thổ Việt Nam quá thời hạn quy định dưới 30 ngày. b) Phạt tiền đến 15.000.000 đồng đối với hành vi vi phạm trong lĩnh vực giao thông đường bộ, đường sắt; b) Phạt tiền đến 75.000.000 đồng đối với hành vi vi phạm trong lĩnh vực giao thông đường bộ, đường sắt;\n\to) Chở người ngồi trên xe không đội “mũ bảo hiểm cho người đi mô tô, xe máy” hoặc đội “mũ bảo hiểm cho người đi mô tô, xe máy” không cài quai đúng quy cách, trừ trường hợp chở người bệnh đi cấp cứu, trẻ em dưới 06 tuổi, áp giải người có hành vi vi phạm pháp luật.”;\n\tc) Sửa đổi khoản 5 Điều 6 như sau: “5. Phạt tiền từ 1.000.000 đồng đến 2.000.000 đồng đối với người điều khiển xe thực hiện một trong các hành vi vi phạm sau đây: c) Điều khiển xe ô tô tải (kể cả rơ moóc và sơ mi rơ moóc) có kích thước thùng xe không đúng với thông số kỹ thuật được ghi trong Giấy chứng nhận kiểm định an toàn kỹ thuật và bảo vệ môi trường của xe; c) Thực hiện hành vi quy định tại điểm a khoản 3 Điều này bị tịch thu Giấy phép lưu hành đã hết giá trị sử dụng hoặc không do cơ quan có thẩm quyền cấp.', 'dense_rank': 6.0, 'dense_score': 0.57553047, 'bm25_rank': 7.0, 'bm25_score': 18.522463}<br>

In [26]:
from CustomClass.SentenceTransformerRerank import SentenceTransformerRerank
from llama_index.core import QueryBundle


reranker = SentenceTransformerRerank(top_n=3, 
                                     model="bkai-foundation-models/vietnamese-cross-encoder",
                                     device=DEVICE,
                                     keep_retrieval_score=True)

In [7]:
final_retrieval = reranker.postprocess_nodes(hybrid_retrievals, 
                                             query_bundle=QueryBundle(ViTokenizer.tokenize(TEST_QUESTION.lower())))

for n in final_retrieval:
    display_source_node(n, source_length=1000, metadata_mode=True)

**Node ID:** f0b356b6-10d2-4085-b420-9e03d848e483<br>**Similarity:** 0.9996602535247803<br>**Text:** điều 31 . người lái_xe , người ngồi trên xe mô_tô , xe gắn_máy , các loại xe tương_tự xe mô_tô , xe gắn_máy 
 1 . người lái_xe mô_tô hai bánh , xe gắn_máy , các loại xe tương_tự xe mô_tô , xe gắn_máy chỉ được chở một người , trừ những trường_hợp sau thì được chở tối_đa hai người : 
 a ) chở người_bệnh đi cấp_cứu ; 
 b ) áp_giải người có hành_vi vi_phạm_pháp_luật ; 
 c ) trẻ_em dưới 14 tuổi ; 
 d ) người già_yếu hoặc người khuyết_tật . 
 2 . người lái_xe , người ngồi trên xe mô_tô hai bánh , xe mô_tô ba bánh , xe gắn_máy , các loại xe tương_tự xe mô_tô , xe gắn_máy phải đội mũ bảo_hiểm bảo_đảm đúng tiêu_chuẩn , chất_lượng và cài quai đúng quy_cách . 
 3 . người lái_xe mô_tô hai bánh , xe mô_tô ba bánh , xe gắn_máy , các loại xe tương_tự xe mô_tô , xe gắn_máy không được thực_hiện các hành_vi sau đây : 
 a ) đi xe dàn hàng ngang ; 
 b ) đi xe vào phần đường dành cho người đi bộ và phương_tiện khác ; 
 c ) sử_dụng ô ; 
 d ) buông cả hai tay hoặc đi xe bằng một bánh đối_với xe hai bánh ,...<br>

**Node ID:** 7f17e61c-d619-4e90-a7b8-5a69b276e348<br>**Similarity:** 0.9996391534805298<br>**Text:** điều 30 . người điều_khiển , người ngồi trên xe mô_tô , xe gắn_máy 
 1 . người điều_khiển xe mô_tô hai bánh , xe gắn_máy chỉ được chở một người , trừ những trường_hợp sau thì được chở tối_đa hai người : 
 a ) chở người_bệnh đi cấp_cứu ; 
 b ) áp_giải người có hành_vi vi_phạm_pháp_luật ; 
 c ) trẻ_em dưới 14 tuổi . 
 2 . người điều_khiển , người ngồi trên xe mô_tô hai bánh , xe mô_tô ba bánh , xe gắn_máy phải đội mũ bảo_hiểm có cài quai đúng quy_cách . 
 3 . người điều_khiển xe mô_tô hai bánh , xe mô_tô ba bánh , xe gắn_máy không được thực_hiện các hành_vi sau đây : 
 a ) đi xe dàn hàng ngang ; 
 b ) đi xe vào phần đường dành cho người đi bộ và phương_tiện khác ; 
 c ) sử_dụng ô , điện_thoại_di_động , thiết_bị âm_thanh , trừ thiết_bị trợ_thính ; 
 d ) sử_dụng xe để kéo , đẩy xe khác , vật khác , mang , vác và chở vật cồng_kềnh ; 
 đ ) buông cả hai tay hoặc đi xe bằng một bánh đối_với xe hai bánh , bằng hai bánh đối_với xe ba bánh ; 
 e ) hành_vi khác gây mất trật_tự , an_toàn giao_th...<br>

**Node ID:** 86b43287-2e27-4bc3-844b-92fcffad2715<br>**Similarity:** 0.9995784163475037<br>**Text:** điều 3 . kiên_quyết lập lại trật_tự kỷ_cương trong việc chấp_hành pháp_luật về trật_tự an_toàn giao_thông . bộ công_an tập_trung chỉ_đạo và tăng_cường_lực_lượng vào việc hướng_dẫn và điều_khiển giao_thông thông_suốt ; thực_hiện các biện_pháp cưỡng_chế thi_hành pháp_luật về trật_tự an_toàn giao_thông , trước_hết phải tập_trung kiểm_tra , xử_phạt nghiêm những người điều_khiển mô_tô không có giấy_phép lái_xe , kiên_quyết chấm_dứt tình_trạng người điều_khiển mô_tô không có giấy_phép lái_xe ; đồng_thời tăng_cường tuần_tra , kiểm_soát và xử_lý nghiêm_khắc những vi_phạm của người điều_khiển mô_tô , xe_máy như : chưa đủ tuổi quy_định , đua xe trái_phép , chạy quá tốc_độ , điều_khiển xe_máy lạng_lách , đánh_võng , ... . để hạn_chế thương_vong do chấn_thương sọ não từ tai_nạn giao_thông gây ra , cảnh_sát giao_thông phải kiên_quyết xử_phạt những người điều_khiển và ngồi trên mô_tô , xe_máy không đội mũ bảo_hiểm trên những đoạn đường bắt_buộc đội mũ bảo_hiểm . bộ giao_thông vận_tải có trách_nhi...<br>

In [8]:
from llama_index.core.postprocessor import MetadataReplacementPostProcessor, SimilarityPostprocessor
from CustomClass.RemoveDuplicatedParentPostProcesser import RemoveDuplicatedParentPostProcesser

postprocessors = [reranker,
                  RemoveDuplicatedParentPostProcesser(),
                  MetadataReplacementPostProcessor(target_metadata_key="full_text")]

In [13]:
len(final_retrieval), len(RemoveDuplicatedParentPostProcesser().postprocess_nodes(final_retrieval))

(3, 3)

In [9]:
test_nodes = MetadataReplacementPostProcessor(target_metadata_key="full_text").postprocess_nodes(final_retrieval)