#### **0. Embedding Based Search**

In [None]:
%cd D:/AIC2024

In [None]:
from utils.embedding_based_search.embedding_based_search import EmbeddingBasedSearch
from utils.query_processing.translator import Translator
from notebooks.utils import display_images
from langdetect import detect
import json
import time

In [3]:
embedding_based_search = EmbeddingBasedSearch(
    use_clip_h14=False,
    use_clip_l14=True,
    use_blip=False,
    use_beit=False
)

#### **1. Global Search**

In [None]:
top_k = 20
query_text = 'Lũ lụt cùng tiêu đề bản tin màu đỏ ở phía dưới là phòng chóng lũ lụt'
if detect(query_text) == 'vi':
    translator = Translator()
    query_text = translator(query_text)

# Này là khi tích ô nào thì sẽ hiện True ô đó
embedding_based_search.update_searching_mode(
    clip_h14_engine=False,
    clip_l14_engine=True,
    blip_engine=False,
    beit_engine=False
)

start_time = time.time()
# Vì search trên global nên image_path_subset = None
result = embedding_based_search.text_search(query_text, image_path_subset=None, top_k=top_k)
'''
result sẽ có định dạng là  {image_path: score}
'''
end_time = time.time()

print('Thời gian truy vấn:', end_time - start_time)
display_images(result)

#### **2. Local Seach on video**

In [None]:
def reading_json_file(json_path):
    with open(json_path, 'r') as file:
        data = json.load(file)
    return data

In [None]:
# Giả sử ta lựa chọn L và V như sau:
L, V = 'L01', 'V001'
local_dict = reading_json_file('../dict/local/local_dict.json')
# Trích xuất đường dẫn của tập hình ảnh video thông qua local dict
image_path_subset = local_dict[L][V]
# Search trên tập ảnh vừa rút trích
top_k = 30 # Top k nên lấy số lượng ít hơn số lượng metadata_result, nếu bằng hoặc lớn hơn sẽ diễn ra lỗi
query_text = 'xe ô tô vượt lũ'
if detect(query_text) == 'vi':
    translator = Translator()
    query_text = translator(query_text)
# Có thể dùng 1 trong 2 clip hoặc cả hai nhưng không nên sử dụng blip
embedding_based_search.update_searching_mode(
    clip_h14_engine=False,
    clip_l14_engine=True,
    blip_engine=False,
    beit_engine=False
)
start_time = time.time()
result = embedding_based_search.text_search(query_text, image_path_subset=image_path_subset, top_k=top_k)
end_time = time.time()

print('Thời gian truy vấn:', end_time - start_time)
display_images(result)

#### **3. Fusion Search**

In [None]:
# Giả sử khung hình trái có kết quả như sau:
metadata_result = {
    "./distilled_keyframe/L01/V001/498.jpg": 10, 
    "./distilled_keyframe/L01/V001/596.jpg": 8, 
    "./distilled_keyframe/L01/V001/597.jpg": 3, 
    "./distilled_keyframe/L01/V001/621.jpg": 2, 
    "./distilled_keyframe/L01/V001/646.jpg": 1,
    "./distilled_keyframe/L01/V001/5118.jpg": 0
}
# Trích xuất đường dẫn của tập hình ảnh kết quả của metadata_result
image_path_subset = list(metadata_result.keys())
# Search trên tập ảnh vừa rút trích
top_k = 10 # Top k nên lấy số lượng ít hơn số lượng metadata_result, nếu bằng hoặc lớn hơn sẽ diễn ra lỗi
query_text = 'xe ô tô vượt lũ'
if detect(query_text) == 'vi':
    translator = Translator()
    query_text = translator(query_text)

embedding_based_search.update_searching_mode(
    clip_h14_engine=False,
    clip_l14_engine=True,
    blip_engine=False,
    beit_engine=False
)
start_time = time.time()
result = embedding_based_search.text_search(query_text, image_path_subset=image_path_subset, top_k=top_k)
end_time = time.time()

print('Thời gian truy vấn:', end_time - start_time)
display_images(result)

#### **4. Multistage Search**

In [None]:
# Giả sử khung hình phải có kết quả như sau:
metadata_result = {
    "./distilled_keyframe/L01/V001/498.jpg": 10, 
    "./distilled_keyframe/L01/V001/596.jpg": 8, 
    "./distilled_keyframe/L01/V001/597.jpg": 3, 
    "./distilled_keyframe/L01/V001/621.jpg": 2, 
    "./distilled_keyframe/L01/V001/646.jpg": 1,
    "./distilled_keyframe/L01/V001/5118.jpg": 0
}
# Trích xuất đường dẫn của tập hình ảnh kết quả của metadata_result
image_path_subset = list(metadata_result.keys())
# Search trên tập ảnh vừa rút trích
top_k = 5 # Top k nên lấy số lượng ít hơn số lượng metadata_result, nếu bằng hoặc lớn hơn sẽ diễn ra lỗi
query_text = 'xe ô tô vượt lũ'
if detect(query_text) == 'vi':
    translator = Translator()
    query_text = translator(query_text)

embedding_based_search.update_searching_mode(
    clip_h14_engine=False,
    clip_l14_engine=True,
    blip_engine=False,
    beit_engine=False
)
start_time = time.time()
result = embedding_based_search.text_search(query_text, image_path_subset=image_path_subset, top_k=top_k)
end_time = time.time()

print('Thời gian truy vấn:', end_time - start_time)
display_images(result)

#### **5. Video Searching**

In [None]:
query_image_path = './distilled_keyframe/L01/V001/498.jpg'
embedding_based_search.update_searching_mode(
    clip_h14_engine=False,
    clip_l14_engine=True,
    blip_engine=False,
    beit_engine=False
)
image_path_subset = None
start_time = time.time()
result = embedding_based_search.image_search(query_image_path, image_path_subset, top_k=100)
end_time = time.time()

print('Thời gian truy vấn:', end_time - start_time)
display_images(result)