In [1]:
from FAISS import *
from tokens import TOKEN_API
csv_file_path = '../data/faq_data.csv'

if __name__ == "__main__":
    
    # Use the model from the CohereForAI collection
    # model_name = "CohereForAI/aya-23-35B"
    model_name = "aubmindlab/aragpt2-large"
    # model_name = 'core42/jais-13b'
    faiss_embedding = FAISSEmbedding(model_name, TOKEN_API)

  from .autonotebook import tqdm as notebook_tqdm
2024-07-06 19:23:14,140 - INFO - Initializing FAISS embedding class


In [None]:
# Load data from a CSV file
start_time = time.time()
faiss_embedding.load_csv_data(csv_file_path)
logging.info(f"Loading data took {time.time() - start_time:.2f} seconds")

# Create embeddings for the questions
start_time = time.time()
faiss_embedding.create_embeddings(batch_size=32)
logging.info(f"Creating embeddings took {time.time() - start_time:.2f} seconds")

# Build the FAISS index
start_time = time.time()
faiss_embedding.build_index()
logging.info(f"Building the index took {time.time() - start_time:.2f} seconds")

In [3]:
# Save the index to a file
start_time = time.time()
faiss_embedding.save_index('../data/faiss_index_file.bin', '../data/metadata.json')
logging.info(f"Saving the index took {time.time() - start_time:.2f} seconds")

2024-07-06 19:54:18,644 - INFO - Saving FAISS index to ../data/faiss_index_file.bin
2024-07-06 19:54:18,687 - INFO - FAISS index and metadata saved
2024-07-06 19:54:18,694 - INFO - Saving the index took 0.05 seconds


In [16]:
import time
import logging
from FAISS import FAISSEmbedding
from tokens import TOKEN_API

# Configure logging
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

if __name__ == "__main__":
    model_name = "aubmindlab/aragpt2-large"
    faiss_embedding = FAISSEmbedding(model_name, TOKEN_API)

    # Load the index from a file with METRIC_INNER_PRODUCT assumed to be set during index creation
    start_time = time.time()
    # Assuming load_index can accept a metric parameter or the index is already using METRIC_INNER_PRODUCT
    faiss_embedding.load_index('../data/faiss_index_file.bin', '../data/metadata.pkl')
    logging.info(f"Loading the index took {time.time() - start_time:.2f} seconds")

    # Perform a search for the top-k similar questions
    query = "ما حكم شراء السيارة بالأقساط المريحة من بنك ربوي وتعامله مثل تعامل البنوك الإسلامية"
    start_time = time.time()
    result = faiss_embedding.search(query, top_k=1)
    logging.info(f"Search took {time.time() - start_time:.2f} seconds")

2024-07-06 21:30:47,258 - INFO - Initializing FAISS embedding class
2024-07-06 21:30:53,353 - INFO - Loading FAISS index from ../data/faiss_index_file.bin
2024-07-06 21:30:53,369 - INFO - FAISS index and metadata loaded
2024-07-06 21:30:53,369 - INFO - Loading the index took 0.02 seconds
2024-07-06 21:30:53,369 - INFO - Searching for top 1 similar questions for the query: 'ما حكم شراء السيارة بالأقساط المريحة من بنك ربوي وتعامله مثل تعامل البنوك الإسلامية'
2024-07-06 21:30:53,950 - INFO - Search completed for query: 'ما حكم شراء السيارة بالأقساط المريحة من بنك ربوي وتعامله مثل تعامل البنوك الإسلامية'
2024-07-06 21:30:53,966 - INFO - Results: [{'title': 'يجوز لك شراء الماكينة إذا خلت الأقساط من الربا', 'question': 'السلام عليكم ورحمة الله اشترى شخص ماكينة عن طريق قرض ربوي من أحدى البنوك ولم يستطع تسديد الدفعات الشهرية المستحقة لذلك. عرض هذه الماكينة للبيع فهل يجوز شراء الماكينة ثم أكمل الأقساط الشهرية للبنك', 'answer': 'الحمد لله والصلاة والسلام على رسول الله وعلى آله وصحبه وسلم أما بعد