In [1]:
!pip install gradio
!pip install transformers
!pip install faiss-cpu
!pip install sentence-transformers
!pip install torch



In [2]:
from retriever import initialize_retriever, retrieve_top_chunks
from generator import initialize_generator, generate_response
import logging

  from tqdm.autonotebook import tqdm, trange


In [3]:
# Set up logging
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

# Paths to data
faiss_path = "/content/50_chunk_faiss_index.bin"  # Update path as needed
metadata_path = "/content/50_chunk_metadata.json"  # Update path as needed

# Parameter dictionaries for retrieval and generation
retriever_params = {
    "initial_top_k": 30,
    "final_top_k": 2,
}

generator_params = {
    "max_new_tokens": 80,
    "temperature": 0.05,
    "repetition_penalty": 1.5,
    "top_p": 0.8,
    "do_sample": False
}


In [4]:
def test_query(query):
    # Step 1: Initialize components for retrieval and generation
    index, metadata, retriever_model = initialize_retriever(faiss_path, metadata_path)
    model, tokenizer, streamer = initialize_generator()

    # Step 2: Retrieve context
    retrieved_chunks = retrieve_top_chunks(query, index, metadata, retriever_model, **retriever_params)
    context = "\n".join(f"{chunk['speaker']}:\n{chunk['text']}" for chunk in retrieved_chunks)

    # Step 3: Display the retrieved context to verify accuracy
    print("---- Retrieved Context ----")
    print(context)
    print("---- End of Retrieved Context ----\n")

    # Step 4: Generate response based on the retrieved context
    response = generate_response(query, context, model, tokenizer, streamer, **generator_params)

    # Step 5: Display the generated response
    print("---- Generated Response ----")
    print(response)
    print("---- End of Generated Response ----")


In [5]:
if __name__ == "__main__":
    # Example query for testing
    test_query("Jakie kraje wspomniano w raporcie?")

FAISS index loaded successfully.
Metadata loaded successfully.


The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


Retriever model initialized successfully.
Query: Jakie kraje wspomniano w raporcie?
Retrieved in 1730664357.8445 seconds
Average similarity distance: 1.4285
Results count after filtering: 2

---- Retrieved Context ----
Bartosz Rusek:
potwierdzam, pan. rumunia. a gdzie jest najmniejsze zaangażowanie? gdzie najmniej osób ten raport wskazał jako osoby zaangażowane? średnio, tak? o, pan chyba był, tak. włochy. włochy. cztery procent, nie? cztery procent porównywają do 30-30 trzech w rumuni. zaraz zawołchami jest francja. a sześć procent. tak, jak państwo prowadzicie, macie ze społy w różnych krajach, to też możecie porównać to zaangażowanie pracowników w polsce na poziomie 14%. czyli cztery wyłożę, 14 w polsce, 33 w rumuni,
Bartosz Rusek:
na świecie wypadają kraje daleko wschodnie, indię nepal, vietnam. tutaj chodzi o odpowiedź na pytanie, jak jestem zaangażowany w pracy? i lub pracowników deklaruje zaangażowanie w pracy? to jest dana, którą tutaj wyciągamy z tego raportu, akurat w tym prz



Raport nie zawiera tych nazwisk, ale podaje ogólny obraz sytuacji dla wszystkich państw członkowskich UE. Wspomina także Włochy (które mają niższe poziomy zaangażowania) oraz Francję (która ma wyższą liczbę pracujących). Raport również podkreśla wysokie zaangażowanie zatrudnienia w Niemczech, gdzie oko
---- Generated Response ----
Raport nie zawiera tych nazwisk, ale podaje ogólny obraz sytuacji dla wszystkich państw członkowskich UE. Wspomina także Włochy (które mają niższe poziomy zaangażowania) oraz Francję (która ma wyższą liczbę pracujących). Raport również podkreśla wysokie zaangażowanie zatrudnienia w Niemczech, gdzie oko
---- End of Generated Response ----
