# Projeto Corujita

In [None]:
import os
from pathlib import Path
import requests
import streamlit as st
from dotenv import load_dotenv
import pickle

# Import necessary modules to load FAISS index
from langchain_community.vectorstores import FAISS
from langchain_huggingface import HuggingFaceEmbeddings
from langchain.vectorstores.base import VectorStoreRetriever

# --- Load API key from environment file ---
load_dotenv(Path("config.env"))
DEEPSEEK_API_KEY = os.environ.get("DEEPSEEK_API_KEY")
if not DEEPSEEK_API_KEY:
    raise ValueError("DEEPSEEK_API_KEY not found. Please set it in your environment variables.")

# --- API call function ---
def call_deepseek_api(api_key, input_text):
    url = "https://api.deepseek.com/v1/chat/completions"  # Adjust if necessary
    headers = {
        "Content-Type": "application/json",
        "Authorization": f"Bearer {api_key}"
    }
    data = {
        "model": "deepseek-chat",
        "messages": [{"role": "user", "content": input_text}]
    }
    response = requests.post(url, headers=headers, json=data)
    response.raise_for_status()  # Raise error if request failed
    data = response.json()
    return data["choices"][0]["message"]["content"] if "choices" in data else None

# --- Query expansion functions ---
def generate_expanded_query(original_query):
    prompt = f"""
    Dado o contexto de um assistente virtual para o sistema Nova SAT do Ministério Público do Estado do Rio de Janeiro (MPRJ), 
    Expanda a seguinte pergunta do usuário gerando 10 sinônimos, reformulações e variações que poderiam ter sido feitas por outros usuários no passado. 
    
    O objetivo é melhorar a recuperação da resposta correta, garantindo que perguntas semelhantes sejam identificadas como equivalentes. 
    Priorize termos técnicos e expressões usadas no contexto jurídico e administrativo do MPRJ.
    
    Pergunta original: "{original_query}"
    
    Exemplo de query: "Estou com problema no login".
    Exemplo de resposta (resumido): "Estou com problema no login. Não consigo logar na página. Não consigo entrar na nova SAT. (...) O que fazer quando o login está bugado?.
    
    Responda apenas com as expressões-sinônimos, separadas por ponto. Não acrescente nada mais além disso. Não acrescente números indicadores da lista.
    """
    return prompt

def expand_query_with_llm(api_key, original_query):
    prompt = generate_expanded_query(original_query)
    response = call_deepseek_api(api_key, prompt)
    expanded_terms = response.split(',')
    return [term.strip() for term in expanded_terms]

                             
with open("vectorstore.pkl", "rb") as f:
    vectorstore = pickle.load(f)
    retriever = VectorStoreRetriever(vectorstore=vectorstore)
    
# --- Document retrieval function ---
def retrieve_documents(api_key, original_query, retriever, expand=False):
    if expand:
        expanded_terms = expand_query_with_llm(api_key, original_query)
        final_query = '. '.join([original_query] + expanded_terms)
        st.write("Consulta modificada:", final_query)
    else:
        final_query = original_query
        
    relevant_documents = retriever.get_relevant_documents(final_query)
    return relevant_documents

# --- Streamlit Chatbot Interface ---
def main():
    st.title("Chatbot Assistente - Nova SAT")
    
    # Initialize chat history in session_state if not already present
    if "chat_history" not in st.session_state:
        st.session_state.chat_history = []
        # Initial greeting message in Portuguese
        st.session_state.chat_history.append({
            "role": "assistant", 
            "content": "Olá! Em que posso ajudar? Você tem alguma pergunta?"
        })
    
    # Display chat history
    for message in st.session_state.chat_history:
        if message["role"] == "assistant":
            st.markdown(f"**Chatbot:** {message['content']}")
        else:
            st.markdown(f"**Você:** {message['content']}")
    
    # Input field for user's question
    user_input = st.text_input("Digite sua pergunta:", key="user_input")
    
    # Process the input when the "Enviar" button is clicked
    if st.button("Enviar") and user_input:
        # Append user's question to chat history
        st.session_state.chat_history.append({
            "role": "user", 
            "content": user_input
        })
        
        # Retrieve relevant documents using the new FAISS retriever
        docs = retrieve_documents(DEEPSEEK_API_KEY, user_input, retriever, expand=False)
        
        # Build the response message based on the retrieved document
        if docs:
            doc = docs[0]
            if 'Resposta' in doc.metadata:
                response_message = f"{doc.metadata['Resposta']}\n\n"
            else:
                response_message = f"Pergunta encontrada: {doc.page_content}\n\n"
        else:
            response_message = "Nenhuma mensagem encontrada."
            
        # Append chatbot's answer to chat history
        st.session_state.chat_history.append({
            "role": "assistant", 
            "content": response_message
        })
        st.rerun()

if __name__ == "__main__":
    main()
