# Avaliação de aprendizagem - Cristiane Lopes de Assis

## Desenvolvimento de um Chatbot com Retrieval-Augmented Generation (RAG)

### Introdução

Atualmente, atuo na Diretoria de Participação Digital e Comunicação em Rede da Secretaria Nacional de Participação Social da Secretaria-Geral da Presidência. Esta diretoria é responsável pelo gerenciamento da plataforma de participação social do governo federal Brasil Participativo. Seu objetivo é possibilitar que toda a população brasileira possa participar na elaboração, monitoramento e aperfeiçoamento de políticas públicas, em um canal único e direto com todo o governo federal, por meio de consultas públicas.

A plataforma possui um chatbot. No entanto, ele funciona com perguntas pré-definidas e limitadas. O objetivo da atividade é ampliar o atendimento, possibilitando ao usuários sanar as suas dúvidas sobre participação social, sobre a plataforma e sobre os processos participativos ativos.

### Metodologia

Para possibilitar a ampliação das possibilidade de interação, foi utilizado um documento em excel com a lista das principais dúvidas dos usuários sobre a plataforma e uma tabela em excel com os detalhes de todos os processos cadastrados.

Além disso, foi integrado ao chat bot o modelo pré-treinado gemini-1.5-flash.

A interface escolhida foi a da biblioteca streamlit.

### Funcionamento

Para interação com o chat bot o usuário deve escrever sua dúvida na caixa e clicar em "Digite aqui a sua dúvida sobre a plataforma Brasil Participativo e seus processos participativos".



### Resultados

Espera-se que o usuário consiga sanar suas dúvidas e contribuir com os processos participativos ativos. O que trará mais engajamento para a plataforma, para os processos participativos e, no longo prazo, melhoria das políticas públicas.

## Código

### Importando as bibliotecas

In [12]:
import streamlit as st
import sys
from importlib import util

# Verificação das dependências
def check_package(package_name):
    if util.find_spec(package_name) is None:
        st.error(f"Pacote {package_name} não encontrado. Instale com: pip install {package_name}")
        st.stop()

check_package("sentence_transformers")
check_package("transformers")
check_package("torch")

import streamlit as st
import google.generativeai as genai
from langchain.document_loaders import PyPDFLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
import os

# Verificação rigorosa das dependências
try:
    from sentence_transformers import SentenceTransformer
    from langchain.embeddings import HuggingFaceEmbeddings
    from langchain.vectorstores import FAISS
except ImportError as e:
    st.error(f"ERRO CRÍTICO: Falha na importação de dependências. Execute:\n\n"
             f"pip uninstall -y numpy transformers sentence-transformers torch\n"
             f"pip install numpy==1.23.5 torch==2.0.1 transformers==4.30.2 sentence-transformers==2.2.2")
    st.stop()

# Configurar a chave da API
genai.configure(api_key="AIzaSyD6dpEEUjrKLNqO8XmrzqMUf5nvn4g8Cn0")  # Substitua pela sua chave

# Criar o modelo
model = genai.GenerativeModel("gemini-1.5-flash")

system_prompt = """
Você é um assistente virtual especializado em participação social. Ao receber uma mensagem, sua tarefa é:
1. Fornecer respostas claras e objetivas sobre participação social e sobre a plataforma Brasil Participativo.
2. Recomendar a participação social e, caso solicitado, sugira processos participativos abertos na plataforma Brasil Participativo.
3. Não comente sobre o documento fornecido.
4. Utilizar informações do documento PDF carregado para enriquecer suas respostas quando relevante.
5. Seja educado!
"""

def setup_rag():
    try:
        if not os.path.exists("FAQ.docx.pdf"):
            return None
        
        pdf_loader = PyPDFLoader("FAQ.docx.pdf")
        documents = pdf_loader.load()
        
        text_splitter = RecursiveCharacterTextSplitter(chunk_size=4000, chunk_overlap=500)
        texts = text_splitter.split_documents(documents)
        
        embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
        db = FAISS.from_documents(texts, embeddings)
        
        return db
    except Exception as e:
        st.error(f"Erro ao configurar RAG: {e}")
        return None

vectorstore = setup_rag()

def get_relevant_info(query):
    if vectorstore is None:
        return None
    
    try:
        docs = vectorstore.similarity_search(query, k=2)
        return "\n\n".join([doc.page_content for doc in docs])
    except Exception as e:
        st.error(f"Erro na busca de informações: {e}")
        return None

def generate_response(user_input, history):
    relevant_info = get_relevant_info(user_input)
    
    prompt = system_prompt
    if relevant_info:
        prompt += f"\n\nInformações relevantes do documento:\n{relevant_info}"
    
    try:
        response = model.generate_content([f"{history}\nUsuário: {user_input}\nAssistente:", prompt])
        return response.text
    except Exception as e:
        return f"Erro ao gerar resposta: {e}"

# Interface
st.set_page_config(page_title="Chatbot - Plataforma Brasil Participativo", page_icon="🤖")
st.title("🤖Chatbot - Plataforma Brasil Participativo 🤝")

# Histórico de conversa
if "history" not in st.session_state:
    st.session_state.history = system_prompt
if "conversation" not in st.session_state:
    st.session_state.conversation = ""

# Chat
user_input = st.text_input("Digite sua dúvida sobre participação social e sobre a plataforma Brasil Participativo:")
if st.button("Enviar") and user_input.strip():
    st.session_state.conversation += f"\nUsuário: {user_input}"
    response = generate_response(user_input, st.session_state.conversation)
    st.write(f"**Assistente**: {response}")
    st.session_state.conversation += f"\nAssistente: {response}"

Ignoring wrong pointing object 569 0 (offset 0)
  embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")


model.safetensors:   0%|          | 0.00/90.9M [00:00<?, ?B/s]



In [11]:
pip install pypdf

Collecting pypdf
  Downloading pypdf-5.4.0-py3-none-any.whl.metadata (7.3 kB)
Downloading pypdf-5.4.0-py3-none-any.whl (302 kB)
Installing collected packages: pypdf
Successfully installed pypdf-5.4.0
Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 24.3.1 -> 25.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip
