# üìù Projeto: Chatbot de Atendimento ao Cliente com Mem√≥ria (RAG + Chat History)

*   **Autor:** Victor Alexandre
*   **Metodologia:** Aprender Construindo

---

## 1. Objetivo Principal

Construir um assistente virtual inteligente (chatbot) capaz de responder a perguntas sobre uma base de conhecimento espec√≠fica. O diferencial deste projeto √© a implementa√ß√£o de **mem√≥ria conversacional**, permitindo que o chatbot entenda o contexto de perguntas anteriores e responda a intera√ß√µes de acompanhamento de forma coesa e natural.

---

## 2. Arquitetura da Solu√ß√£o

Utilizamos o padr√£o **RAG (Retrieval-Augmented Generation)**, que funciona em duas grandes etapas:

1.  **Recupera√ß√£o (Retrieval):** A pergunta do usu√°rio √© usada para buscar os trechos mais relevantes de informa√ß√£o dentro do nosso documento. Isso √© feito transformando o texto em vetores num√©ricos e encontrando os mais similares √† pergunta.
2.  **Gera√ß√£o (Generation):** Os trechos recuperados, juntamente com a pergunta original e o hist√≥rico da conversa, s√£o enviados a um Grande Modelo de Linguagem (LLM), que gera uma resposta final em linguagem natural.

O fluxo √© orquestrado pela biblioteca `LangChain`, conectando uma interface de usu√°rio criada com `Streamlit` a uma base de vetorial `FAISS` e a um LLM.

---

## 3. Fonte de Dados (Dataset)

*   **Documento:** Manual do Usu√°rio do WordPress
*   **Origem:** Universidade Federal de Juiz de Fora (UFJF)
*   **Formato:** PDF
*   **Tamanho:** 33 p√°ginas
*   **Descri√ß√£o:** Um documento denso, com instru√ß√µes t√©cnicas, guias passo a passo e imagens, simulando um desafio de atendimento ao cliente do mundo real.

---

## 4. Stack de Tecnologias

| Componente | Tecnologia | Prop√≥sito |
| :--- | :--- | :--- |
| **Interface do Usu√°rio** | `Streamlit` | Criar uma aplica√ß√£o web interativa para o chat. |
| **Orquestra√ß√£o** | `LangChain` | A "cola" que conecta todos os componentes do sistema. |
| **Base de Vetores** | `FAISS` | Armazenar e buscar eficientemente os vetores do documento. |
| **Processamento de PDF** | `PyPDFLoader` | Carregar e extrair o texto do nosso documento base. |
| **Modelos de IA (LLM)** | `Google AI / OpenAI` | Gerar as respostas com base no contexto fornecido. |
| **Ambiente de Dev** | `Google Colab` | Nosso ambiente de desenvolvimento e experimenta√ß√£o. |
| **Deploy (App)** | `Ngrok` | Expor nossa aplica√ß√£o Streamlit do Colab para a web. |

In [1]:
# C√âLULA 1: INSTALA√á√ÉO DE TODAS AS DEPEND√äNCIAS (VERS√ÉO CORRIGIDA 2)
!pip install -q -U langchain langchain-community streamlit langchain_google_genai faiss-cpu pypdf pyngrok google-ai-generativelanguage==0.6.15

In [6]:
# C√âLULA 2: AUTENTICA√á√ÉO E CONFIGURA√á√ÉO DA API (VERS√ÉO CORRIGIDA)

import os
from google.colab import userdata, auth
import google.generativeai as genai

# 1. Pega a API Key dos Segredos do Colab
try:
    api_key = userdata.get('GOOGLE_API_KEY')
    os.environ['GOOGLE_API_KEY'] = api_key
except userdata.SecretNotFoundError:
    print("ERRO: O segredo 'GOOGLE_API_KEY' n√£o foi encontrado.")
    # Interrompe a execu√ß√£o se a chave n√£o for encontrada
    raise ValueError("Configure o segredo 'GOOGLE_API_KEY' no painel do Colab.")

# 2. Autentica o usu√°rio no ambiente do Colab
#    Este √© o passo crucial que resolve o erro de metadados.
#    Uma janela de autentica√ß√£o do Google pode aparecer. Siga os passos.
try:
    auth.authenticate_user()
    print("‚úÖ Usu√°rio autenticado com sucesso.")
except Exception as e:
    print(f"‚ùå ERRO: Falha na autentica√ß√£o do usu√°rio. Detalhe: {e}")
    raise

# 3. Configura a biblioteca do GenAI com a chave
try:
    genai.configure(api_key=api_key)
    print("‚úÖ Biblioteca Google Generative AI configurada com sucesso.")
except Exception as e:
    print(f"‚ùå ERRO: Falha ao configurar a biblioteca GenAI. Detalhe: {e}")
    raise

‚úÖ Usu√°rio autenticado com sucesso.
‚úÖ Biblioteca Google Generative AI configurada com sucesso.


In [7]:
# C√âLULA 3: CARREGAMENTO E PROCESSAMENTO DO PDF (VERS√ÉO CORRIGIDA)

from google.colab import drive
from langchain_community.document_loaders import PyPDFLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter

# 1. Monta o Google Drive (se j√° montado, n√£o faz nada)
drive.mount('/content/drive', force_remount=False)

# 2. Define o caminho para o seu arquivo PDF
#    USE O M√âTODO "COPIAR CAMINHO" PARA GARANTIR QUE EST√Å CORRETO
pdf_path = "/content/drive/MyDrive/Projetos/Projetos - Engenharia de IA/Chatbot de Atendimento ao Cliente com MemoÃÅria (RAG + Chat History)/manualWP_4.2.pdf" # <-- COLE O CAMINHO COPIADO AQUI

# 3. Carrega o documento PDF
try:
    loader = PyPDFLoader(pdf_path)
    docs_raw = loader.load()
    print(f"Documento de {len(docs_raw)} p√°gina(s) carregado com sucesso.")

    # 4. Divide o documento em chunks
    text_splitter = RecursiveCharacterTextSplitter(
        chunk_size=1000,
        chunk_overlap=200,
        add_start_index=True
    )
    docs_processed = text_splitter.split_documents(docs_raw)

    print(f"O documento foi dividido em {len(docs_processed)} chunks para processamento.")

except Exception as e:
    print(f"Ocorreu um erro ao carregar o PDF: {e}")
    print("\nVERIFIQUE SE O CAMINHO ACIMA EST√Å 100% CORRETO.")

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
Documento de 30 p√°gina(s) carregado com sucesso.
O documento foi dividido em 32 chunks para processamento.


In [8]:
# C√âLULA 4: CRIA√á√ÉO DA BASE DE VETORES (EMBEDDINGS & FAISS)

from langchain_google_genai import GoogleGenerativeAIEmbeddings
from langchain_community.vectorstores import FAISS

# 1. Crie o modelo de embeddings
embeddings_model = GoogleGenerativeAIEmbeddings(model="models/embedding-001")

# 2. Crie a base de vetores com o FAISS
print("Criando a base de vetores (isso pode levar alguns segundos)...")
vector_store = FAISS.from_documents(docs_processed, embeddings_model)
print("Base de vetores criada com sucesso!")

# 3. Salve o √≠ndice localmente
vector_store.save_local("faiss_index_wordpress")
print("√çndice FAISS salvo localmente na pasta 'faiss_index_wordpress'.")

Criando a base de vetores (isso pode levar alguns segundos)...
Base de vetores criada com sucesso!
√çndice FAISS salvo localmente na pasta 'faiss_index_wordpress'.


In [11]:
# C√âLULA DE DESCOBERTA: Listando os modelos de IA dispon√≠veis

import google.generativeai as genai

print("Modelos de IA dispon√≠veis para sua API Key:")
for m in genai.list_models():
  if 'generateContent' in m.supported_generation_methods:
    print(f"  - {m.name}")

Modelos de IA dispon√≠veis para sua API Key:
  - models/gemini-2.5-pro-preview-03-25
  - models/gemini-2.5-flash-preview-05-20
  - models/gemini-2.5-flash
  - models/gemini-2.5-flash-lite-preview-06-17
  - models/gemini-2.5-pro-preview-05-06
  - models/gemini-2.5-pro-preview-06-05
  - models/gemini-2.5-pro
  - models/gemini-2.0-flash-exp
  - models/gemini-2.0-flash
  - models/gemini-2.0-flash-001
  - models/gemini-2.0-flash-exp-image-generation
  - models/gemini-2.0-flash-lite-001
  - models/gemini-2.0-flash-lite
  - models/gemini-2.0-flash-preview-image-generation
  - models/gemini-2.0-flash-lite-preview-02-05
  - models/gemini-2.0-flash-lite-preview
  - models/gemini-2.0-pro-exp
  - models/gemini-2.0-pro-exp-02-05
  - models/gemini-exp-1206
  - models/gemini-2.0-flash-thinking-exp-01-21
  - models/gemini-2.0-flash-thinking-exp
  - models/gemini-2.0-flash-thinking-exp-1219
  - models/gemini-2.5-flash-preview-tts
  - models/gemini-2.5-pro-preview-tts
  - models/learnlm-2.0-flash-experi

In [12]:
# C√âLULA 5: CRIA√á√ÉO DA CADEIA CONVERSACIONAL (VERS√ÉO FINAL)

from langchain_google_genai import ChatGoogleGenerativeAI
from langchain.chains import ConversationalRetrievalChain
from langchain.memory import ConversationBufferMemory

# CORRE√á√ÉO: Usando o alias est√°vel da sua lista de modelos
llm = ChatGoogleGenerativeAI(model="gemini-pro-latest", temperature=0.3)

retriever = vector_store.as_retriever(search_kwargs={"k": 5})
memory = ConversationBufferMemory(memory_key='chat_history', return_messages=True)

chatbot_chain = ConversationalRetrievalChain.from_llm(
    llm=llm,
    retriever=retriever,
    memory=memory,
    verbose=False
)
print("‚úÖ Chatbot (cadeia conversacional) montado e pronto para uso.")

# --- Teste r√°pido ---
print("\n--- Teste R√°pido no Colab ---")
try:
    question = "Como eu acesso o painel administrativo?"
    response = chatbot_chain.invoke({"question": question})
    print(f"Pergunta: {question}")
    print(f"Resposta: {response['answer']}")
    print("\n‚úÖ Teste r√°pido conclu√≠do com sucesso!")
except Exception as e:
    print(f"‚ùå ERRO durante o teste r√°pido: {e}")

‚úÖ Chatbot (cadeia conversacional) montado e pronto para uso.

--- Teste R√°pido no Colab ---
Pergunta: Como eu acesso o painel administrativo?
Resposta: Para acessar o painel administrativo do site, voc√™ deve digitar o seguinte endere√ßo no seu navegador: `http://www.ufjf.br/seusite/wp-admin/`.

Lembre-se de substituir "seusite" pelo nome do seu site.

Ap√≥s acessar o endere√ßo, aparecer√° uma tela de login onde voc√™ dever√° inserir seu "Nome de usu√°rio" e "Senha".

‚úÖ Teste r√°pido conclu√≠do com sucesso!


In [16]:
# C√âLULA 6: CRIA√á√ÉO DO ARQUIVO DA APLICA√á√ÉO (app.py) (VERS√ÉO FINAL)
%%writefile app.py

import streamlit as st
from langchain_google_genai import ChatGoogleGenerativeAI, GoogleGenerativeAIEmbeddings
from langchain.chains import ConversationalRetrievalChain
from langchain.memory import ConversationBufferMemory
from langchain_community.vectorstores import FAISS
import os

# --- CONFIGURA√á√ÉO DA P√ÅGINA ---
st.set_page_config(page_title="Assistente WordPress", page_icon="üß†", layout="centered")
st.markdown("<h1 style='text-align: center; color: #E8E8E8;'>üß† Assistente Virtual WordPress</h1>", unsafe_allow_html=True)
st.markdown("<p style='text-align: center; color: #A0A0A0;'>Seu copiloto para tirar d√∫vidas sobre o manual da UFJF.</p>", unsafe_allow_html=True)
st.divider() # Adiciona uma linha divis√≥ria

# --- FUN√á√ïES CORE (COM CACHING) ---
@st.cache_resource
def load_components():
    """ Carrega os componentes pesados (LLM, Embeddings, Vector Store) uma √∫nica vez. """
    if not os.getenv("GOOGLE_API_KEY"):
        st.error("Chave de API do Google n√£o encontrada. Configure o segredo 'GOOGLE_API_KEY' no Colab.")
        st.stop()

    # CORRE√á√ÉO: Usando o alias est√°vel da sua lista de modelos
    llm = ChatGoogleGenerativeAI(model="gemini-pro-latest", temperature=0.3)

    embeddings_model = GoogleGenerativeAIEmbeddings(model="models/embedding-001")
    vector_store = FAISS.load_local(
        "faiss_index_wordpress",
        embeddings_model,
        allow_dangerous_deserialization=True
    )
    return llm, vector_store.as_retriever(search_kwargs={"k": 5})

def create_conversational_chain(_llm, _retriever):
    """ Cria a cadeia conversacional com mem√≥ria. """
    memory = ConversationBufferMemory(memory_key='chat_history', return_messages=True)
    chain = ConversationalRetrievalChain.from_llm(llm=_llm, retriever=_retriever, memory=memory)
    return chain

# --- INICIALIZA√á√ÉO DA APLICA√á√ÉO ---
llm, retriever = load_components()

if 'chain' not in st.session_state:
    st.session_state.chain = create_conversational_chain(llm, retriever)

if "messages" not in st.session_state:
    st.session_state.messages = [{"role": "assistant", "content": "Ol√°! Como posso ajudar com o manual do WordPress?"}]

# --- L√ìGICA DO CHAT ---
for message in st.session_state.messages:
    with st.chat_message(message["role"]):
        st.markdown(message["content"])

if prompt := st.chat_input("Qual √© a sua d√∫vida?"):
    st.session_state.messages.append({"role": "user", "content": prompt})
    with st.chat_message("user"):
        st.markdown(prompt)

    with st.chat_message("assistant"):
        with st.spinner("Analisando o documento..."):
            result = st.session_state.chain.invoke({"question": prompt})
            response = result["answer"]
            st.markdown(response)
            st.session_state.messages.append({"role": "assistant", "content": response})

Overwriting app.py


In [17]:
# C√âLULA 7: EXECU√á√ÉO DO STREAMLIT COM NGROK (VERS√ÉO FINAL AUTENTICADA)

from pyngrok import ngrok
from google.colab import userdata
import os

# 1. Pega o authtoken do ngrok dos segredos do Colab
try:
    ngrok_authtoken = userdata.get('ngrok_key')
    # 2. Autentica o ngrok
    ngrok.set_auth_token(ngrok_authtoken)
    print("‚úÖ Authtoken do Ngrok configurado com sucesso.")
except userdata.SecretNotFoundError:
    print("‚ùå ERRO: O segredo 'ngrok_key' n√£o foi encontrado.")
    raise ValueError("Configure o segredo 'ngrok_key' no painel do Colab.")
except Exception as e:
    print(f"‚ùå ERRO ao configurar o Ngrok: {e}")
    raise

# Mata qualquer processo do streamlit que possa estar rodando
!killall streamlit

# Define a porta
port = 8501

# Executa o Streamlit em background
os.system(f"streamlit run app.py --server.port {port} &")

# 3. Cria o t√∫nel p√∫blico (agora autenticado)
try:
    public_url = ngrok.connect(port)
    print("="*60)
    print(f"üöÄ SEU CHATBOT EST√Å NO AR! ACESSE ATRAV√âS DESTE LINK:")
    print(public_url)
    print("="*60)
except Exception as e:
    print(f"‚ùå ERRO ao criar o t√∫nel do Ngrok: {e}")

‚úÖ Authtoken do Ngrok configurado com sucesso.
üöÄ SEU CHATBOT EST√Å NO AR! ACESSE ATRAV√âS DESTE LINK:
NgrokTunnel: "https://preneural-nonascendently-rosy.ngrok-free.dev" -> "http://localhost:8501"
