#ASSISTENTE VIRTUAL BANCONEXT - DOCUMENTAÇÃO

Objetivo: Desenvolver um assistente virtual inteligente para o Banco Next capaz de responder perguntas sobre
a abertura de contas e serviços bancários, utilizando técnicas avançadas de NLP e RAG (Retrieval-Augmented Generation).

Tecnologias principais:
- LangChain: Framework para construção de pipelines de LLM
- Groq: Plataforma de inferência rápida para modelos LLM
- HuggingFace: Modelos de embeddings e transformers
- FAISS: Armazenamento vetorial eficiente
- Streamlit: Interface web para interação com usuários

Fluxo principal:
1. Processamento de documentos PDF com regulamentos do banco
2. Criação de embeddings e armazenamento vetorial
3. Sistema de recuperação de informações relevantes
4. Geração de respostas contextualizadas usando LLM


Instalando Bibliotecas

In [None]:
!pip install langchain langchain-groq langchain_community langchain-huggingface --q
!pip install faiss-cpu sentence-transformers PyMuPDF --q

[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.5/2.5 MB[0m [31m23.0 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m131.1/131.1 kB[0m [31m5.6 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m45.2/45.2 kB[0m [31m2.9 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m50.9/50.9 kB[0m [31m3.5 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m31.3/31.3 MB[0m [31m53.4 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m24.1/24.1 MB[0m [31m69.8 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m363.4/363.4 MB[0m [31m4.1 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m13.8/13.8 MB[0m [31m68.2 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

Dependencias

In [None]:
from langchain_groq import ChatGroq
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
import os
import getpass
# dependencias

In [None]:
os.environ["GROQ_API_KEY"] = getpass.getpass()
#carregando LLM

··········


In [None]:
def load_llm(id_model, temperature):
  llm = ChatGroq(
      model = id_model,
      temperature = temperature,
      max_tokens=None,
      timeout=None,
      max_retries=2,
  )
  return llm
#configurando e atualizando uma instancia

In [None]:
id_model = "llama3-70b-8192" # @param {type: "string"}
temperature = 0.7 # @param {type: "slider", min: 0.1, max: 1.5, step: 0.1}

llm = load_llm(id_model, temperature)

#fazendo definições

In [None]:
prompt = "Como criar uma conta" # @param {type: "string"}

template = ChatPromptTemplate.from_messages([
    ("system", "Você é um assistente virtual prestativo e está respondendo perguntas gerais"),
    ("human", "{prompt}")
])

chain = template | llm | StrOutputParser()

res = chain.invoke({"prompt": prompt})
res
#gerando resposta por meio de prompt(teste)

'Criar uma conta é um processo simples e rápido! Aqui estão os passos gerais para criar uma conta em qualquer plataforma ou serviço online:\n\n**1. Escolha a plataforma ou serviço**: Decide qual plataforma ou serviço você deseja criar uma conta, como um site de rede social, um serviço de email, um banco online, etc.\n\n**2. Acesse o site**: Abra um navegador e acesse o site da plataforma ou serviço escolhido.\n\n**3. Clique em "Criar conta" ou "Inscrever-se"**: Procure o botão "Criar conta" ou "Inscrever-se" e clique nele.\n\n**4. Forneça informações básicas**: Você será solicitado a fornecer informações básicas, como:\n\t* Nome e sobrenome\n\t* Endereço de email (que será usado como login)\n\t* Senha\n\t* Data de nascimento\n\t* Gênero (opcional)\n\n**5. Confirme seu email**: Em alguns casos, você receberá um email de confirmação. Abra o email e clique no link de confirmação para ativar sua conta.\n\n**6. Adicione informações adicionais (opcional)**: Dependendo da plataforma ou serviç

In [None]:
def show_res(res):
  from IPython.display import Markdown
  if "</think>" in res:
    res = res.split("</think>")[-1].strip()
  else:
    res = res.strip()
  display(Markdown(res))

show_res(res)
#formatando e guardando resposta temporaria

Criar uma conta é um processo simples e rápido! Aqui estão os passos gerais para criar uma conta em qualquer plataforma ou serviço online:

**1. Escolha a plataforma ou serviço**: Decide qual plataforma ou serviço você deseja criar uma conta, como um site de rede social, um serviço de email, um banco online, etc.

**2. Acesse o site**: Abra um navegador e acesse o site da plataforma ou serviço escolhido.

**3. Clique em "Criar conta" ou "Inscrever-se"**: Procure o botão "Criar conta" ou "Inscrever-se" e clique nele.

**4. Forneça informações básicas**: Você será solicitado a fornecer informações básicas, como:
	* Nome e sobrenome
	* Endereço de email (que será usado como login)
	* Senha
	* Data de nascimento
	* Gênero (opcional)

**5. Confirme seu email**: Em alguns casos, você receberá um email de confirmação. Abra o email e clique no link de confirmação para ativar sua conta.

**6. Adicione informações adicionais (opcional)**: Dependendo da plataforma ou serviço, você pode ser solicitado a fornecer informações adicionais, como endereço, telefone, etc.

**7. Leia e aceite os termos de serviço**: Leia os termos de serviço e política de privacidade da plataforma ou serviço e marque a caixa de seleção para aceitar.

**8. Clique em "Criar conta"**: Clique no botão "Criar conta" para finalizar o processo.

**9. Verifique sua conta**: Verifique se sua conta foi criada com sucesso e se você pode acessá-la com seu login e senha.

Lembre-se de que os passos podem variar ligeiramente dependendo da plataforma ou serviço escolhido. Além disso, é importante lembrar de criar uma senha forte e única para sua conta.

###Definindo o contexto

In [None]:
context = """
Como criar uma conta, Baixe o app do Banco Next na playstore '.

"""

prompt = f"""
Como criar uma conta na Next?

Contexto: {context}
"""
#definindo um contexto

In [None]:
prompt

"\nComo criar uma conta na Next?\n\nContexto: \nComo criar uma conta, Baixe o app do Banco Next na playstore '.\n\n\n"

In [None]:
res = chain.invoke({"prompt": prompt})
show_res(res)
#gerando resposta baseada no prompt

Olá!

Para criar uma conta no Banco Next, siga os passos abaixo:

**Passo 1: Baixe o app do Banco Next**

Abra a Play Store (ou App Store, se você for um usuário de iOS) e procure pelo app do Banco Next. Clique em "Instalar" para baixar e instalar o aplicativo.

**Passo 2: Abra o app e escolha a opção de cadastro**

Após a instalação, abra o app do Banco Next. Você verá uma tela de boas-vindas com as opções "Entrar" e "Criar conta". Clique em "Criar conta".

**Passo 3: Insira seus dados pessoais**

Preencha o formulário com seus dados pessoais, como nome, cpf, data de nascimento, e-mail e telefone. Certifique-se de que os dados estejam corretos e atualizados.

**Passo 4: Crie uma senha**

Crie uma senha forte e única para sua conta do Banco Next. Lembre-se de que a senha deve ter no mínimo 8 caracteres, contendo letras e números.

**Passo 5: Confirme seu cadastro**

Confirme seu cadastro inserindo o código de verificação que você receberá via SMS ou e-mail.

**Passo 6: Adicione informações adicionais (opcional)**

Você pode ser solicitado a adicionar informações adicionais, como endereço e ocupação. Isso é opcional, mas pode ser necessário para utilizar determinados serviços do Banco Next.

**Passo 7: Verifique sua conta**

Agora, sua conta está criada! Verifique se todos os dados estão corretos e atualizados. Se necessário, faça as alterações necessárias.

E pronto! Agora você tem uma conta no Banco Next e pode começar a utilizar os serviços oferecidos pelo banco.

Se tiver alguma dúvida ou precisar de ajuda adicional, não hesite em contatar o suporte do Banco Next.

###Rag

In [None]:
template_rag = """
Pergunta: {input}
Contexto: {context}
"""
#definindo estrutura fixa

In [None]:
from langchain.prompts import PromptTemplate

prompt_rag = PromptTemplate.from_template(template_rag)
print(prompt_rag)

input_variables=['context', 'input'] input_types={} partial_variables={} template='\nPergunta: {input}\nContexto: {context}\n'


###Criação de Chain

In [None]:
chain_rag = prompt_rag | llm | StrOutputParser()

input = "como criar uma conta?"

res = chain_rag.invoke({"context": context, "input": input})

show_res(res)

Para criar uma conta no Banco Next, siga os passos abaixo:

1. Baixe o aplicativo do Banco Next na Play Store (ou App Store, se você tiver um iPhone).
2. Abra o aplicativo e clique em "Criar conta" ou "Registrar-se".
3. Preencha o formulário de cadastro com as informações solicitadas, como nome, e-mail, senha e outros dados pessoais.
4. Verifique seu e-mail e confirme o cadastro clicando no link de confirmação enviado pelo Banco Next.
5. Defina uma senha forte e segura para sua conta.
6. Adicione informações de contato, como número de telefone e endereço, se solicitado.
7. Leia e concorde com os termos e condições do Banco Next.
8. Clique em "Criar conta" para finalizar o processo de criação de conta.

Pronto! Sua conta no Banco Next está criada. Agora você pode acessar sua conta e começar a usar os serviços do banco.

Indexação -

In [None]:
from google.colab import files
uploaded = files.upload()
file_path = list(uploaded.keys())[0]
print(f"Arquivo carregado: {file_path}")
#preparando o documento

Saving regulamento_abertura_conta.pdf to regulamento_abertura_conta (1).pdf
Arquivo carregado: regulamento_abertura_conta (1).pdf


In [None]:
from pathlib import Path
from langchain_community.document_loaders import PyMuPDFLoader

file_path = "regulamento_abertura_conta.pdf"

loader = PyMuPDFLoader(file_path)
doc = loader.load()
doc[1]
#carregando documento pdf para usar como fonte de contexto - montando estrutura

Document(metadata={'producer': 'Adobe PDF Library 15.0', 'creator': 'Adobe InDesign 14.0 (Windows)', 'creationdate': '2020-02-18T16:28:54-03:00', 'source': 'regulamento_abertura_conta.pdf', 'file_path': 'regulamento_abertura_conta.pdf', 'total_pages': 23, 'format': 'PDF 1.4', 'title': '', 'author': '', 'subject': '', 'keywords': '', 'moddate': '2020-02-18T16:28:58-03:00', 'trapped': '', 'modDate': "D:20200218162858-03'00'", 'creationDate': "D:20200218162854-03'00'", 'page': 1}, page_content='2/23\nMOD.: 4769-023E                    VERSÃO: 02/2020\nRegulamento para Abertura de Contas de \nDepósito, Produtos e Serviços - Pessoa Física\nÍndice\nCartão Next..........\nRegulamento das Condições para Abertura, Movimentação, Manutenção e Encerramento de \nContas de Depósito, bem como Produtos e Serviços - Pessoa Física ...........\nI - Definições.............\nII - Condições para Abertura, Movimentação e Manutenção da Conta de Depósito\nIII - Tarifas, Taxas, Despesas e/ou outros Encargos \nI

In [None]:
import pprint

pprint.pp(doc[0].metadata)
#exibindo metadados

{'producer': 'Adobe PDF Library 15.0',
 'creator': 'Adobe InDesign 14.0 (Windows)',
 'creationdate': '2020-02-18T16:28:54-03:00',
 'source': 'regulamento_abertura_conta.pdf',
 'file_path': 'regulamento_abertura_conta.pdf',
 'total_pages': 23,
 'format': 'PDF 1.4',
 'title': '',
 'author': '',
 'subject': '',
 'keywords': '',
 'moddate': '2020-02-18T16:28:58-03:00',
 'trapped': '',
 'modDate': "D:20200218162858-03'00'",
 'creationDate': "D:20200218162854-03'00'",
 'page': 0}


In [None]:
len(doc[0].page_content)
#medindo o tamanho do texto da 1 página

1187

In [None]:
print(doc[0].page_content[:2000])
#exibindo os primeiros mil caracters

1/23
MOD.: 4769-023E                    VERSÃO: 02/2020
Regulamento para Abertura de Contas de 
Depósito, Produtos e Serviços - Pessoa Física
Importante:
- Emprestar sua Conta de Depósito para utilização por terceiros poderá acarretar problemas 
graves, inclusive, sob o ponto de vista legal;
- Não empreste sua Conta de Depósito ou o seu Cartão Next para utilização por terceiros;
- Cuidado com o uso de Códigos Secretos (Senhas). Eles são pessoais e intransferíveis.
Prezado Cliente,
Sem prejuízo do disposto neste Regulamento, a abertura, a manutenção, a movimentação 
e o encerramento de Contas de Depósito, bem como produtos e serviços bancários, são 
regulamentados por normas do Banco Central do Brasil, do Conselho Monetário Nacional 
(Circulares e Resoluções) e por Leis Federais que estipulam as responsabilidades de ambas as 
partes, as quais recomendamos a prévia leitura e entendimento.
O acesso às Circulares e Resoluções do Banco Central do Brasil e do Conselho Monetário Nacional, 
re

In [None]:
def extract_text_pdf(file_path):
  loader = PyMuPDFLoader(file_path)
  doc = loader.load()
  content = "\n".join([page.page_content for page in doc])
  return content
#extraindo todo texto em uma unica string

In [None]:
extract_text_pdf(file_path)

'1/23\nMOD.: 4769-023E                    VERSÃO: 02/2020\nRegulamento para Abertura de Contas de \nDepósito, Produtos e Serviços - Pessoa Física\nImportante:\n- Emprestar sua Conta de Depósito para utilização por terceiros poderá acarretar problemas \ngraves, inclusive, sob o ponto de vista legal;\n- Não empreste sua Conta de Depósito ou o seu Cartão Next para utilização por terceiros;\n- Cuidado com o uso de Códigos Secretos (Senhas). Eles são pessoais e intransferíveis.\nPrezado Cliente,\nSem prejuízo do disposto neste Regulamento, a abertura, a manutenção, a movimentação \ne o encerramento de Contas de Depósito, bem como produtos e serviços bancários, são \nregulamentados por normas do Banco Central do Brasil, do Conselho Monetário Nacional \n(Circulares e Resoluções) e por Leis Federais que estipulam as responsabilidades de ambas as \npartes, as quais recomendamos a prévia leitura e entendimento.\nO acesso às Circulares e Resoluções do Banco Central do Brasil e do Conselho Monetár

In [None]:
docs_path = Path("/content")
pdf_files = [f for f in docs_path.glob("*.pdf")]
print(pdf_files)
#listando

[PosixPath('/content/regulamento_abertura_conta.pdf')]


In [None]:
loaded_documents = [extract_text_pdf(pdf) for pdf in pdf_files]
len(pdf_files)
#carregando o documento na pasta

1

###Split

In [None]:
from langchain_text_splitters import RecursiveCharacterTextSplitter

text_splitter = RecursiveCharacterTextSplitter(chunk_size = 500, chunk_overlap=50)
chunks = []
for doc in loaded_documents:
  chunks.extend(text_splitter.split_text(doc))

print(f"Número de chunks criados: {len(chunks)}")
#dividindo o texto dos pdfs em chucks

Número de chunks criados: 186


In [None]:
from langchain_huggingface import HuggingFaceEmbeddings
from langchain.vectorstores import FAISS

embedding_model = "sentence-transformers/all-mpnet-base-v2"
#embedding_model = "BAAI/bge-m3"

embeddings = HuggingFaceEmbeddings(model_name = embedding_model)

input_test = "Um teste apenas"

result = embeddings.embed_query(input_test)
#criando reprsentações vetoriais

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


modules.json:   0%|          | 0.00/349 [00:00<?, ?B/s]

config_sentence_transformers.json:   0%|          | 0.00/116 [00:00<?, ?B/s]

README.md: 0.00B [00:00, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/53.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/571 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/438M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/363 [00:00<?, ?B/s]

vocab.txt: 0.00B [00:00, ?B/s]

tokenizer.json: 0.00B [00:00, ?B/s]

special_tokens_map.json:   0%|          | 0.00/239 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/190 [00:00<?, ?B/s]

In [None]:
len(result)

768

In [None]:
print(result)

[-0.026895038783550262, -0.011064727790653706, -0.04532000422477722, -0.0013972934102639556, 0.04243597015738487, -0.014201696030795574, 0.023354969918727875, 0.06011558324098587, 0.06152193248271942, 0.006502091884613037, 0.008159181103110313, -0.03056747280061245, 0.002060319297015667, 0.0129615543410182, 0.0042511713691055775, 0.0036631484981626272, -0.026755547150969505, 0.029737001284956932, -0.009770059026777744, -0.04650460556149483, -0.028108958154916763, 0.00016859530296642333, -0.02481103502213955, -0.01182831171900034, 0.0818282887339592, 0.0014993064105510712, 0.013264846988022327, -0.0624217726290226, -0.0012287232093513012, 0.02897718735039234, -0.02952898107469082, -0.02569606713950634, 0.0033771232701838017, -0.028868917375802994, 1.518517706244893e-06, -0.038824815303087234, -0.019842024892568588, -0.01765807531774044, -0.008112371899187565, -0.025130528956651688, 0.02574918232858181, 0.11367510259151459, -0.006133151240646839, -0.017986435443162918, -0.045411463826894

### Armazenamento - Geração de embeddings e indexação

In [None]:
len(chunks)

186

In [None]:
chunks[0]

'1/23\nMOD.: 4769-023E                    VERSÃO: 02/2020\nRegulamento para Abertura de Contas de \nDepósito, Produtos e Serviços - Pessoa Física\nImportante:\n- Emprestar sua Conta de Depósito para utilização por terceiros poderá acarretar problemas \ngraves, inclusive, sob o ponto de vista legal;\n- Não empreste sua Conta de Depósito ou o seu Cartão Next para utilização por terceiros;\n- Cuidado com o uso de Códigos Secretos (Senhas). Eles são pessoais e intransferíveis.\nPrezado Cliente,'

###Armazenando no banco de dados vetorial

In [None]:
vectorstore = FAISS.from_texts(chunks, embedding=embeddings)

###Salvando Indice Faiss

In [None]:
vectorstore.save_local("index_faiss")
# salva o índice FAISS no diretório local para reutilização futura

###Configurando o recuperador de texto / Retriever

In [None]:
retriever = vectorstore.as_retriever(search_type = "similarity", search_kwargs={"k": 6})
retriever
#cria um buscador baseado em similaridade (usa FAISS para encontrar os chunks mais parecidos)

VectorStoreRetriever(tags=['FAISS', 'HuggingFaceEmbeddings'], vectorstore=<langchain_community.vectorstores.faiss.FAISS object at 0x7a66a863b250>, search_kwargs={'k': 6})

###Geração

In [None]:
prompt_rag = PromptTemplate(
    input_variables=["context", "input"],
    template=template_rag,
)
prompt_rag
#criando o template de prompt que será usado com os textos recuperados e a pergunta do usuário

PromptTemplate(input_variables=['context', 'input'], input_types={}, partial_variables={}, template='\nPergunta: {input}\nContexto: {context}\n')

In [None]:
from langchain_core.runnables import RunnablePassthrough

chain_rag = (
    {"context": retriever, "input": RunnablePassthrough()}
    | prompt_rag
    | llm
    | StrOutputParser()
)
#montando a cadeia Rag

In [None]:
res = chain_rag.invoke("Qual é o público alvo do banco?")
show_res(res)
#executando o sistema

Com base nos documentos fornecidos, é possível inferir que o público alvo do banco são pessoas físicas que desejam abrir contas de depósito, produtos e serviços bancários. Isso é sugerido pelas referências a "Pessoa Física" nos títulos de alguns documentos e pela linguagem utilizada, que se dirige a um indivíduo ("Prezado Cliente"). Além disso, as informações fornecidas nos documentos se relacionam a produtos e serviços bancários que são comumente utilizados por indivíduos, como contas de depósito, cartões, empréstimos e serviços de pagamento.

###Melhorando o prompt

In [None]:
system_prompt = """Você é um assistente virtual chamado Nx, você é prestativo e está respondendo perguntas gerais sobre os serviços de uma empresa.
Use os seguintes pedaços de contexto recuperado para responder à pergunta.
Se você não sabe a resposta, apenas comente que não sabe dizer com certeza.
Mas caso seja uma dúvida muito comum, pode sugerir como alternativa uma solução possível.
Mantenha a resposta concisa.
Responda em português. \n\n"""

qa_prompt = ChatPromptTemplate.from_messages(
    [
        ("system", system_prompt),
        ("human", "Pergunta: {input}\n\n Contexto: {context}"),
    ]
)
qa_prompt

ChatPromptTemplate(input_variables=['context', 'input'], input_types={}, partial_variables={}, messages=[SystemMessagePromptTemplate(prompt=PromptTemplate(input_variables=[], input_types={}, partial_variables={}, template='Você é um assistente virtual chamado Nx, você é prestativo e está respondendo perguntas gerais sobre os serviços de uma empresa.\nUse os seguintes pedaços de contexto recuperado para responder à pergunta.\nSe você não sabe a resposta, apenas comente que não sabe dizer com certeza.\nMas caso seja uma dúvida muito comum, pode sugerir como alternativa uma solução possível.\nMantenha a resposta concisa.\nResponda em português. \n\n'), additional_kwargs={}), HumanMessagePromptTemplate(prompt=PromptTemplate(input_variables=['context', 'input'], input_types={}, partial_variables={}, template='Pergunta: {input}\n\n Contexto: {context}'), additional_kwargs={})])

In [None]:
chain_rag = (
    {"context": retriever, "input": RunnablePassthrough()}
    | qa_prompt
    | llm
    | StrOutputParser()
)

res = chain_rag.invoke("Como abrir uma conta?")
show_res(res)
#montando a cadeia rag

Olá! Para abrir uma conta na nossa empresa, você precisará preencher a Ficha-Proposta ou o Termo de Adesão. Além disso, é importante ler e concordar com as condições estabelecidas no Regulamento para Abertura de Contas de Depósito, Produtos e Serviços - Pessoa Física. Se tiver alguma dúvida ou precisar de mais informações, por favor, não hesite em contato conosco.

###Melhorar no método de busca

In [None]:
retriever = vectorstore.as_retriever(
    search_type='mmr',
    search_kwargs={'k':3, 'fetch_k':4}
)
#equilibrando relevancia e diversidade

###Pipeline Rag

In [None]:
from langchain_core.prompts import MessagesPlaceholder
from langchain_core.messages import AIMessage, HumanMessage
from langchain.chains import create_history_aware_retriever, create_retrieval_chain
from langchain.chains.combine_documents import create_stuff_documents_chain

context_q_system_prompt = "Given the following chat history and the follow-up question which might reference context in the chat history, formulate a standalone question which can be understood without the chat history. Do NOT answer the question, just reformulate it if needed and otherwise return it as is."
context_q_system_prompt = context_q_system_prompt
context_q_user_prompt = "Question: {input}"
context_q_prompt = ChatPromptTemplate.from_messages(
    [
        ("system", context_q_system_prompt),
        MessagesPlaceholder("chat_history"),
        ("human", context_q_user_prompt),
    ]
)
#instruções para o modelo reformular a pergunta levando em conta o histórico da conversa,

In [None]:
history_aware_retriever = create_history_aware_retriever(
    llm = llm, retriever = retriever, prompt = context_q_prompt
)
#criando um retriever que intende o historico da conversa

In [None]:
qa_prompt = ChatPromptTemplate.from_messages([
    ("system", system_prompt),
    MessagesPlaceholder("chat_history"),
    ("human", "Pergunta: {input}\n\n Contexto: {context}"),
])

qa_chain = create_stuff_documents_chain(llm, qa_prompt)

rag_chain = create_retrieval_chain(history_aware_retriever, qa_chain)
#chain para perguntas e respostas

In [None]:
from langchain_core.prompts import MessagesPlaceholder
from langchain_core.messages import AIMessage, HumanMessage
from langchain.chains import create_history_aware_retriever, create_retrieval_chain
from langchain.chains.combine_documents import create_stuff_documents_chain

def config_rag_chain(llm, retriever):

    # Prompt de contextualização
    context_q_system_prompt = "Given the following chat history and the follow-up question which might reference context in the chat history, formulate a standalone question which can be understood without the chat history. Do NOT answer the question, just reformulate it if needed and otherwise return it as is."

    context_q_system_prompt = context_q_system_prompt
    context_q_user_prompt = "Question: {input}"
    context_q_prompt = ChatPromptTemplate.from_messages(
        [
            ("system", context_q_system_prompt),
            MessagesPlaceholder("chat_history"),
            ("human", context_q_user_prompt),
        ]
    )

    # Chain para contextualização
    history_aware_retriever = create_history_aware_retriever(
        llm=llm, retriever=retriever, prompt=context_q_prompt
    )

    # Prompt para perguntas e respostas (Q&A)
    system_prompt = """Você é o NX um assistente virtual prestativo e está respondendo perguntas gerais sobre os serviços de uma empresa.
    Use os seguintes pedaços de contexto recuperado para responder à pergunta.
    Se você não sabe a resposta, apenas comente que não sabe dizer com certeza.
    Mas caso seja uma dúvida muito comum, pode sugerir como alternativa uma solução possível.
    Mantenha a resposta concisa.
    Responda em português. \n\n"""

    qa_prompt = ChatPromptTemplate.from_messages([
        ("system", system_prompt),
        MessagesPlaceholder("chat_history"),
        ("human", "Pergunta: {input}\n\n Contexto: {context}"),
    ])

    # Configurar LLM e Chain para perguntas e respostas (Q&A)

    qa_chain = create_stuff_documents_chain(llm, qa_prompt)

    rag_chain = create_retrieval_chain(
        history_aware_retriever,
        qa_chain,
    )

    return rag_chain

###Adicionando historio da converssa

In [None]:
store = {}

In [None]:
from langchain_core.runnables.history import RunnableWithMessageHistory
from langchain_community.chat_message_histories import ChatMessageHistory
from langchain_core.chat_history import BaseChatMessageHistory

def get_session_history(session_id: str) -> BaseChatMessageHistory:
  if session_id not in store:
    store[session_id] = ChatMessageHistory()
  return store[session_id]
#criando uma função para gerenciar o histórico de chat por sessão

In [None]:
qa_chain_with_history = RunnableWithMessageHistory(
    qa_chain,
    get_session_history,
    input_messages_key = "input",
    history_messages_key = "chat_history"
)

In [None]:
session_id = "usuario_42"

In [None]:
response1 = qa_chain_with_history.invoke(
    {"input": "O que é necessário para abrir uma conta?", "context": ""},
    config = {"configurable": {"session_id": session_id}}
)
print(response1)

Olá! Para abrir uma conta, você precisará fornecer algumas informações básicas, como seu nome, endereço, data de nascimento, e-mail e telefone. Além disso, você também precisará de um documento de identificação válido, como um RG ou CPF, e uma prova de residência. Isso pode variar dependendo do tipo de conta que você deseja abrir, então é sempre uma boa ideia verificar os requisitos específicos com a nossa equipe de atendimento.


In [None]:
response2 = qa_chain_with_history.invoke(
    {"input": "Qual minha última pergunta?", "context": ""},
    config={"configurable": {"session_id": session_id}},
)
print(response2)
#tstando memoria

Sua última pergunta foi "Qual minha última pergunta?"


###Passando histórico de chat à Chain

In [None]:
rag_chain = config_rag_chain(llm, retriever)
# juntando o modelo (llm), o sistema de recuperação com histórico (retriever) e os prompts configurados na função config_rag_chain.

In [None]:
chat_history = []
# criando uma lista vazia para armazenar o histórico da conversa manualmente

In [None]:
input = "como abrir uma conta"

chat_history.append(HumanMessage(content=input))

result = rag_chain.invoke({"input": input, "chat_history": chat_history})

res = result['answer']
print(res)

chat_history.append(AIMessage(content=res))
#fluxo básico de uma conversa com histórico manual, usando o rag_chain

Olá!

Para abrir uma conta, você pode utilizar os serviços da Central de Relacionamento Next, que oferece atendimento pessoal por meio de chat, e-mail e ligação telefônica. Basta entrar em contato com a Central de Relacionamento Next e solicitar a abertura de uma conta.


In [None]:
chat_history

[HumanMessage(content='como abrir uma conta', additional_kwargs={}, response_metadata={}),
 AIMessage(content='Infelizmente, o contexto fornecido não apresenta informações específicas sobre como abrir uma conta. No entanto, posso sugerir que você visite o site da empresa ou contate um representante para obter mais informações sobre o processo de abertura de conta. Geralmente, é necessário fornecer documentos de identificação, como RG e CPF, e preencher um formulário de abertura de conta.', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='como abrir uma conta', additional_kwargs={}, response_metadata={}),
 AIMessage(content='Olá!\n\nPara abrir uma conta, você pode utilizar os serviços da Central de Relacionamento Next, que oferece atendimento pessoal por meio de chat, e-mail e ligação telefônica. Basta entrar em contato com a Central de Relacionamento Next e solicitar a abertura de uma conta.', additional_kwargs={}, response_metadata={})]

In [None]:
input = "Qual foi minha última pergunta?"
result = rag_chain.invoke({
    "input": input,
    "chat_history": chat_history
})
res = result["answer"]
print(res)
#historico da conversa para responder as perguntas

Sua última pergunta foi "como abrir uma conta".


###Configuração a função de Indexação e Recuperação

In [None]:
from pathlib import Path
from langchain_community.document_loaders import PyMuPDFLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_huggingface import HuggingFaceEmbeddings
from langchain.vectorstores import FAISS

def config_retriever(folder_path="/content"):
    # Carregar documentos
    docs_path = Path("/content")
    pdf_files = [f for f in docs_path.glob("*.pdf")]

    loaded_documents = [extract_text_pdf(pdf) for pdf in pdf_files]

    # Divisão em pedaços de texto / Split
    text_splitter = RecursiveCharacterTextSplitter(
        chunk_size=1000,
        chunk_overlap=200
    )
    chunks = []
    for doc in loaded_documents:
        chunks.extend(text_splitter.split_text(doc))

    # Embeddings
    embedding_model = "BAAI/bge-m3"

    embeddings = HuggingFaceEmbeddings(model_name=embedding_model)

    # Armazenamento
    vectorstore = FAISS.from_texts(chunks, embedding=embeddings)

    vectorstore.save_local('index_faiss')

    # Configurando o recuperador de texto / Retriever
    retriever = vectorstore.as_retriever(
        search_type='mmr',
        search_kwargs={'k':3, 'fetch_k':4}
    )

    return retriever

In [None]:
retriever = config_retriever()
#executando a função config_retriever() e armazenando o objeto retriever na variável retriever

modules.json:   0%|          | 0.00/349 [00:00<?, ?B/s]

config_sentence_transformers.json:   0%|          | 0.00/123 [00:00<?, ?B/s]

README.md: 0.00B [00:00, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/54.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/687 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/2.27G [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/2.27G [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/444 [00:00<?, ?B/s]

sentencepiece.bpe.model:   0%|          | 0.00/5.07M [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/17.1M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/964 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/191 [00:00<?, ?B/s]

In [None]:
rag_chain = config_rag_chain(llm, retriever)
#unindo o modelo llm com o retriever

###Junção da pipeline final + Conclusão

In [None]:
def chat_llm(rag_chain, input, chat_history):
  chat_history.append(HumanMessage(content = input))

  response = rag_chain.invoke({
      "input": input,
      "chat_history": chat_history
  })

  res = response["answer"]

  chat_history.append(AIMessage(content = res))

  return chat_history

In [None]:
chat_history = []

In [None]:
input = "olá! como criar uma conta?"  # @param {type:"string"}

chat_history = chat_llm(rag_chain, input, chat_history)
#fazendo pergunta

In [None]:
chat_history

[HumanMessage(content='olá! como criar uma conta?', additional_kwargs={}, response_metadata={}),
 AIMessage(content='Olá!\n\nPara criar uma conta, você pode seguir os seguintes passos:\n\n1. Baixe o Aplicativo Next;\n2. Acesse o Aplicativo e siga as instruções para criar sua conta;\n3. Crie suas senhas (Senha/Código Secreto) que serão suas assinaturas eletrônicas;\n4. Leia e aceite o Termo de Adesão e o Regulamento para Abertura de Contas de Depósito, Produtos e Serviços.\n\nLembre-se de que as senhas são pessoais e intransferíveis, então mantenha-as seguras!\n\nSe tiver alguma dúvida adicional, sinta-se à vontade para perguntar!', additional_kwargs={}, response_metadata={})]

###Interface com streamlit

In [None]:
!pip install -q streamlit python-dotenv
!npm install -q localtunnel
#instalando dependencia

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m44.3/44.3 kB[0m [31m1.9 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m9.9/9.9 MB[0m [31m50.4 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m6.9/6.9 MB[0m [31m67.2 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m79.1/79.1 kB[0m [31m5.4 MB/s[0m eta [36m0:00:00[0m
[?25h[1G[0K⠙[1G[0K⠹[1G[0K⠸[1G[0K⠼[1G[0K⠴[1G[0K⠦[1G[0K⠧[1G[0K⠇[1G[0K⠏[1G[0K⠋[1G[0K⠙[1G[0K⠹[1G[0K⠸[1G[0K⠼[1G[0K⠴[1G[0K⠦[1G[0K⠧[1G[0K⠇[1G[0K⠏[1G[0K⠋[1G[0K⠙[1G[0K⠹[1G[0K⠸[1G[0K⠼[1G[0K⠴[1G[0K⠦[1G[0K⠧[1G[0K
added 22 packages in 3s
[1G[0K⠧[1G[0K
[1G[0K⠧[1G[0K3 packages are looking for funding
[1G[0K⠧[1G[0K  run `npm fund` for details
[1G[0K⠧[1G[0K

###Conclusão do Projeto

In [None]:
%%writefile .env
GROQ_API_KEY=#######

Writing .env


In [None]:
%%writefile app02.py
import streamlit as st
from langchain_groq import ChatGroq
from langchain_core.prompts import ChatPromptTemplate
from pathlib import Path
from langchain_community.document_loaders import PyMuPDFLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_huggingface import HuggingFaceEmbeddings
from langchain_core.prompts import MessagesPlaceholder
from langchain_core.messages import AIMessage, HumanMessage
from langchain.chains import create_history_aware_retriever, create_retrieval_chain
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain.vectorstores import FAISS
from dotenv import load_dotenv
load_dotenv()

st.set_page_config(page_title="Atendimento Next 🤖", page_icon="🤖")
st.title("Atendimento Next")

id_model = "deepseek-r1-distill-llama-70b"
temperature = 0.7
path = "/content"

### Carregamento da LLM
def load_llm(id_model, temperature):
  llm = ChatGroq(
    model=id_model,
    temperature=temperature,
    max_tokens=None,
    timeout=None,
    max_retries=2,
  )
  return llm

llm = load_llm(id_model, temperature)

### Exibição do resultado
def show_res(res):
  from IPython.display import Markdown
  if "</think>" in res:
    res = res.split("</think>")[-1].strip()
  else:
    res = res.strip()  # fallback se não houver tag
  display(Markdown(res))

### Extração do conteúdo
def extract_text_pdf(file_path):
  loader = PyMuPDFLoader(file_path)
  doc = loader.load()
  content = "\n".join([page.page_content for page in doc])
  return content

### Indexação e recuperação
def config_retriever(folder_path="/content"):
  # Carregar documentos
  docs_path = Path("/content")
  pdf_files = [f for f in docs_path.glob("*.pdf")]

  if len(pdf_files) < 1:
    st.error("Nenhum arquivo PDF carregado")
    st.stop()

  loaded_documents = [extract_text_pdf(pdf) for pdf in pdf_files]

  # Divisão em pedaços de texto / Split
  text_splitter = RecursiveCharacterTextSplitter(
      chunk_size=1000,
      chunk_overlap=200
  )
  chunks = []
  for doc in loaded_documents:
      chunks.extend(text_splitter.split_text(doc))

  # Embeddings
  embedding_model = "BAAI/bge-m3" #sentence-transformers/all-mpnet-base-v2

  embeddings = HuggingFaceEmbeddings(model_name=embedding_model)

  # Armazenamento
  vectorstore = FAISS.from_texts(chunks, embedding=embeddings)

  vectorstore.save_local('index_faiss')

  # Configurando o recuperador de texto / Retriever
  retriever = vectorstore.as_retriever(
      search_type='mmr',
      search_kwargs={'k':3, 'fetch_k':4}
  )

  return retriever

### Chain da RAG
def config_rag_chain(llm, retriever):

  # Prompt de contextualização
  context_q_system_prompt = "Given the following chat history and the follow-up question which might reference context in the chat history, formulate a standalone question which can be understood without the chat history. Do NOT answer the question, just reformulate it if needed and otherwise return it as is."

  context_q_system_prompt = context_q_system_prompt
  context_q_user_prompt = "Question: {input}"
  context_q_prompt = ChatPromptTemplate.from_messages(
      [
          ("system", context_q_system_prompt),
          MessagesPlaceholder("chat_history"),
          ("human", context_q_user_prompt),
      ]
  )

  # Chain para contextualização
  history_aware_retriever = create_history_aware_retriever(
    llm=llm, retriever=retriever, prompt=context_q_prompt
  )

  # Prompt para perguntas e respostas (Q&A)
  system_prompt = """Você é um assistente virtual prestativo chamado NX e está respondendo perguntas gerais sobre os serviços de uma empresa.
  Use os seguintes pedaços de contexto recuperado para responder à pergunta.
  Se você não sabe a resposta, apenas comente que não sabe dizer com certeza.
  Mas caso seja uma dúvida muito comum, pode sugerir como alternativa uma solução possível.
  Mantenha a resposta concisa.
  Responda em português. \n\n"""

  qa_prompt = ChatPromptTemplate.from_messages([
    ("system", system_prompt),
    MessagesPlaceholder("chat_history"),
    ("human", "Pergunta: {input}\n\n Contexto: {context}"),
  ])

  # Configurar LLM e Chain para perguntas e respostas (Q&A)

  qa_chain = create_stuff_documents_chain(llm, qa_prompt)

  rag_chain = create_retrieval_chain(
    history_aware_retriever,
    qa_chain,
  )

  return rag_chain

### Interação com chat
def chat_llm(rag_chain, input):

  st.session_state.chat_history.append(HumanMessage(content=input))

  response = rag_chain.invoke({
      "input": input,
      "chat_history": st.session_state.chat_history
  })

  res = response["answer"]
  res = res.split("</think>")[-1].strip() if "</think>" in res else res.strip()

  st.session_state.chat_history.append(AIMessage(content=res))

  return res

input = st.chat_input("Digite sua mensagem aqui...")

if "chat_history" not in st.session_state:
  st.session_state.chat_history = [
      AIMessage(content = "Olá, sou o NX seu assistente virtual! Como posso te ajudar?"),
  ]

if "retriever" not in st.session_state:
  st.session_state.retriever = None

for message in st.session_state.chat_history:
  if isinstance(message, AIMessage):
    with st.chat_message("AI"):
      st.write(message.content)
  elif isinstance(message, HumanMessage):
    with st.chat_message("Human"):
      st.write(message.content)

if input is not None:
  with st.chat_message("Human"):
    st.markdown(input)

  with st.chat_message("AI"):
    if st.session_state.retriever is None:
      st.session_state.retriever = config_retriever(path)
    rag_chain = config_rag_chain(llm, st.session_state.retriever)
    res = chat_llm(rag_chain, input)
    st.write(res)

Overwriting app02.py


In [None]:
!streamlit run app02.py &>/content/logs.txt &

!wget -q -O - ipv4.icanhazip.com
!npx localtunnel --port 8501

34.31.237.222
[1G[0K⠙[1G[0Kyour url is: https://flat-schools-sink.loca.lt
