# C√©lula 1: AGENTE01 ‚Äî Agente de IA para Perguntas e Respostas

Este agente tem como objetivo responder a perguntas feitas pelo usu√°rio com base em um conte√∫do pr√©-carregado (como arquivos `.txt`, `.pdf` ou outros documentos). 

A ideia central √© criar uma interface simples e funcional para interagir com um LLM (Large Language Model), utilizando ferramentas como:

- **LangChain**: para orquestra√ß√£o do agente e carregamento dos dados
- **Modelos Hugging Face**: para gerar respostas com base nos dados
- **Chroma**: para armazenar embeddings e fazer buscas sem√¢nticas

---

## Aplica√ß√µes poss√≠veis:
- Consulta a manuais t√©cnicos
- Resumo de relat√≥rios
- Atendimento autom√°tico baseado em documentos

---

## Etapas abordadas neste notebook:

**üîπ C√©lula 2 ‚Äì Defini√ß√£o do texto base**
- Define manualmente o conte√∫do de conhecimento.
- Utilizado como contexto para gera√ß√£o de embeddings e respostas.

**üîπ C√©lula 3 ‚Äì Gera√ß√£o de embeddings com modelo local**
- Cria um documento LangChain a partir do texto.
- Divide o conte√∫do em partes com o `CharacterTextSplitter`.
- Gera embeddings com modelo local `sentence-transformers/all-MiniLM-L6-v2`.
- Armazena os embeddings em uma base Chroma para consultas futuras.

**üîπ C√©lula 4 ‚Äì Consulta sem√¢ntica**
- Recebe uma pergunta do usu√°rio via `input()`.
- Recupera os documentos mais relevantes da base vetorial.
- Exibe o conte√∫do mais semelhante para uso como contexto.

**üîπ C√©lula 5 ‚Äì Simula√ß√£o automatizada**
- Cont√©m uma pergunta fixa (sem input) para simular a consulta autom√°tica.
- Realiza busca sem√¢ntica e exibe o conte√∫do retornado.

**üîπ C√©lula 6 ‚Äì Execu√ß√£o do agente com modelo generativo (FLAN-T5)**
- Usa `pipeline` com o modelo `google/flan-t5-base`.
- Monta o prompt com o texto base e a pergunta.
- Gera uma resposta textual com base no contexto.
- OBS: O modelo √© treinado em ingl√™s, mas pode responder em portugu√™s.

**üîπ C√©lula 7 ‚Äì Execu√ß√£o do agente com modelo generativo (mT5)**
- Usa o modelo `google/mt5-small`, com suporte multil√≠ngue.
- Gera respostas mais completas em portugu√™s, a partir do conte√∫do carregado.

---


In [None]:
"""
C√©lula 2: Bibliotecas principais do agente local
    Esta c√©lula instala as bibliotecas necess√°rias para o agente local.
"""

executar_celula_5 = False

if executar_celula_5:
    # Bibliotecas principais do agente local
    !pip install -U langchain langchain-community chromadb tiktoken sentence-transformers transformers
    # Leitura de documentos (opcional)
    !pip install unstructured pdfminer.six python-docx
    # (Opcional) Interface interativa
    !pip install ipywidgets
    !pip install blobfile
    !pip install sentencepiece
    !pip install sacremoses

else:
    # c√≥digo da c√©lula 5
    print("Execu√ß√£o interrompida da c√©lula...")


Execu√ß√£o interrompida da c√©lula...


In [2]:
"""
C√©lula 3: Carregamento de conte√∫do fixo e cria√ß√£o dos embeddings locais

Esta c√©lula:
- Define um texto manual como base de conhecimento
- Separa o texto em pequenos blocos (chunking)
- Gera embeddings com modelo local HuggingFace (sentence-transformers)
- Armazena os embeddings em uma base vetorial local usando Chroma
"""

from langchain.embeddings import HuggingFaceEmbeddings
from langchain.vectorstores import Chroma
from langchain.text_splitter import CharacterTextSplitter
from langchain.docstore.document import Document


# Texto fixo como exemplo de base de conhecimento
texto = """
A intelig√™ncia artificial (IA) √© o ramo da ci√™ncia da computa√ß√£o que se dedica a criar sistemas capazes de executar tarefas que normalmente exigiriam intelig√™ncia humana.
Essas tarefas incluem reconhecimento de fala, tomada de decis√µes, tradu√ß√£o de idiomas e muito mais.
Os agentes de IA utilizam modelos treinados em grandes quantidades de dados para realizar infer√™ncias e responder a comandos.
"""

# Separar o texto em blocos menores para melhor indexa√ß√£o
text_splitter = CharacterTextSplitter(chunk_size=300, chunk_overlap=20)
documentos = text_splitter.split_documents([Document(page_content=texto)])

# Gerar embeddings locais com modelo Hugging Face
embedding = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")

# Criar e armazenar os vetores em uma base vetorial local com Chroma
vectorstore = Chroma.from_documents(documentos, embedding=embedding)

  embedding = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")


In [3]:
"""
C√©lula 4: Execu√ß√£o do agente de perguntas e respostas

Esta c√©lula:
- Recebe uma pergunta do usu√°rio
- Usa o modelo local 'deepset/roberta-base-squad2' via Transformers
- Retorna a resposta com base no texto carregado
- Modelo com resposta a perguntas (QA) local, roberta-base-squad2, RESPOSTAS GENERICAS
"""

from transformers import pipeline

# Pipeline de QA
qa_pipeline = pipeline("question-answering", model="deepset/roberta-base-squad2")

# Texto base como contexto
contexto = texto

# # Intera√ß√£o
# pergunta = input("Digite sua pergunta: ")
# resposta = qa_pipeline(question=pergunta, context=contexto)


# Pergunta simulada
pergunta = "Que tarefas a IA pode executar, segundo o texto?"
resposta = qa_pipeline(question=pergunta, context=contexto)


print("Pergunta:", pergunta)
print("Resposta:", resposta['answer'])


Device set to use cpu


Pergunta: Que tarefas a IA pode executar, segundo o texto?
Resposta: normalmente exigiriam intelig√™ncia humana


In [4]:
"""
C√©lula 5: Execu√ß√£o do agente de perguntas e respostas

Esta c√©lula:
- Recebe uma pergunta do usu√°rio
- Usa o modelo local 'distilbert-base-cased-distilled-squad' via Transformers
- Retorna a resposta com base no texto carregado
- Modelo com resposta a perguntas (QA) local, model="distilbert-base-cased-distilled-squad RESPOSTAS GENERICAS
"""

from transformers import pipeline

# Modelo alternativo mais objetivo
qa_pipeline = pipeline("question-answering", model="distilbert-base-cased-distilled-squad")

# Texto de contexto da c√©lula 3
contexto = texto

# Pergunta simulada
pergunta = "Que tarefas a IA pode executar, segundo o texto?"

# Gera√ß√£o da resposta
resposta = qa_pipeline(question=pergunta, context=contexto)

print("Pergunta:", pergunta)
print("Resposta:", resposta['answer'])


Device set to use cpu


Pergunta: Que tarefas a IA pode executar, segundo o texto?
Resposta: normalmente exigiriam intelig√™ncia humana


In [5]:
"""
C√©lula 6: Execu√ß√£o do agente de perguntas e respostas

Esta c√©lula:
- Recebe uma pergunta do usu√°rio
- usar modelo generativo para perguntas e respostas
- Retorna a resposta com base no texto carregado
- Modelo com resposta a perguntas (QA) local, model=google/flan-t5-base RESPOSTAS MAIS COMPLETAS
- Usa o modelo google/flan-t5-base para gerar respostas completas com base no contexto.

Obs.: Treinado em ingl√™s, mas pode responder em portugu√™s
"""

from transformers import pipeline

# Pipeline de gera√ß√£o de texto com modelo T5
qa_pipeline = pipeline("text2text-generation", model="google/flan-t5-base")

# Montar prompt com contexto
prompt = f"Liste as tarefas que a intelig√™ncia artificial pode executar, segundo o texto: {texto}"

# Gerar resposta
resposta = qa_pipeline(prompt, max_length=60, do_sample=False)

print("Pergunta:", prompt)
print("Resposta:", resposta[0]['generated_text'])


Device set to use cpu
Both `max_new_tokens` (=256) and `max_length`(=60) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)


Pergunta: Liste as tarefas que a intelig√™ncia artificial pode executar, segundo o texto: 
A intelig√™ncia artificial (IA) √© o ramo da ci√™ncia da computa√ß√£o que se dedica a criar sistemas capazes de executar tarefas que normalmente exigiriam intelig√™ncia humana.
Essas tarefas incluem reconhecimento de fala, tomada de decis√µes, tradu√ß√£o de idiomas e muito mais.
Os agentes de IA utilizam modelos treinados em grandes quantidades de dados para realizar infer√™ncias e responder a comandos.

Resposta: List as tasks that artificial intelligence (AI) can execute, secondo o texto: Artificial intelligence (AI) √© o ramo da ci√™ncia da computa√ßo que se dedica a criar sistemas capazes de executar tasks that normally require human intelligence. These tasks include reconhecimento de fala, tomada decises, traducio de idiomas e muito mais. The agents of AI use three-dimensional models in large quantities of data to perform inferences and respond to commands.


In [6]:
"""
C√©lula 7: Execu√ß√£o do agente com modelo generativo (google/mt5-small)

Esta c√©lula:
- Recebe uma pergunta do usu√°rio como prompt
- Utiliza um modelo generativo para responder com base no texto carregado
- Emprega o modelo local 'google/mt5-small', que oferece suporte multil√≠ngue, incluindo o portugu√™s
- Gera respostas mais completas e contextuais com base no conte√∫do fornecido
"""

from transformers import pipeline, AutoTokenizer, AutoModelForSeq2SeqLM

tokenizer = AutoTokenizer.from_pretrained("google/mt5-small", use_fast=False)
model = AutoModelForSeq2SeqLM.from_pretrained("google/mt5-small")

qa_pipeline = pipeline("text2text-generation", model=model, tokenizer=tokenizer)

# Reformulado com o prefixo "perguntar:", compat√≠vel com o estilo MT5
prompt = f"perguntar: Quais tarefas a intelig√™ncia artificial pode executar de acordo com o texto abaixo?\n{texto}"
prompt = f"perguntar: O que √© IA?\n{texto}"
# prompt = f"perguntar: Qual √© a previs√£o do tempo para amanh√£ em S√£o Paulo?\n{texto}"

# Lista de perguntas para testar o modelo
resposta = qa_pipeline(prompt, max_new_tokens=60, do_sample=False)

print(type(resposta))
print("Pergunta:", prompt)
print("Resposta:", resposta[0]['generated_text'])

You are using the default legacy behaviour of the <class 'transformers.models.t5.tokenization_t5.T5Tokenizer'>. This is expected, and simply means that the `legacy` (previous) behavior will be used so nothing changes for you. If you want to use the new behaviour, set `legacy=False`. This should only be set if you understand what it means, and thoroughly read the reason why this was added as explained in https://github.com/huggingface/transformers/pull/24565
Device set to use cpu


<class 'list'>
Pergunta: perguntar: O que √© IA?

A intelig√™ncia artificial (IA) √© o ramo da ci√™ncia da computa√ß√£o que se dedica a criar sistemas capazes de executar tarefas que normalmente exigiriam intelig√™ncia humana.
Essas tarefas incluem reconhecimento de fala, tomada de decis√µes, tradu√ß√£o de idiomas e muito mais.
Os agentes de IA utilizam modelos treinados em grandes quantidades de dados para realizar infer√™ncias e responder a comandos.

Resposta: <extra_id_0>.


In [7]:
"""
C√©lula 7: Execu√ß√£o do agente com modelo generativo (google/flan-t5-base)

Melhorias aplicadas:
- Texto base expandido
- Prompt reformulado com instru√ß√µes claras
- Aumento do n√∫mero de tokens para evitar corte da resposta
"""

import random
from transformers import pipeline, AutoTokenizer, AutoModelForSeq2SeqLM

# Texto expandido
texto = """
A intelig√™ncia artificial (IA) √© uma √°rea da ci√™ncia da computa√ß√£o que desenvolve sistemas capazes de simular a intelig√™ncia humana.
Esses sistemas aprendem com dados, identificam padr√µes, tomam decis√µes e resolvem problemas de maneira aut√¥noma ou assistida.
Entre as tarefas comuns da IA est√£o: reconhecimento de fala, tradu√ß√£o autom√°tica, an√°lise de imagens, automa√ß√£o de processos,
assistentes virtuais e recomenda√ß√£o personalizada de conte√∫dos. A IA est√° presente em √°reas como sa√∫de, finan√ßas, educa√ß√£o,
log√≠stica e atendimento ao cliente.
"""

# Dicion√°rio de perguntas por categoria
perguntas = {
    "definicao": [
        "O que √© intelig√™ncia artificial?",
        "Explique o conceito de IA.",
        "O que significa IA?"
    ],
    "tarefas": [
        "Quais tarefas a intelig√™ncia artificial pode executar?",
        "A IA pode reconhecer fala, traduzir idiomas e tomar decis√µes?",
        "Liste exemplos de atividades feitas por IA."
    ],
    "limites": [
        "Quais s√£o as limita√ß√µes da IA?",
        "A IA pode substituir completamente os humanos?",
        "A intelig√™ncia artificial pode tomar decis√µes sozinha?"
    ]
}

# Escolha aleat√≥ria
categoria = random.choice(list(perguntas.keys()))
pergunta = random.choice(perguntas[categoria])

# Prompt aprimorado
prompt = f"""
Com base no texto a seguir, responda √† pergunta de forma clara, completa e original.
Texto:
\"\"\"{texto}\"\"\"

Pergunta:
{pergunta}

Responda:
"""

# Modelo e pipeline
tokenizer = AutoTokenizer.from_pretrained("google/flan-t5-base")
model = AutoModelForSeq2SeqLM.from_pretrained("google/flan-t5-base")
qa_pipeline = pipeline("text2text-generation", model=model, tokenizer=tokenizer)

# Gera√ß√£o
resposta = qa_pipeline(prompt, max_new_tokens=150, do_sample=False)

# Exibir
print("Categoria:", categoria)
print("Pergunta:", pergunta)
print("Resposta:", resposta[0]["generated_text"])


Device set to use cpu


Categoria: definicao
Pergunta: Explique o conceito de IA.
Resposta: "" A intelig√™ncia artificial (IA) √© uma √°rea da ci√™ncia da computa√ßo que desenvolve sistemas capazes de simular intelig√™ncia humana. These systems aprendem com datos, identificam padres, tomam decises e resolvem problemas aut√¥noma ou assistida. Entre as tarefas comuns de IA esto: reconhecimento de fala, traducio autom√°tica, an√°lise de imagens, auto


In [8]:
"""
C√©lula 7: Execu√ß√£o do agente com modelo generativo (google/flan-t5-large)

Esta c√©lula:
- Define um dicion√°rio com perguntas agrupadas por categorias
- Seleciona aleatoriamente uma pergunta
- Utiliza o modelo local 'google/flan-t5-large', que oferece maior capacidade de compreens√£o
- Gera uma resposta com base no conte√∫do carregado como texto base
"""

import random
from transformers import pipeline, AutoTokenizer, AutoModelForSeq2SeqLM

# Texto fixo como base de conhecimento
texto = """
A intelig√™ncia artificial (IA) √© o ramo da ci√™ncia da computa√ß√£o que se dedica a criar sistemas capazes de executar tarefas que normalmente exigiriam intelig√™ncia humana.
Essas tarefas incluem reconhecimento de fala, tomada de decis√µes, tradu√ß√£o de idiomas e muito mais.
Os agentes de IA utilizam modelos treinados em grandes quantidades de dados para realizar infer√™ncias e responder a comandos.
"""

# Dicion√°rio de perguntas agrupadas por categorias
perguntas = {
    "definicao": [
        "O que √© intelig√™ncia artificial?",
        "Explique o conceito de IA.",
        "O que significa IA?"
    ],
    "tarefas": [
        "Quais tarefas a intelig√™ncia artificial pode executar?",
        "A IA pode reconhecer fala, traduzir idiomas e tomar decis√µes?",
        "Liste exemplos de atividades feitas por IA."
    ],
    "limites": [
        "Quais s√£o as limita√ß√µes da IA?",
        "A IA pode substituir completamente os humanos?",
        "A intelig√™ncia artificial pode tomar decis√µes sozinha?"
    ]
}

# Selecionar uma pergunta aleat√≥ria
categoria = random.choice(list(perguntas.keys()))
pergunta = random.choice(perguntas[categoria])

# Reformular o prompt para melhor compreens√£o
prompt = f"Responda em portugu√™s com detalhes: {pergunta}\n\nBase de conhecimento:\n{texto}"

# Carregar modelo e tokenizer
tokenizer = AutoTokenizer.from_pretrained("google/flan-t5-large")
model = AutoModelForSeq2SeqLM.from_pretrained("google/flan-t5-large")
qa_pipeline = pipeline("text2text-generation", model=model, tokenizer=tokenizer)

# Gerar resposta com mais tokens
resposta = qa_pipeline(prompt, max_new_tokens=150, do_sample=False)

# Exibir resultado
print("Device set to use cpu")
print("Categoria:", categoria)
print("Pergunta:", pergunta)
print("Resposta:", resposta[0]['generated_text'].strip())


Device set to use cpu


Device set to use cpu
Categoria: definicao
Pergunta: O que significa IA?
Resposta: A intelig√™ncia artificial (IA) √© o ramo da ci√™ncia da computa√ßo que se dedica a criar sistemas capazes de executar tarefas que normalmente exigiriam intelig√™ncia humana.


In [2]:
import random
from transformers import pipeline, AutoTokenizer, AutoModelForSeq2SeqLM

# --- Texto fixo como base de conhecimento ---
texto_pt = """
A intelig√™ncia artificial (IA) √© o ramo da ci√™ncia da computa√ß√£o que se dedica a criar sistemas capazes de executar tarefas que normalmente exigiriam intelig√™ncia humana.
Essas tarefas incluem reconhecimento de fala, tomada de decis√µes, tradu√ß√£o de idiomas e muito mais.
Os agentes de IA utilizam modelos treinados em grandes quantidades de dados para realizar infer√™ncias e responder a comandos.
"""

# --- Dicion√°rio de perguntas ---
perguntas = {
    "definicao": [
        "O que √© intelig√™ncia artificial?",
        "Explique o conceito de IA.",
        "O que significa IA?"
    ],
    "tarefas": [
        "Quais tarefas a intelig√™ncia artificial pode executar?",
        "A IA pode reconhecer fala, traduzir idiomas e tomar decis√µes?",
        "Liste exemplos de atividades feitas por IA."
    ],
    "limites": [
        "Quais s√£o as limita√ß√µes da IA?",
        "A IA pode substituir completamente os humanos?",
        "A intelig√™ncia artificial pode tomar decis√µes sozinha?"
    ]
}

# --- Sele√ß√£o aleat√≥ria de pergunta ---
categoria = random.choice(list(perguntas.keys()))
pergunta_pt = random.choice(perguntas[categoria])

# --- Pipelines de tradu√ß√£o ---
# Instale opcionalmente: pip install sacremoses
tradutor_pt_en = pipeline("translation", model="manueldeprada/t5-small-pt-en")
tradutor_en_pt = pipeline("translation", model="Helsinki-NLP/opus-mt-tc-big-en-pt")

# Tradu√ß√£o da pergunta e texto
pergunta_en = tradutor_pt_en(pergunta_pt)[0]["translation_text"]
texto_en = tradutor_pt_en(texto_pt)[0]["translation_text"]

# --- Prompt para resposta ---
prompt = f"Question: {pergunta_en}\n\nContext:\n{texto_en}\n\nAnswer in English:"

# --- Carregando modelo de QA (Flan-T5) ---
tokenizer = AutoTokenizer.from_pretrained("google/flan-t5-base")
model = AutoModelForSeq2SeqLM.from_pretrained("google/flan-t5-base")

qa_pipeline = pipeline("text2text-generation", model=model, tokenizer=tokenizer)

# Gera√ß√£o da resposta (em ingl√™s)
resposta_en = qa_pipeline(prompt, max_new_tokens=150, do_sample=False)[0]["generated_text"]

# Tradu√ß√£o da resposta para portugu√™s
resposta_pt = tradutor_en_pt(resposta_en)[0]["translation_text"]

# --- Exibi√ß√£o do resultado final ---
print("Categoria:", categoria)
print("Pergunta:", pergunta_pt)
print("Resposta:", resposta_pt)


Device set to use cpu
Device set to use cpu
Device set to use cpu


Categoria: tarefas
Pergunta: A IA pode reconhecer fala, traduzir idiomas e tomar decis√µes?
Resposta: A intelig√™ncia artificial (IA) √© o n√∫cleo da ci√™ncia da computa√ß√£o que permite que os sistemas executem tarefas que normalmente exigem intelig√™ncia humana. Essas tarefas incluem o reconhecimento da fala, a tomada de decis√µes, a tradu√ß√£o de sons e muito mais.


### üìé Anexo: Gloss√°rio de Termos T√©cnicos

Este gloss√°rio tem como objetivo auxiliar na compreens√£o dos principais conceitos utilizados no desenvolvimento do agente de IA presente neste notebook.

---

#### üîπ Embeddings
Embeddings s√£o representa√ß√µes vetoriais de textos, palavras ou senten√ßas em um espa√ßo num√©rico de alta dimens√£o. Eles capturam o significado sem√¢ntico dos dados e permitem comparar similaridades entre conte√∫dos diferentes. S√£o fundamentais para buscas por similaridade em bases vetoriais.

---

#### üîπ Vector Store
√â uma base de dados especializada em armazenar vetores (como embeddings). Permite realizar buscas sem√¢nticas ao encontrar vetores semelhantes a um vetor de consulta. No projeto, o Chroma √© utilizado como vector store.

---

#### üîπ Prompt
Prompt √© o texto de entrada enviado ao modelo de linguagem (LLM) para gerar uma resposta. Um bom prompt orienta o modelo a produzir respostas mais relevantes e espec√≠ficas.

---

#### üîπ Pipeline (HuggingFace)
Um pipeline √© uma abstra√ß√£o que simplifica o uso de modelos da HuggingFace. Ele automatiza tarefas como tokeniza√ß√£o, entrada e sa√≠da de dados e infer√™ncia do modelo. Exemplo: `pipeline("text2text-generation")` para gerar texto baseado em outro texto.

---

#### üîπ LLM (Large Language Model)
Modelos de linguagem de grande porte treinados em vastos conjuntos de dados. S√£o capazes de compreender e gerar linguagem humana de forma sofisticada. Exemplos: GPT, BERT, T5.

---
