# üß† M√≥dulo 4: Conhecimento e RAG - Transformando Agentes em Especialistas

## Bem-vindos ao mundo do conhecimento especializado!

T√°, mas o que √© esse tal de **Knowledge** no Agno? Imagina que voc√™ tem um agente super inteligente, mas que n√£o sabe nada sobre o seu neg√≥cio espec√≠fico. √â como contratar um PhD em f√≠sica para trabalhar numa loja de roupas - ele √© super inteligente, mas n√£o sabe nada sobre moda!

![](https://s3.us-east-1.amazonaws.com/turing.education/books/imagens/agno-2.0-framework--modulo-04_img_01.png)

Nos m√≥dulos anteriores, aprendemos:
- **M√≥dulo 1**: Como criar agentes b√°sicos
- **M√≥dulo 2**: Como configurar modelos e instru√ß√µes
- **M√≥dulo 3**: Como dar ferramentas aos agentes

Agora vamos dar **conhecimento especializado** aos nossos agentes!

## O que vamos aprender hoje:
1. üéØ O que √© Knowledge e Agentic RAG
2. üîç Vector Databases na pr√°tica
3. üßÆ Embeddings e como funcionam
4. ü§ñ Implementando RAG com Agno
5. üöÄ Casos pr√°ticos avan√ßados

# üéØ O que √© Knowledge e por que precisamos?

Vamos come√ßar com uma analogia simples: **Knowledge** √© como dar uma biblioteca especializada para o seu agente!

## O problema sem Knowledge:
- Agente s√≥ sabe o que foi treinado (at√© uma data de corte)
- N√£o conhece informa√ß√µes espec√≠ficas da sua empresa
- Pode "alucinar" informa√ß√µes sobre t√≥picos que n√£o domina

## A solu√ß√£o com Knowledge:
- **Dynamic Few-Shot Learning**: O agente busca exemplos relevantes na hora
- **Agentic RAG**: Busca informa√ß√µes quando precisa (n√£o sempre)
- **Conhecimento atualizado**: Sempre com as informa√ß√µes mais recentes

### Analogia do Bibliotec√°rio Inteligente üìö

Imagine que seu agente √© um bibliotec√°rio super inteligente:
- **Sem Knowledge**: Ele s√≥ responde com o que decorou
- **Com Knowledge**: Ele pesquisa nos livros certos antes de responder

**Dica!** No Agno, o Knowledge √© usado de forma **agentic** - o agente decide quando precisa buscar informa√ß√µes!

# üîß Setup Inicial - Preparando o Ambiente

Bora preparar nosso ambiente para trabalhar com Knowledge!

In [None]:
# Instalando as depend√™ncias necess√°rias
!pip install -q agno google-generativeai qdrant-client sentence-transformers

print("üì¶ Bibliotecas instaladas com sucesso!")
print("Agora vamos configurar nossa API key do Google...")

In [None]:
import os
from getpass import getpass

# Configurando a API Key do Google (gratuita!)
if 'GOOGLE_API_KEY' not in os.environ:
    os.environ['GOOGLE_API_KEY'] = getpass('üîë Cole sua API Key do Google AI Studio: ')
    
print("‚úÖ API Key configurada!")
print("üí° Dica: Pega sua chave gratuita em https://aistudio.google.com/")

In [None]:
# Imports b√°sicos para nosso m√≥dulo
import asyncio
from agno.agent import Agent
from agno.models.google import Gemini
from agno.knowledge.knowledge import Knowledge
from agno.vectordb.qdrant import Qdrant
from agno.embedder.google import GoogleEmbedder

print("üìö Importa√ß√µes realizadas!")
print("Agora temos tudo que precisamos para criar agentes inteligentes!")

# üßÆ Entendendo Embeddings - A Matem√°tica por Tr√°s da Magia

Antes de partir para a pr√°tica, vamos entender **como funciona a m√°gica** dos embeddings!

## O que s√£o Embeddings?

Embeddings s√£o **representa√ß√µes num√©ricas** de texto. √â como transformar palavras em coordenadas matem√°ticas!

### Analogia do GPS üó∫Ô∏è
- **Texto**: "Padaria da esquina"
- **Embedding**: [-23.5505, -46.6333] (coordenadas)
- **Similaridade**: Dist√¢ncia entre pontos no espa√ßo

### Como funciona na pr√°tica:
1. **Texto** ‚Üí **Embedding** (vetor de n√∫meros)
2. Textos similares ficam **pr√≥ximos** no espa√ßo matem√°tico
3. Busca por **similaridade** usando dist√¢ncia vetorial

**Matem√°tica por tr√°s:**
- Cosseno entre vetores: $\cos(\theta) = \frac{A \cdot B}{||A|| \cdot ||B||}$
- Dist√¢ncia euclidiana: $d = \sqrt{\sum_{i=1}^{n}(a_i - b_i)^2}$

In [None]:
# Vamos ver embeddings na pr√°tica!
import numpy as np
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA

# Simulando embeddings de diferentes textos
# (Na realidade, embeddings t√™m centenas ou milhares de dimens√µes)
textos = [
    "cachorro", "gato", "hamster",  # animais
    "carro", "moto", "bicicleta",   # ve√≠culos
    "pizza", "hamb√∫rguer", "lasanha" # comidas
]

# Embeddings simulados (3 grupos distintos)
embeddings_animais = np.random.normal([1, 1], 0.2, (3, 2))
embeddings_veiculos = np.random.normal([3, 1], 0.2, (3, 2))
embeddings_comidas = np.random.normal([2, 3], 0.2, (3, 2))

# Juntando tudo
embeddings = np.vstack([embeddings_animais, embeddings_veiculos, embeddings_comidas])
cores = ['red', 'red', 'red', 'blue', 'blue', 'blue', 'green', 'green', 'green']

# Visualizando
plt.figure(figsize=(10, 8))
plt.scatter(embeddings[:, 0], embeddings[:, 1], c=cores, s=100)

for i, texto in enumerate(textos):
    plt.annotate(texto, (embeddings[i, 0], embeddings[i, 1]), 
                xytext=(5, 5), textcoords='offset points', fontsize=12)

plt.title('üßÆ Visualiza√ß√£o de Embeddings - Textos Similares Ficam Pr√≥ximos', fontsize=14)
plt.xlabel('Dimens√£o 1')
plt.ylabel('Dimens√£o 2')
plt.grid(True, alpha=0.3)
plt.legend(['Animais', 'Ve√≠culos', 'Comidas'], loc='upper right')
plt.show()

print("üéØ Viu como textos similares ficam agrupados?")
print("√â assim que o agente 'entende' o significado dos textos!")

# üóÑÔ∏è Vector Databases - O C√©rebro do Sistema

Agora que entendemos embeddings, vamos falar sobre **Vector Databases**!

## O que s√£o Vector Databases?

S√£o bancos de dados **especializados** em armazenar e buscar vetores (embeddings) de forma super eficiente!

### Analogia da Biblioteca M√°gica üìñ
- **Banco tradicional**: "Me d√™ o livro com ID 123"
- **Vector Database**: "Me d√™ os 5 livros mais similares a este tema"

### Como funciona o processo:
1. **Chunking**: Quebra documentos em peda√ßos menores
2. **Embedding**: Converte cada chunk em vetor
3. **Indexing**: Armazena de forma otimizada
4. **Search**: Busca por similaridade vetorial

**Dica!** No Agno, usamos Qdrant como vector database - √© r√°pido e f√°cil de usar!

In [None]:
# Vamos criar nossa primeira base de conhecimento!
# Simulando um banco de dados vetorial simples

class VectorDBSimples:
    def __init__(self):
        self.documentos = []
        self.embeddings = []
    
    def adicionar_documento(self, texto, embedding):
        self.documentos.append(texto)
        self.embeddings.append(embedding)
        print(f"üìÑ Documento adicionado: '{texto[:50]}...'")
    
    def buscar_similares(self, query_embedding, k=3):
        """Busca os k documentos mais similares"""
        similaridades = []
        
        for i, doc_embedding in enumerate(self.embeddings):
            # Calculando similaridade (produto escalar simplificado)
            similaridade = np.dot(query_embedding, doc_embedding)
            similaridades.append((similaridade, i))
        
        # Ordenando por similaridade (maior primeiro)
        similaridades.sort(reverse=True)
        
        resultados = []
        for sim, idx in similaridades[:k]:
            resultados.append({
                'documento': self.documentos[idx],
                'similaridade': sim,
                'indice': idx
            })
        
        return resultados

# Criando nossa base vetorial
vector_db = VectorDBSimples()
print("üóÑÔ∏è Vector Database criado com sucesso!")

In [None]:
# Adicionando conhecimento sobre IA √† nossa base
conhecimentos_ia = [
    ("Machine Learning √© um subcampo da intelig√™ncia artificial que permite aos computadores aprender sem serem programados explicitamente", 
     np.array([0.8, 0.6, 0.4, 0.9])),
    
    ("Deep Learning usa redes neurais com m√∫ltiplas camadas para reconhecer padr√µes complexos em dados", 
     np.array([0.9, 0.7, 0.3, 0.8])),
    
    ("Processamento de Linguagem Natural (NLP) permite que computadores entendam e processem linguagem humana", 
     np.array([0.7, 0.8, 0.5, 0.6])),
    
    ("Computer Vision √© a √°rea que permite aos computadores interpretar e analisar imagens e v√≠deos", 
     np.array([0.6, 0.4, 0.9, 0.7])),
    
    ("Reinforcement Learning √© um tipo de aprendizado onde agentes aprendem atrav√©s de recompensas e puni√ß√µes", 
     np.array([0.8, 0.5, 0.2, 0.9]))
]

# Adicionando √† nossa base
print("üìö Adicionando conhecimentos √† base vetorial...")
for texto, embedding in conhecimentos_ia:
    vector_db.adicionar_documento(texto, embedding)

print(f"\n‚úÖ Base de conhecimento criada com {len(vector_db.documentos)} documentos!")

In [None]:
# Testando a busca por similaridade
print("üîç Testando busca por similaridade...\n")

# Query sobre redes neurais
query = "redes neurais e aprendizado profundo"
query_embedding = np.array([0.9, 0.8, 0.3, 0.7])  # Embedding simulado da query

print(f"ü§î Pergunta: '{query}'")
print("\nüìã Documentos mais relevantes:")

resultados = vector_db.buscar_similares(query_embedding, k=3)

for i, resultado in enumerate(resultados, 1):
    print(f"\n{i}. üìÑ Similaridade: {resultado['similaridade']:.3f}")
    print(f"   üìù Documento: {resultado['documento']}")

print("\nüéØ Viu como encontrou os documentos mais relevantes?")
print("√â assim que funciona um sistema RAG b√°sico!")

# üöÄ Implementando RAG Real com Agno

Agora vamos partir para o **mundo real**! Vamos criar um sistema RAG completo usando Agno.

## O que √© Agentic RAG?

**RAG Tradicional**: Sempre busca na base de conhecimento
**Agentic RAG**: O agente **decide quando** buscar conhecimento

### Vantagens do Agentic RAG:
- ‚ö° **Mais eficiente**: S√≥ busca quando necess√°rio
- üéØ **Mais preciso**: Agente sabe quando precisa de informa√ß√£o externa
- üß† **Mais inteligente**: Combina conhecimento interno e externo

**Dica!** No Agno, voc√™ s√≥ precisa adicionar `search_knowledge=True` e pronto!

In [None]:
# Criando nossa primeira base de conhecimento real com Agno
import tempfile
import os

# Vamos usar um vector database em mem√≥ria por simplicidade
from agno.vectordb.pgvector import PgVector
from agno.vectordb.qdrant import Qdrant

# Para este exemplo, vamos simular com dados locais
# Na pr√°tica, voc√™ usaria Qdrant Cloud ou local

print("üèóÔ∏è Configurando base de conhecimento...")

# Criando embedder do Google (gratuito!)
embedder = GoogleEmbedder(
    model="models/text-embedding-004",
    api_key=os.environ['GOOGLE_API_KEY']
)

print("‚úÖ Embedder configurado!")
print("üí° Using Google's text-embedding-004 model (gratuito!)")

In [None]:
# Para este exemplo, vamos usar uma abordagem simplificada
# Criando conhecimento diretamente com texto

# Simulando documentos sobre tecnologia brasileira
documentos_tech_brasil = [
    "O Brasil tem um ecossistema de startups em crescimento, com destaque para fintechs como Nubank, PagSeguro e Stone.",
    "S√£o Paulo √© considerado o principal hub de tecnologia do Brasil, concentrando grande parte das startups e empresas de tech.",
    "O Recife √© conhecido como o Porto Digital, um dos principais polos de tecnologia do Nordeste brasileiro.",
    "Belo Horizonte tem se destacado como um importante centro de desenvolvimento de software e inova√ß√£o tecnol√≥gica.",
    "O Brasil √© l√≠der mundial em ado√ß√£o de PIX, sistema de pagamentos instant√¢neos criado pelo Banco Central.",
    "Empresas brasileiras como Movile, Locaweb e Totvs s√£o refer√™ncias no mercado de tecnologia nacional.",
    "O mercado brasileiro de e-commerce cresceu significativamente, com players como Mercado Livre, B2W e Via Varejo.",
    "O agroneg√≥cio brasileiro utiliza tecnologias avan√ßadas como agricultura de precis√£o, drones e IoT."
]

print("üìö Documentos sobre tech brasileira preparados!")
print(f"Total de documentos: {len(documentos_tech_brasil)}")

In [None]:
# Vamos criar um agente com conhecimento!
# Primeiro, criamos o modelo
modelo = Gemini(
    id="gemini-2.0-flash",
    api_key=os.environ['GOOGLE_API_KEY']
)

print("ü§ñ Modelo Gemini configurado!")

# Agora vamos criar um agente especialista em tech brasileiro
agente_tech_brasil = Agent(
    name="Especialista Tech Brasil",
    model=modelo,
    description="Voc√™ √© um especialista em tecnologia brasileira e startups nacionais.",
    instructions=[
        "Use informa√ß√µes espec√≠ficas sobre o ecossistema tech brasileiro",
        "Sempre que poss√≠vel, cite exemplos de empresas brasileiras",
        "Seja preciso com dados sobre o mercado nacional"
    ],
    markdown=True
)

print("üë®‚Äçüíª Agente especialista criado!")
print("Agora vamos test√°-lo sem conhecimento espec√≠fico...")

In [None]:
# Testando o agente SEM base de conhecimento
print("üß™ TESTE 1: Agente SEM base de conhecimento")
print("=" * 50)

resposta_sem_conhecimento = agente_tech_brasil.run(
    "Me conte sobre o ecossistema de fintechs no Brasil e cite 3 exemplos espec√≠ficos com detalhes sobre cada uma."
)

print("ü§ñ Resposta sem conhecimento espec√≠fico:")
print(resposta_sem_conhecimento.content)
print("\n" + "="*50)
print("üìù Observa√ß√£o: O agente respondeu com conhecimento geral,")
print("mas pode n√£o ter informa√ß√µes espec√≠ficas e atualizadas.")

## üìä Visualizando o Processo RAG

Vamos visualizar como funciona o processo de Retrieval-Augmented Generation:

In [None]:
# Visualizando o processo RAG
import matplotlib.pyplot as plt
import matplotlib.patches as mpatches
from matplotlib.patches import FancyBboxPatch

fig, ax = plt.subplots(1, 1, figsize=(14, 10))
ax.set_xlim(0, 10)
ax.set_ylim(0, 10)
ax.axis('off')

# T√≠tulo
ax.text(5, 9.5, 'üöÄ Processo Agentic RAG com Agno', 
        fontsize=18, ha='center', weight='bold')

# Passo 1: Pergunta do usu√°rio
box1 = FancyBboxPatch((0.5, 7.5), 2, 1, 
                      boxstyle="round,pad=0.1", 
                      facecolor='lightblue', edgecolor='blue')
ax.add_patch(box1)
ax.text(1.5, 8, 'üë§ Pergunta\ndo Usu√°rio', ha='center', va='center', fontsize=10, weight='bold')

# Passo 2: Agente decide
box2 = FancyBboxPatch((3.5, 7.5), 2, 1, 
                      boxstyle="round,pad=0.1", 
                      facecolor='lightgreen', edgecolor='green')
ax.add_patch(box2)
ax.text(4.5, 8, 'ü§ñ Agente\nDecide', ha='center', va='center', fontsize=10, weight='bold')

# Passo 3: Busca no conhecimento
box3 = FancyBboxPatch((6.5, 7.5), 2, 1, 
                      boxstyle="round,pad=0.1", 
                      facecolor='lightyellow', edgecolor='orange')
ax.add_patch(box3)
ax.text(7.5, 8, 'üîç Busca\nConhecimento', ha='center', va='center', fontsize=10, weight='bold')

# Base de conhecimento
box4 = FancyBboxPatch((1, 5), 3, 1.5, 
                      boxstyle="round,pad=0.1", 
                      facecolor='lightcoral', edgecolor='red')
ax.add_patch(box4)
ax.text(2.5, 5.75, 'üóÑÔ∏è Vector Database\n(Documentos + Embeddings)', 
        ha='center', va='center', fontsize=10, weight='bold')

# Contexto aumentado
box5 = FancyBboxPatch((5.5, 5), 3, 1.5, 
                      boxstyle="round,pad=0.1", 
                      facecolor='lightviolet', edgecolor='purple')
ax.add_patch(box5)
ax.text(7, 5.75, 'üìã Contexto\nAumentado', ha='center', va='center', fontsize=10, weight='bold')

# Resposta final
box6 = FancyBboxPatch((3.5, 2.5), 3, 1.5, 
                      boxstyle="round,pad=0.1", 
                      facecolor='lightsteelblue', edgecolor='navy')
ax.add_patch(box6)
ax.text(5, 3.25, 'üí¨ Resposta\nEnriquecida', ha='center', va='center', fontsize=12, weight='bold')

# Setas
arrows = [
    ((2.5, 8), (3.5, 8)),  # usu√°rio -> agente
    ((5.5, 8), (6.5, 8)),  # agente -> busca
    ((7.5, 7.5), (7, 6.5)),  # busca -> contexto
    ((2.5, 6.5), (6, 6.5)),  # knowledge -> contexto
    ((6.5, 5), (5.5, 4))   # contexto -> resposta
]

for start, end in arrows:
    ax.annotate('', xy=end, xytext=start,
                arrowprops=dict(arrowstyle='->', lw=2, color='black'))

# Legenda
ax.text(5, 1, '‚ú® O agente DECIDE quando buscar conhecimento adicional!', 
        ha='center', fontsize=12, style='italic', 
        bbox=dict(boxstyle="round,pad=0.3", facecolor='lightyellow'))

plt.tight_layout()
plt.show()

print("üéØ Processo completo de Agentic RAG visualizado!")

# üõ†Ô∏è Implementa√ß√£o Completa com Knowledge

Agora vamos implementar um sistema RAG completo usando as ferramentas do Agno!

In [None]:
# Implementando RAG simplificado (sem vector database externo)
# Vamos simular o processo de conhecimento

class ConhecimentoTechBrasil:
    def __init__(self):
        self.base_conhecimento = {
            "fintechs": {
                "nubank": "Nubank √© a maior fintech da Am√©rica Latina, com mais de 80 milh√µes de clientes. Fundada em 2013 por David V√©lez, oferece conta digital, cart√£o de cr√©dito sem anuidade e investimentos.",
                "pagseguro": "PagSeguro √© uma das maiores empresas de pagamentos do Brasil, oferecendo solu√ß√µes para e-commerce, maquininhas de cart√£o e servi√ßos financeiros para PMEs.",
                "stone": "Stone √© uma fintech brasileira especializada em solu√ß√µes de pagamento, conhecida por suas maquininhas e servi√ßos banc√°rios para pequenas e m√©dias empresas."
            },
            "startups": {
                "mercadolivre": "Mercado Livre √© o maior marketplace da Am√©rica Latina, fundado em 1999, hoje avaliado em bilh√µes de d√≥lares e presente em 18 pa√≠ses.",
                "ifood": "iFood √© o maior aplicativo de delivery de comida do Brasil, conectando restaurantes e consumidores em mais de 1000 cidades.",
                "99": "99 √© uma startup brasileira de mobilidade urbana, adquirida pela Didi Chuxing, oferecendo corridas de carro, moto e outros servi√ßos."
            },
            "hubs": {
                "sao_paulo": "S√£o Paulo concentra 70% das startups brasileiras, com ecossistema maduro de investidores, aceleradoras e talentos tech.",
                "recife": "Porto Digital no Recife √© o maior parque tecnol√≥gico do Brasil em faturamento, com mais de 350 empresas e 15 mil empregos.",
                "florianopolis": "Florian√≥polis √© conhecida como Vale do Sil√≠cio brasileiro, forte em software e inova√ß√£o tecnol√≥gica."
            }
        }
    
    def buscar_informacao(self, query):
        """Simula busca de informa√ß√µes relevantes"""
        query_lower = query.lower()
        resultados = []
        
        for categoria, items in self.base_conhecimento.items():
            for chave, valor in items.items():
                if any(palavra in query_lower for palavra in [chave, categoria]):
                    resultados.append(valor)
        
        return resultados[:3]  # Retorna top 3 resultados

# Criando nossa base de conhecimento
conhecimento_brasil = ConhecimentoTechBrasil()
print("üìö Base de conhecimento sobre tech brasileira criada!")

In [None]:
# Fun√ß√£o para enriquecer o contexto do agente
def criar_agente_com_conhecimento(query):
    """Cria um agente com contexto enriquecido baseado na query"""
    
    # Busca informa√ß√µes relevantes
    informacoes_relevantes = conhecimento_brasil.buscar_informacao(query)
    
    # Cria contexto adicional
    contexto_adicional = "\n\nInforma√ß√µes espec√≠ficas dispon√≠veis:\n"
    for i, info in enumerate(informacoes_relevantes, 1):
        contexto_adicional += f"{i}. {info}\n"
    
    # Cria agente com conhecimento enriquecido
    agente_enriquecido = Agent(
        name="Especialista Tech Brasil PRO",
        model=modelo,
        description=f"Voc√™ √© um especialista em tecnologia brasileira com acesso a informa√ß√µes espec√≠ficas e atualizadas.{contexto_adicional}",
        instructions=[
            "Use SEMPRE as informa√ß√µes espec√≠ficas fornecidas acima",
            "Cite dados concretos e exemplos das empresas mencionadas",
            "Se n√£o tiver informa√ß√£o espec√≠fica, deixe claro",
            "Seja preciso com n√∫meros e fatos sobre o mercado brasileiro"
        ],
        markdown=True
    )
    
    return agente_enriquecido, informacoes_relevantes

print("üéØ Fun√ß√£o de enriquecimento de contexto criada!")
print("Agora vamos testar com a mesma pergunta...")

In [None]:
# Testando o agente COM base de conhecimento
print("üß™ TESTE 2: Agente COM base de conhecimento")
print("=" * 60)

query_teste = "Me conte sobre o ecossistema de fintechs no Brasil e cite 3 exemplos espec√≠ficos com detalhes sobre cada uma."

# Criando agente enriquecido
agente_com_conhecimento, infos_usadas = criar_agente_com_conhecimento(query_teste)

print("üîç Informa√ß√µes encontradas na base de conhecimento:")
for i, info in enumerate(infos_usadas, 1):
    print(f"{i}. {info[:100]}...")

print("\n" + "-"*60)
print("ü§ñ Gerando resposta enriquecida...\n")

resposta_com_conhecimento = agente_com_conhecimento.run(query_teste)

print("‚ú® Resposta com conhecimento espec√≠fico:")
print(resposta_com_conhecimento.content)

print("\n" + "="*60)
print("üéØ Compara√ß√£o:")
print("‚úÖ COM conhecimento: Informa√ß√µes espec√≠ficas, dados concretos, exemplos reais")
print("‚ùå SEM conhecimento: Informa√ß√µes gerais, pode conter imprecis√µes")

# üìà M√©tricas e Avalia√ß√£o do Sistema RAG

Como saber se nosso sistema RAG est√° funcionando bem? Vamos implementar algumas m√©tricas!

In [None]:
# Sistema de avalia√ß√£o do RAG
import time
from datetime import datetime

class AvaliadorRAG:
    def __init__(self):
        self.metricas = {
            'consultas_realizadas': 0,
            'tempo_medio_resposta': 0,
            'documentos_encontrados': [],
            'historico_consultas': []
        }
    
    def avaliar_consulta(self, query, agente, conhecimento_obj):
        """Avalia uma consulta RAG"""
        inicio = time.time()
        
        # Busca documentos relevantes
        documentos = conhecimento_obj.buscar_informacao(query)
        
        # Cria agente enriquecido
        agente_enriquecido, _ = criar_agente_com_conhecimento(query)
        
        # Gera resposta
        resposta = agente_enriquecido.run(query)
        
        fim = time.time()
        tempo_resposta = fim - inicio
        
        # Atualiza m√©tricas
        self.metricas['consultas_realizadas'] += 1
        self.metricas['documentos_encontrados'].append(len(documentos))
        
        # Calcula tempo m√©dio
        if self.metricas['tempo_medio_resposta'] == 0:
            self.metricas['tempo_medio_resposta'] = tempo_resposta
        else:
            self.metricas['tempo_medio_resposta'] = (
                self.metricas['tempo_medio_resposta'] + tempo_resposta
            ) / 2
        
        # Salva no hist√≥rico
        self.metricas['historico_consultas'].append({
            'timestamp': datetime.now().strftime('%H:%M:%S'),
            'query': query[:50] + '...' if len(query) > 50 else query,
            'documentos_encontrados': len(documentos),
            'tempo_resposta': round(tempo_resposta, 2),
            'qualidade_estimada': self._estimar_qualidade(documentos, resposta.content)
        })
        
        return resposta, {
            'documentos_encontrados': len(documentos),
            'tempo_resposta': round(tempo_resposta, 2),
            'documentos': documentos
        }
    
    def _estimar_qualidade(self, documentos, resposta):
        """Estima qualidade da resposta (m√©todo simplificado)"""
        if not documentos:
            return "Baixa"
        
        # Verifica se a resposta usa informa√ß√µes dos documentos
        palavras_docs = set()
        for doc in documentos:
            palavras_docs.update(doc.lower().split())
        
        palavras_resposta = set(resposta.lower().split())
        intersecao = len(palavras_docs.intersection(palavras_resposta))
        
        if intersecao > 10:
            return "Alta"
        elif intersecao > 5:
            return "M√©dia"
        else:
            return "Baixa"
    
    def relatorio_metricas(self):
        """Gera relat√≥rio das m√©tricas"""
        print("üìä RELAT√ìRIO DE M√âTRICAS RAG")
        print("=" * 40)
        print(f"üî¢ Total de consultas: {self.metricas['consultas_realizadas']}")
        print(f"‚è±Ô∏è Tempo m√©dio de resposta: {self.metricas['tempo_medio_resposta']:.2f}s")
        
        if self.metricas['documentos_encontrados']:
            media_docs = sum(self.metricas['documentos_encontrados']) / len(self.metricas['documentos_encontrados'])
            print(f"üìÑ M√©dia de documentos encontrados: {media_docs:.1f}")
        
        print("\nüìã Hist√≥rico de consultas:")
        for consulta in self.metricas['historico_consultas'][-5:]:  # √öltimas 5
            print(f"  {consulta['timestamp']} | {consulta['query']} | "
                  f"Docs: {consulta['documentos_encontrados']} | "
                  f"Tempo: {consulta['tempo_resposta']}s | "
                  f"Qualidade: {consulta['qualidade_estimada']}")

# Criando avaliador
avaliador = AvaliadorRAG()
print("üìä Sistema de avalia√ß√£o RAG criado!")

In [None]:
# Testando diferentes consultas com m√©tricas
consultas_teste = [
    "Quais s√£o as principais fintechs brasileiras?",
    "Como est√° o cen√°rio de startups em S√£o Paulo?",
    "O que voc√™ sabe sobre o Porto Digital no Recife?",
    "Conte sobre o Mercado Livre e seu crescimento"
]

print("üß™ Testando sistema RAG com diferentes consultas...\n")

for i, consulta in enumerate(consultas_teste, 1):
    print(f"\n{'='*60}")
    print(f"TESTE {i}: {consulta}")
    print("="*60)
    
    resposta, metricas_consulta = avaliador.avaliar_consulta(
        consulta, agente_tech_brasil, conhecimento_brasil
    )
    
    print(f"\nüìä M√©tricas desta consulta:")
    print(f"   üìÑ Documentos encontrados: {metricas_consulta['documentos_encontrados']}")
    print(f"   ‚è±Ô∏è Tempo de resposta: {metricas_consulta['tempo_resposta']}s")
    
    print(f"\nü§ñ Resposta gerada:")
    print(resposta.content[:300] + "..." if len(resposta.content) > 300 else resposta.content)

print("\n" + "="*60)
print("üìà RELAT√ìRIO FINAL DE M√âTRICAS")
print("="*60)
avaliador.relatorio_metricas()

# üéØ Exerc√≠cios Pr√°ticos

Agora √© sua vez de colocar a m√£o na massa!

## üèãÔ∏è Exerc√≠cio 1: Criando sua pr√≥pria base de conhecimento

**Desafio:** Crie uma base de conhecimento sobre um tema que voc√™ domina (esportes, m√∫sica, culin√°ria, etc.) e implemente um sistema RAG simples.

**O que fazer:**
1. Escolha um tema
2. Crie 5-10 documentos sobre o tema
3. Implemente busca por similaridade
4. Teste com perguntas espec√≠ficas

In [None]:
# SEU C√ìDIGO AQUI!
# Dica: Use a estrutura da ConhecimentoTechBrasil como base

class MeuConhecimento:
    def __init__(self):
        # TODO: Adicione sua base de conhecimento aqui
        self.base_conhecimento = {
            # "categoria1": {
            #     "item1": "Descri√ß√£o detalhada...",
            #     "item2": "Outra descri√ß√£o..."
            # }
        }
        pass
    
    def buscar_informacao(self, query):
        # TODO: Implemente sua l√≥gica de busca
        pass

# Teste aqui:
# meu_conhecimento = MeuConhecimento()
# resultado = meu_conhecimento.buscar_informacao("sua pergunta")
# print(resultado)

print("üí™ Complete este exerc√≠cio para praticar!")

## üèãÔ∏è Exerc√≠cio 2: Comparando abordagens RAG

**Desafio:** Compare a mesma pergunta usando:
1. Agente sem conhecimento
2. Agente com RAG tradicional (sempre busca)
3. Agente com Agentic RAG (busca quando necess√°rio)

**Analise:** Qual abordagem d√° melhores resultados para diferentes tipos de pergunta?

In [None]:
# SEU C√ìDIGO AQUI!
# Dica: Crie tr√™s vers√µes de agentes e teste com a mesma pergunta

def comparar_abordagens_rag(pergunta):
    # TODO: Implemente as tr√™s abordagens
    
    # 1. Agente sem conhecimento
    agente_simples = None  # TODO: Criar agente simples
    
    # 2. Agente com RAG tradicional
    agente_rag_tradicional = None  # TODO: Criar com contexto sempre enriquecido
    
    # 3. Agente com Agentic RAG
    agente_agentic_rag = None  # TODO: Criar que decide quando buscar
    
    # TODO: Teste e compare os resultados
    pass

# Teste com diferentes tipos de pergunta:
perguntas_teste = [
    "Qual √© a capital do Brasil?",  # Conhecimento geral
    "Como est√° o pre√ßo das a√ß√µes do Nubank hoje?",  # Informa√ß√£o espec√≠fica/atualizada
    "Explique como funciona machine learning"  # Conhecimento t√©cnico geral
]

print("üéØ Complete este exerc√≠cio para entender as diferen√ßas!")

# üöÄ Casos de Uso Avan√ßados

Vamos ver alguns casos de uso mais avan√ßados do sistema RAG!

In [None]:
# Caso 1: Agente especialista que atualiza seu pr√≥prio conhecimento
class AgenteAutoAtualizable:
    def __init__(self, modelo, conhecimento_inicial):
        self.modelo = modelo
        self.conhecimento = conhecimento_inicial
        self.historico_aprendizado = []
    
    def processar_consulta(self, query):
        """Processa consulta e aprende com intera√ß√µes"""
        
        # Busca conhecimento existente
        informacoes = self.conhecimento.buscar_informacao(query)
        
        # Se n√£o encontrou informa√ß√µes suficientes, marca para atualiza√ß√£o
        if len(informacoes) < 2:
            self.historico_aprendizado.append({
                'query': query,
                'timestamp': datetime.now().strftime('%Y-%m-%d %H:%M:%S'),
                'status': 'conhecimento_insuficiente'
            })
            print(f"‚ö†Ô∏è Conhecimento insuficiente para: '{query}'")
            print("üìù Marcado para futura atualiza√ß√£o da base de conhecimento")
        
        # Cria agente especializado
        agente, _ = criar_agente_com_conhecimento(query)
        resposta = agente.run(query)
        
        return resposta
    
    def relatorio_aprendizado(self):
        """Mostra √°reas que precisam de mais conhecimento"""
        if not self.historico_aprendizado:
            print("‚úÖ Nenhuma lacuna de conhecimento identificada!")
            return
        
        print("üìä RELAT√ìRIO DE LACUNAS DE CONHECIMENTO")
        print("=" * 45)
        for item in self.historico_aprendizado:
            print(f"üîç {item['timestamp']}: {item['query']}")

# Testando agente auto-atualiz√°vel
agente_auto = AgenteAutoAtualizable(modelo, conhecimento_brasil)

print("ü§ñ Testando Agente Auto-Atualiz√°vel...\n")

# Testando com consultas variadas
consultas_variadas = [
    "Fale sobre fintechs brasileiras",  # Tem conhecimento
    "Como est√° o mercado de criptomoedas no Brasil?",  # Pode n√£o ter
    "Quais s√£o as startups de IA no Brasil?",  # Pode n√£o ter
    "Conte sobre o Porto Digital"  # Tem conhecimento
]

for consulta in consultas_variadas:
    print(f"\n‚ùì Pergunta: {consulta}")
    resposta = agente_auto.processar_consulta(consulta)
    print(f"ü§ñ Resposta resumida: {resposta.content[:150]}...")

print("\n" + "="*50)
agente_auto.relatorio_aprendizado()

In [None]:
# Caso 2: Sistema RAG com m√∫ltiplas fontes de conhecimento
class SistemaRAGMultiplosFontes:
    def __init__(self):
        self.fontes = {
            'tech_brasil': conhecimento_brasil,
            'mercado_financeiro': self._criar_conhecimento_financeiro(),
            'startups_globais': self._criar_conhecimento_global()
        }
    
    def _criar_conhecimento_financeiro(self):
        class ConhecimentoFinanceiro:
            def buscar_informacao(self, query):
                base = {
                    'investimentos': "No Brasil, principais op√ß√µes s√£o: Tesouro Direto, CDB, LCI/LCA, a√ß√µes, fundos imobili√°rios",
                    'pix': "PIX revolucionou pagamentos no Brasil, com mais de 100 milh√µes de chaves cadastradas",
                    'bolsa': "B3 √© a bolsa de valores brasileira, com mais de 4 milh√µes de investidores pessoas f√≠sicas"
                }
                return [v for k, v in base.items() if k in query.lower()]
        return ConhecimentoFinanceiro()
    
    def _criar_conhecimento_global(self):
        class ConhecimentoGlobal:
            def buscar_informacao(self, query):
                base = {
                    'silicon valley': "Vale do Sil√≠cio concentra gigantes tech como Google, Apple, Meta, Tesla",
                    'unicornios': "Empresas unic√≥rnio s√£o startups avaliadas em mais de 1 bilh√£o de d√≥lares",
                    'venture capital': "VC investe em startups early-stage em troca de equity"
                }
                return [v for k, v in base.items() if k in query.lower()]
        return ConhecimentoGlobal()
    
    def buscar_em_todas_fontes(self, query):
        """Busca em todas as fontes de conhecimento"""
        resultados = {}
        
        for nome_fonte, fonte in self.fontes.items():
            infos = fonte.buscar_informacao(query)
            if infos:
                resultados[nome_fonte] = infos
        
        return resultados
    
    def criar_agente_multi_fonte(self, query):
        """Cria agente com conhecimento de m√∫ltiplas fontes"""
        todas_infos = self.buscar_em_todas_fontes(query)
        
        contexto_multi = "\n\nCONHECIMENTO DE M√öLTIPLAS FONTES:\n"
        
        for fonte, infos in todas_infos.items():
            contexto_multi += f"\nüìö Fonte: {fonte.upper()}\n"
            for i, info in enumerate(infos, 1):
                contexto_multi += f"  {i}. {info}\n"
        
        agente_multi = Agent(
            name="Especialista Multi-Dom√≠nio",
            model=modelo,
            description=f"Voc√™ tem acesso a conhecimento de m√∫ltiplas fontes especializadas.{contexto_multi}",
            instructions=[
                "Use informa√ß√µes de TODAS as fontes dispon√≠veis",
                "Cite qual fonte voc√™ est√° usando para cada informa√ß√£o",
                "Fa√ßa conex√µes entre informa√ß√µes de diferentes fontes quando relevante"
            ],
            markdown=True
        )
        
        return agente_multi, todas_infos

# Testando sistema multi-fontes
sistema_multi = SistemaRAGMultiplosFontes()

print("üåê Testando Sistema RAG com M√∫ltiplas Fontes...\n")

query_multi = "Como o PIX impactou as fintechs brasileiras e qual a diferen√ßa para sistemas de pagamento globais?"

print(f"‚ùì Pergunta complexa: {query_multi}\n")

agente_multi, fontes_usadas = sistema_multi.criar_agente_multi_fonte(query_multi)

print("üîç Fontes de conhecimento consultadas:")
for fonte, infos in fontes_usadas.items():
    print(f"   üìö {fonte}: {len(infos)} informa√ß√µes encontradas")

print("\nü§ñ Gerando resposta integrando m√∫ltiplas fontes...\n")
resposta_multi = agente_multi.run(query_multi)

print("‚ú® Resposta integrada:")
print(resposta_multi.content)

print("\nüéØ Vantagem: O agente consegue combinar conhecimento de diferentes dom√≠nios!")

# üìä Visualizando Performance e M√©tricas

In [None]:
# Criando visualiza√ß√µes das m√©tricas do sistema RAG
import matplotlib.pyplot as plt
import numpy as np

# Simulando dados de performance
metodos = ['Sem Knowledge', 'RAG Tradicional', 'Agentic RAG', 'Multi-Fonte']
tempo_resposta = [0.8, 2.1, 1.4, 2.8]  # segundos
precisao = [65, 85, 92, 95]  # % de precis√£o estimada
relevancia = [60, 82, 90, 94]  # % de relev√¢ncia estimada

# Criando subplot com m√∫ltiplos gr√°ficos
fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(15, 12))
fig.suptitle('üìä An√°lise Comparativa de Sistemas RAG', fontsize=16, fontweight='bold')

# Gr√°fico 1: Tempo de Resposta
colors1 = ['lightcoral', 'lightblue', 'lightgreen', 'lightyellow']
bars1 = ax1.bar(metodos, tempo_resposta, color=colors1, edgecolor='black')
ax1.set_title('‚è±Ô∏è Tempo de Resposta (segundos)', fontweight='bold')
ax1.set_ylabel('Segundos')
ax1.tick_params(axis='x', rotation=45)

# Adicionando valores nas barras
for bar, value in zip(bars1, tempo_resposta):
    ax1.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.05, 
             f'{value}s', ha='center', va='bottom', fontweight='bold')

# Gr√°fico 2: Precis√£o
bars2 = ax2.bar(metodos, precisao, color=['#ff9999', '#66b3ff', '#99ff99', '#ffcc99'], edgecolor='black')
ax2.set_title('üéØ Precis√£o das Respostas (%)', fontweight='bold')
ax2.set_ylabel('Precis√£o (%)')
ax2.set_ylim(0, 100)
ax2.tick_params(axis='x', rotation=45)

for bar, value in zip(bars2, precisao):
    ax2.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 1, 
             f'{value}%', ha='center', va='bottom', fontweight='bold')

# Gr√°fico 3: Relev√¢ncia
bars3 = ax3.bar(metodos, relevancia, color=['#ffb3ba', '#baffc9', '#bae1ff', '#ffffba'], edgecolor='black')
ax3.set_title('üìà Relev√¢ncia do Conte√∫do (%)', fontweight='bold')
ax3.set_ylabel('Relev√¢ncia (%)')
ax3.set_ylim(0, 100)
ax3.tick_params(axis='x', rotation=45)

for bar, value in zip(bars3, relevancia):
    ax3.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 1, 
             f'{value}%', ha='center', va='bottom', fontweight='bold')

# Gr√°fico 4: Radar Chart comparativo
categorias = ['Velocidade', 'Precis√£o', 'Relev√¢ncia', 'Facilidade']
valores_agentic = [85, 92, 90, 95]  # Valores normalizados para Agentic RAG

# Calculando √¢ngulos para o radar
angulos = np.linspace(0, 2 * np.pi, len(categorias), endpoint=False).tolist()
valores_agentic += valores_agentic[:1]  # Fechando o c√≠rculo
angulos += angulos[:1]

ax4.plot(angulos, valores_agentic, 'o-', linewidth=2, label='Agentic RAG', color='green')
ax4.fill(angulos, valores_agentic, alpha=0.25, color='green')
ax4.set_xticks(angulos[:-1])
ax4.set_xticklabels(categorias)
ax4.set_ylim(0, 100)
ax4.set_title('üï∏Ô∏è Perfil Agentic RAG', fontweight='bold')
ax4.grid(True)

plt.tight_layout()
plt.show()

print("üìä An√°lise dos Resultados:")
print("\nüèÜ VENCEDORES:")
print("   ‚ö° Velocidade: Sem Knowledge (mais simples)")
print("   üéØ Precis√£o: Multi-Fonte (mais completo)")
print("   ‚öñÔ∏è Equil√≠brio: Agentic RAG (melhor custo-benef√≠cio)")
print("\nüí° Conclus√£o: Agentic RAG oferece o melhor equil√≠brio!")

# üéâ Resumo e Pr√≥ximos Passos

## O que aprendemos hoje:

### üß† Conceitos Fundamentais:
- **Knowledge**: Como dar conhecimento especializado aos agentes
- **Embeddings**: Representa√ß√£o matem√°tica de texto para busca sem√¢ntica
- **Vector Databases**: Armazenamento otimizado para busca por similaridade
- **Agentic RAG**: Agentes que decidem quando buscar conhecimento

### üõ†Ô∏è Implementa√ß√µes Pr√°ticas:
- Sistema RAG b√°sico com busca por similaridade
- Agentes com conhecimento enriquecido
- M√©tricas e avalia√ß√£o de performance
- Sistemas multi-fonte para conhecimento abrangente

### üìä Principais Diferen√ßas:
- **RAG Tradicional**: Sempre busca na base (mais lento, mas completo)
- **Agentic RAG**: Busca apenas quando necess√°rio (mais eficiente)
- **Multi-Fonte**: Combina diferentes dom√≠nios de conhecimento

## üöÄ Pr√≥ximos M√≥dulos:
- **M√≥dulo 5**: Mem√≥ria e Persist√™ncia - Como fazer agentes lembrarem de conversas anteriores
- **M√≥dulo 6**: Agentes Multimodal - Processamento de imagens e outros tipos de m√≠dia
- **M√≥dulo 7**: Reasoning - Como fazer agentes "pensarem" antes de agir

![](https://s3.us-east-1.amazonaws.com/turing.education/books/imagens/agno-2.0-framework--modulo-04_img_02.png)

### üí° Dica Final:
O **Knowledge** √© o que transforma seus agentes de "inteligentes" para "especialistas"! Use essa ferramenta para criar sistemas que realmente entendem do seu dom√≠nio espec√≠fico.

**Liiindo!** Agora seus agentes t√™m c√©rebros especializados! üß†‚ú®

# üéØ Desafio Final

Para consolidar seu aprendizado, implemente um sistema RAG completo para um dom√≠nio de sua escolha:

## üìã Requisitos:
1. ‚úÖ Base de conhecimento com pelo menos 10 documentos
2. ‚úÖ Sistema de busca por similaridade
3. ‚úÖ Agente especializado com Agentic RAG
4. ‚úÖ M√©tricas de avalia√ß√£o (tempo, precis√£o, relev√¢ncia)
5. ‚úÖ Teste com pelo menos 5 perguntas diferentes

## üèÜ Bonus:
- Implemente m√∫ltiplas fontes de conhecimento
- Adicione sistema de auto-avalia√ß√£o
- Crie visualiza√ß√µes das m√©tricas

**Boa sorte e bora codar!** üöÄ