# üöÄ **M√≥dulo 1: Introdu√ß√£o ao RAG - O Superpoder da IA**

> *Porque √†s vezes a IA precisa consultar os "livros" antes de responder*

---

## **Aula 1.1: O que √© RAG e por que √© tipo ter um Google na cabe√ßa da IA?**

---

### **T√°, mas o que √© RAG?**

RAG √© como ter um **estudante super inteligente** que, antes de responder qualquer pergunta, consulta uma biblioteca gigante de documentos. √â tipo ter um Google na cabe√ßa da IA!

**üñºÔ∏è Sugest√£o de imagem**: Um estudante consultando livros antes de responder

**Por que RAG √© importante?**

Imagine que voc√™ pergunta para o ChatGPT: "Qual foi o resultado do √∫ltimo jogo do Flamengo?"
- ü§• **ChatGPT tradicional**: Pode inventar uma resposta (alucina√ß√£o)
- ‚úÖ **RAG**: Consulta not√≠cias reais e responde baseado em fatos

### **Analogia do Dia a Dia**

RAG √© como um **gar√ßom experiente** em um restaurante:
- üçΩÔ∏è **Voc√™ pergunta**: "Qual √© o prato mais pedido?"
- üìä **Gar√ßom consulta**: O sistema de pedidos (dados reais)
- ÔøΩÔøΩ **Resposta precisa**: Baseada em estat√≠sticas reais

**Sem RAG** seria como um gar√ßom que "acha" que sabe, mas pode estar errado!

---

### **Setup Inicial - Preparando o Terreno**

**‚ö†Ô∏è IMPORTANTE**: Se voc√™ n√£o executou o notebook `00_setup_colab.ipynb` primeiro, execute a c√©lula abaixo para instalar as depend√™ncias.

In [None]:
# üöÄ SETUP GRATUITO PARA COLAB
# Execute esta c√©lula primeiro para configurar o ambiente!

# Instalando depend√™ncias (execute apenas se necess√°rio)
!pip install langchain>=0.1.0
!pip install langchain-community>=0.0.10
!pip install langchain-core>=0.1.0
!pip install python-dotenv>=1.0.0
!pip install huggingface_hub>=0.19.0
!pip install sentence-transformers>=2.2.0
!pip install chromadb>=0.4.0
!pip install faiss-cpu>=1.7.0
!pip install numpy>=1.24.0
!pip install pandas>=2.0.0

print("‚úÖ Depend√™ncias instaladas com sucesso!")
print("üöÄ Ambiente configurado para RAG!")

In [None]:
# ÔøΩÔøΩ IMPORTA√á√ïES NECESS√ÅRIAS PARA RAG
import os
from dotenv import load_dotenv

# LangChain
from langchain_community.llms import HuggingFaceHub
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import Chroma
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.chains import RetrievalQA

# Utilit√°rios
import numpy as np
import pandas as pd

print("‚úÖ Bibliotecas importadas com sucesso!")
print("üöÄ Pronto para come√ßar nossa jornada RAG!")

### **Exemplo Pr√°tico - RAG vs IA Tradicional**

Vamos ver a diferen√ßa na pr√°tica! Primeiro, vamos criar um exemplo simples:

In [None]:
# ÔøΩÔøΩ EXEMPLO PR√ÅTICO: RAG vs IA TRADICIONAL

# Simulando uma base de conhecimento (documentos reais)
documentos_empresa = [
    "A empresa TechCorp foi fundada em 2020 por Jo√£o Silva",
    "O produto principal da TechCorp √© o software AnalyticsPro",
    "AnalyticsPro custa R$ 299 por m√™s para empresas pequenas",
    "A TechCorp tem 50 funcion√°rios e est√° localizada em S√£o Paulo",
    "O CEO atual da TechCorp √© Maria Santos, que assumiu em 2023",
    "AnalyticsPro √© usado por mais de 1000 empresas no Brasil"
]

print("üìö Base de conhecimento da TechCorp:")
for i, doc in enumerate(documentos_empresa, 1):
    print(f"  {i}. {doc}")

print(f"\nüìä Total de documentos: {len(documentos_empresa)}")

### **Simulando IA Tradicional (Sem RAG)**

Vamos simular como uma IA tradicional responderia sem consultar documentos:

In [None]:
# ü§ñ SIMULANDO IA TRADICIONAL (SEM RAG)

def ia_tradicional(pergunta):
    """Simula uma IA que responde baseada apenas no conhecimento pr√©vio"""
    
    # Simulando respostas "gen√©ricas" que uma IA poderia dar
    respostas_genericas = {
        "quem √© o ceo": "N√£o tenho informa√ß√µes atualizadas sobre o CEO da TechCorp",
        "quanto custa": "O pre√ßo pode variar dependendo do plano e negocia√ß√£o",
        "quantos funcion√°rios": "Empresas de tecnologia geralmente t√™m entre 10 e 500 funcion√°rios",
        "onde fica": "Muitas empresas de tecnologia est√£o localizadas em S√£o Paulo"
    }
    
    pergunta_lower = pergunta.lower()
    
    for palavra_chave, resposta in respostas_genericas.items():
        if palavra_chave in pergunta_lower:
            return resposta
    
    return "Desculpe, n√£o tenho informa√ß√µes espec√≠ficas sobre isso."

# Testando IA tradicional
perguntas_teste = [
    "Quem √© o CEO da TechCorp?",
    "Quanto custa o AnalyticsPro?",
    "Quantos funcion√°rios a TechCorp tem?"
]

print("ü§ñ IA TRADICIONAL (sem RAG):")
print("=" * 50)

for pergunta in perguntas_teste:
    resposta = ia_tradicional(pergunta)
    print(f"\n‚ùì Pergunta: {pergunta}")
    print(f"ü§ñ Resposta: {resposta}")
    print("‚ö†Ô∏è  Problema: Resposta gen√©rica ou incerta!")

### **Implementando RAG Simples**

Agora vamos implementar um RAG b√°sico que consulta os documentos antes de responder:

In [None]:
# üöÄ IMPLEMENTANDO RAG SIMPLES

def rag_simples(pergunta, documentos):
    """Implementa√ß√£o simples de RAG que busca nos documentos"""
    
    # Passo 1: Busca por palavras-chave nos documentos
    pergunta_lower = pergunta.lower()
    documentos_relevantes = []
    
    for doc in documentos:
        doc_lower = doc.lower()
        # Conta quantas palavras da pergunta aparecem no documento
        palavras_pergunta = pergunta_lower.split()
        palavras_encontradas = sum(1 for palavra in palavras_pergunta if palavra in doc_lower)
        
        if palavras_encontradas > 0:
            documentos_relevantes.append((doc, palavras_encontradas))
    
    # Ordena por relev√¢ncia
    documentos_relevantes.sort(key=lambda x: x[1], reverse=True)
    
    # Passo 2: Gera resposta baseada nos documentos encontrados
    if documentos_relevantes:
        doc_mais_relevante = documentos_relevantes[0][0]
        
        # Respostas baseadas no documento mais relevante
        if "ceo" in pergunta_lower or "maria" in pergunta_lower:
            return "Baseado nos documentos: Maria Santos √© o CEO atual da TechCorp, que assumiu em 2023."
        elif "custa" in pergunta_lower or "pre√ßo" in pergunta_lower:
            return "Baseado nos documentos: AnalyticsPro custa R$ 299 por m√™s para empresas pequenas."
        elif "funcion√°rios" in pergunta_lower:
            return "Baseado nos documentos: A TechCorp tem 50 funcion√°rios."
        else:
            return f"Baseado nos documentos encontrados: {doc_mais_relevante}"
    else:
        return "N√£o encontrei informa√ß√µes relevantes nos documentos dispon√≠veis."

# Testando RAG
print("\n" + "=" * 50)
print("üöÄ RAG (com consulta a documentos):")
print("=" * 50)

for pergunta in perguntas_teste:
    resposta = rag_simples(pergunta, documentos_empresa)
    print(f"\n‚ùì Pergunta: {pergunta}")
    print(f"‚úÖ Resposta: {resposta}")
    print("ÔøΩÔøΩ Vantagem: Resposta baseada em documentos reais!")

### **Compara√ß√£o: Tradicional vs RAG**

Vamos ver a diferen√ßa lado a lado:

In [None]:
# ÔøΩÔøΩ COMPARA√á√ÉO: TRADICIONAL vs RAG

print("üìä COMPARA√á√ÉO: IA TRADICIONAL vs RAG")
print("=" * 60)

comparacao = {
    "Precis√£o": {"Tradicional": "‚ùå Pode alucinar", "RAG": "‚úÖ Baseado em fatos"},
    "Atualiza√ß√£o": {"Tradicional": "‚ùå Conhecimento fixo", "RAG": "‚úÖ Sempre atualizado"},
    "Confian√ßa": {"Tradicional": "‚ùå Incerta", "RAG": "‚úÖ Confi√°vel"},
    "Flexibilidade": {"Tradicional": "‚ùå Limitada", "RAG": "‚úÖ Ilimitada"}
}

for criterio, valores in comparacao.items():
    print(f"\nüéØ {criterio}:")
    print(f"   ü§ñ Tradicional: {valores['Tradicional']}")
    print(f"   ÔøΩÔøΩ RAG: {valores['RAG']}")

print("\n" + "=" * 60)
print("ÔøΩÔøΩ VENCEDOR: RAG!")
print("üí° RAG √© como ter um assistente que sempre consulta os documentos antes de responder!")

## **Aula 1.2: Setup do Ambiente - Preparando o Terreno**

---

### **T√°, mas como funciona o RAG por baixo dos panos?**

RAG √© como um **chef de cozinha** que junta ingredientes para criar um prato perfeito:

1. **üìö Documentos**: Os ingredientes (informa√ß√µes)
2. **ÔøΩÔøΩ Embeddings**: Como transformar ingredientes em "coordenadas"
3. **ÔøΩÔøΩÔ∏è Vector Store**: A despensa organizada
4. **üîç Retrieval**: Encontrar os ingredientes certos
5. **ü§ñ Generation**: Criar o prato final (resposta)

**üñºÔ∏è Sugest√£o de imagem**: Fluxograma do processo RAG

### **Setup Inicial - Preparando o Terreno**

Vamos configurar um RAG real usando LangChain:

In [None]:
# üîß CONFIGURANDO RAG REAL COM LANGCHAIN

# Carregando vari√°veis de ambiente
load_dotenv()

# Configurando LLM (usando o que estiver dispon√≠vel)
def get_llm():
    """Retorna o melhor LLM dispon√≠vel"""
    
    # Tentativa 1: Hugging Face (gratuito)
    try:
        token = os.getenv("HUGGINGFACEHUB_API_TOKEN")
        if token:
            return HuggingFaceHub(
                repo_id="google/flan-t5-base",
                model_kwargs={"temperature": 0.7, "max_length": 512}
            )
    except:
        pass
    
    # Tentativa 2: Modelo local simples
    try:
        from langchain_community.llms import FakeListLLM
        return FakeListLLM(responses=["Baseado nos documentos, posso responder sua pergunta."])
    except:
        pass
    
    return None

# Configurando embeddings
def get_embeddings():
    """Retorna modelo de embeddings"""
    try:
        return HuggingFaceEmbeddings(
            model_name="sentence-transformers/all-MiniLM-L6-v2",
            model_kwargs={'device': 'cpu'}
        )
    except Exception as e:
        print(f"‚ö†Ô∏è Erro ao carregar embeddings: {e}")
        return None

# Configurando componentes
print("üîß Configurando componentes RAG...")
llm = get_llm()
embeddings = get_embeddings()

if llm:
    print("‚úÖ LLM configurado!")
else:
    print("‚ö†Ô∏è LLM n√£o configurado (usando simula√ß√£o)")

if embeddings:
    print("‚úÖ Embeddings configurados!")
else:
    print("‚ö†Ô∏è Embeddings n√£o configurados (usando simula√ß√£o)")

### **Exemplo Pr√°tico - RAG Completo**

Agora vamos criar um RAG completo usando LangChain:

In [None]:
# ÔøΩÔøΩ RAG COMPLETO COM LANGCHAIN

def criar_rag_completo(documentos):
    """Cria um sistema RAG completo"""
    
    print("üîß Criando sistema RAG completo...")
    
    # Passo 1: Dividir documentos em chunks
    print("üìÑ Dividindo documentos em chunks...")
    text_splitter = RecursiveCharacterTextSplitter(
        chunk_size=100,
        chunk_overlap=20
    )
    
    chunks = text_splitter.create_documents(documentos)
    print(f"‚úÖ Criados {len(chunks)} chunks")
    
    # Passo 2: Criar vector store
    print("üóÑÔ∏è Criando vector store...")
    if embeddings:
        vectorstore = Chroma.from_documents(
            documents=chunks,
            embedding=embeddings,
            collection_name="empresa_docs"
        )
        print("‚úÖ Vector store criado com embeddings reais")
    else:
        # Fallback: vector store simples
        vectorstore = Chroma.from_texts(
            texts=documentos,
            collection_name="empresa_docs_simple"
        )
        print("‚úÖ Vector store criado (modo simples)")
    
    # Passo 3: Criar chain RAG
    print("üîó Criando chain RAG...")
    if llm:
        qa_chain = RetrievalQA.from_chain_type(
            llm=llm,
            chain_type="stuff",
            retriever=vectorstore.as_retriever(search_kwargs={"k": 3})
        )
        print("‚úÖ Chain RAG criada com LLM real")
    else:
        # Fallback: chain simples
        qa_chain = None
        print("‚ö†Ô∏è Chain RAG n√£o dispon√≠vel (LLM n√£o configurado)")
    
    return qa_chain, vectorstore

# Criando o sistema RAG
qa_chain, vectorstore = criar_rag_completo(documentos_empresa)

print("\nÔøΩÔøΩ Sistema RAG criado com sucesso!")

### **Teste R√°pido**

Vamos testar nosso sistema RAG:

In [None]:
# üß™ TESTE R√ÅPIDO DO SISTEMA RAG

def testar_rag_sistema(pergunta):
    """Testa o sistema RAG com uma pergunta"""
    
    print(f"\n‚ùì Pergunta: {pergunta}")
    
    # Teste 1: Busca simples no vector store
    print("üîç Buscando documentos relevantes...")
    docs_encontrados = vectorstore.similarity_search(pergunta, k=2)
    
    print("üìö Documentos encontrados:")
    for i, doc in enumerate(docs_encontrados, 1):
        print(f"  {i}. {doc.page_content}")
    
    # Teste 2: Resposta completa (se LLM dispon√≠vel)
    if qa_chain:
        print("\nü§ñ Gerando resposta com LLM...")
        try:
            resposta = qa_chain.run(pergunta)
            print(f"‚úÖ Resposta: {resposta}")
        except Exception as e:
            print(f"‚ö†Ô∏è Erro na gera√ß√£o: {e}")
    else:
        print("\nÔøΩÔøΩ Dica: Configure um LLM para respostas completas")

# Testando o sistema
perguntas_teste_rag = [
    "Quem √© o CEO da TechCorp?",
    "Qual √© o produto principal?",
    "Onde fica a empresa?"
]

print("ÔøΩÔøΩ TESTANDO SISTEMA RAG COMPLETO")
print("=" * 50)

for pergunta in perguntas_teste_rag:
    testar_rag_sistema(pergunta)
    print("\n" + "-" * 30)

### **Desafio do M√≥dulo**

Agora √© sua vez! Tente criar um sistema RAG para um tema que voc√™ conhece:

In [None]:
# üéØ DESAFIO DO M√ìDULO

# Crie sua pr√≥pria base de conhecimento
meus_documentos = [
    # Adicione aqui documentos sobre um tema que voc√™ conhece
    # Exemplo: sua empresa, hobby, √°rea de estudo, etc.
    "",
    "",
    ""
]

print("üéØ DESAFIO: Crie seu pr√≥prio sistema RAG!")
print("=" * 40)
print("1. Adicione documentos na lista 'meus_documentos'")
print("2. Execute o c√≥digo abaixo")
print("3. Teste com suas pr√≥prias perguntas")
print("=" * 40)

# Descomente e execute quando tiver seus documentos:
# meu_rag, meu_vectorstore = criar_rag_completo(meus_documentos)
# testar_rag_sistema("Sua pergunta aqui")

## **ÔøΩÔøΩ M√≥dulo 1 Conclu√≠do!**

### **‚úÖ O que aprendemos:**

1. **üìö O que √© RAG**: Sistema que consulta documentos antes de responder
2. **ÔøΩÔøΩ RAG vs Tradicional**: Por que RAG √© mais confi√°vel
3. **üîß Setup b√°sico**: Como configurar um RAG simples
4. **üß™ Teste pr√°tico**: Sistema funcionando de verdade

### **ÔøΩÔøΩ Pr√≥ximos Passos:**

No pr√≥ximo m√≥dulo vamos aprender sobre **Embeddings** - como transformar texto em n√∫meros que o computador entende!

### **üí° Dicas Importantes:**

- **RAG √© revolucion√°rio** porque resolve o problema das alucina√ß√µes
- **√â escal√°vel** - funciona com milhares de documentos
- **√â atualiz√°vel** - sempre responde com informa√ß√µes frescas
- **√â confi√°vel** - baseado em documentos reais

---

**üéØ Desafio do M√≥dulo**: Crie um RAG sobre um tema que voc√™ conhece!

**ÔøΩÔøΩ Dica do Pedro**: RAG √© como ter um assistente que nunca mente - sempre consulta os documentos antes de responder!

**üöÄ Pr√≥ximo m√≥dulo**: Embeddings - Como transformar texto em "coordenadas"!