# 🔍 **Módulo 7: RAG - Retrieval Augmented Generation**

## **Aula 7.1: RAG Básico - IA que Sabe o que Não Sabe**

---

### **Tá, mas o que é RAG?**

Imagina que você é um **estudante muito inteligente** que está fazendo uma prova:

**Sem RAG**: Você só pode usar o que já sabe de cabeça. Se não souber, chuta ou inventa.
**Com RAG**: Você pode **consultar livros** antes de responder, garantindo que sua resposta seja precisa!

**RAG** = **Retrieval Augmented Generation**
- **Retrieval**: Busca informações relevantes
- **Augmented**: Aumenta o conhecimento da IA
- **Generation**: Gera respostas baseadas nas informações encontradas

### **Por que RAG é Revolucionário?**

**Problema tradicional**: IA só sabe o que foi treinada, não pode acessar informações atualizadas
**Solução RAG**: IA busca informações relevantes e gera respostas precisas

É como a diferença entre **um professor que só sabe o que estudou há 10 anos** vs **um professor que sempre consulta os livros mais recentes**! 📚

---

**🖼️ Sugestão de imagem**: Um diagrama mostrando IA consultando documentos antes de responder

### **Setup Inicial - Preparando o Terreno**

In [None]:
# Importando bibliotecas para RAG
import os
from dotenv import load_dotenv
from langchain_openai import ChatOpenAI
from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import Chroma
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.chains import RetrievalQA
from langchain.document_loaders import TextLoader

# Carregando variáveis
load_dotenv()

# Modelo
llm = ChatOpenAI(
    model="gpt-3.5-turbo",
    temperature=0.7,
    api_key=os.getenv('OPENAI_API_KEY')  # Configure sua API key no Colab
)

print("🔍 Setup completo para RAG!")
print(f"�� Modelo: {llm.model_name}")

### **Criando Base de Conhecimento**

Vamos criar uma base de conhecimento sobre tecnologia para testar o RAG:

In [None]:
# Criando base de conhecimento sobre tecnologia
# Como criar uma biblioteca especializada

conhecimento_tech = """
PYTHON - LINGUAGEM DE PROGRAMAÇÃO

Python é uma linguagem de programação de alto nível, interpretada e orientada a objetos.
Foi criada por Guido van Rossum e lançada em 1991. Python é conhecida por sua sintaxe
simples e legível, sendo ideal para iniciantes em programação.

CARACTERÍSTICAS PRINCIPAIS:
- Sintaxe clara e legível
- Grande biblioteca padrão
- Suporte a múltiplos paradigmas
- Comunidade ativa e extensa
- Ideal para IA e ciência de dados

APLICAÇÕES:
- Desenvolvimento web (Django, Flask)
- Inteligência artificial (TensorFlow, PyTorch)
- Ciência de dados (Pandas, NumPy)
- Automação e scripts
- Jogos (Pygame)

JAVASCRIPT - LINGUAGEM WEB

JavaScript é uma linguagem de programação interpretada, criada por Brendan Eich em 1995.
É a linguagem principal para desenvolvimento web frontend, permitindo criar páginas
interativas e dinâmicas.

CARACTERÍSTICAS:
- Linguagem de tipagem dinâmica
- Executada no navegador
- Suporte a programação funcional
- Ecossistema rico (Node.js, React, Vue)

APLICAÇÕES:
- Desenvolvimento frontend
- Aplicações web (React, Angular, Vue)
- Backend (Node.js)
- Aplicações móveis (React Native)
- Jogos web

INTELIGÊNCIA ARTIFICIAL - CONCEITOS

Inteligência Artificial (IA) é um campo da computação que busca criar sistemas
capazes de realizar tarefas que normalmente requerem inteligência humana.

TIPOS DE IA:
- IA Fraca (Narrow AI): Especializada em uma tarefa
- IA Forte (AGI): Inteligência geral como humanos
- Machine Learning: Aprendizado automático
- Deep Learning: Redes neurais profundas

APLICAÇÕES PRÁTICAS:
- Assistentes virtuais (Siri, Alexa)
- Reconhecimento de imagem
- Processamento de linguagem natural
- Carros autônomos
- Recomendação de produtos

LANGCHAIN - FRAMEWORK DE IA

LangChain é um framework para desenvolvimento de aplicações de IA que permite
conectar diferentes modelos de linguagem e ferramentas de forma modular.

COMPONENTES PRINCIPAIS:
- Prompts: Templates para comunicação com IA
- Chains: Sequências de operações
- Memory: Armazenamento de contexto
- Agents: IA que pode usar ferramentas
- Document Loaders: Carregamento de documentos

CASOS DE USO:
- Chatbots inteligentes
- Análise de documentos
- Automação de tarefas
- Sistemas de recomendação
- Assistentes pessoais
"""

# Salvando a base de conhecimento
with open('base_conhecimento_tech.txt', 'w', encoding='utf-8') as file:
    file.write(conhecimento_tech)

print("📚 Base de conhecimento criada!")
print("�� Contém informações sobre Python, JavaScript, IA e LangChain")

### **Criando Sistema RAG Básico**

Vamos criar um sistema RAG que pode consultar nossa base de conhecimento:

In [None]:
# Criando sistema RAG básico
# Como criar um estudante que consulta livros

# Carregando e dividindo documentos
loader = TextLoader('base_conhecimento_tech.txt', encoding='utf-8')
documentos = loader.load()

# Dividindo em pedaços menores
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000,
    chunk_overlap=200
)
textos_divididos = text_splitter.split_documents(documentos)

print(f"📄 Documentos divididos em {len(textos_divididos)} pedaços")

# Criando embeddings e vector store
embeddings = OpenAIEmbeddings(
    openai_api_key=os.getenv('OPENAI_API_KEY')  # Configure sua API key no Colab
)

vectorstore = Chroma.from_documents(
    documents=textos_divididos,
    embedding=embeddings,
    collection_name="base_tech"
)

print("🧠 Vector store criado com sucesso!")
print("🔍 Base de conhecimento pronta para consulta")

In [None]:
# Criando chain RAG
# Como conectar busca com geração de respostas

rag_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",  # Tipo de chain para RAG
    retriever=vectorstore.as_retriever(
        search_kwargs={"k": 3}  # Busca os 3 documentos mais relevantes
    ),
    return_source_documents=True,  # Retorna os documentos usados
    verbose=True
)

print("🔗 Chain RAG criada!")
print("🤖 IA pronta para consultar a base de conhecimento")

In [None]:
# Testando sistema RAG básico
# Vamos ver a IA consultando a base de conhecimento!

print("�� TESTE: SISTEMA RAG BÁSICO")
print("=" * 50)

perguntas_teste = [
    "O que é Python e para que serve?",
    "Quais são as características do JavaScript?",
    "Como funciona a Inteligência Artificial?",
    "O que é LangChain e quais são seus componentes?",
    "Qual a diferença entre Python e JavaScript?"
]

for i, pergunta in enumerate(perguntas_teste, 1):
    print(f"\n❓ Pergunta {i}: {pergunta}")
    
    try:
        # Executando RAG
        resultado = rag_chain({"query": pergunta})
        
        print(f"🤖 Resposta: {resultado['result']}")
        print(f"�� Documentos consultados: {len(resultado['source_documents'])}")
        
        # Mostrando um dos documentos consultados
        if resultado['source_documents']:
            doc = resultado['source_documents'][0]
            print(f"📖 Fonte: {doc.page_content[:100]}...")
        
    except Exception as e:
        print(f"❌ Erro: {e}")
    
    print("-" * 40)

## **Aula 7.2: RAG Avançado - Otimizando as Respostas**

### **Comparação: Com vs Sem RAG**

Vamos ver a diferença entre uma IA normal e uma IA com RAG:

In [None]:
# Teste: IA sem RAG vs IA com RAG
# Comparando respostas com e sem consulta à base de conhecimento

print("�� COMPARAÇÃO: COM vs SEM RAG")
print("=" * 60)

pergunta_teste = "Quais são as principais características do LangChain?"

print(f"❓ Pergunta: {pergunta_teste}")
print("=" * 60)

# Teste 1: IA sem RAG (só conhecimento interno)
print("\n❌ SEM RAG (IA sem consulta):")
try:
    resposta_sem_rag = llm.invoke([
        HumanMessage(content=pergunta_teste)
    ])
    print(f"🤖 Resposta: {resposta_sem_rag.content[:300]}...")
except Exception as e:
    print(f"❌ Erro: {e}")

print("\n" + "-" * 50)

# Teste 2: IA com RAG (consultando base de conhecimento)
print("\n✅ COM RAG (IA consultando base):")
try:
    resultado_rag = rag_chain({"query": pergunta_teste})
    print(f"🤖 Resposta: {resultado_rag['result'][:300]}...")
    print(f"📄 Baseada em {len(resultado_rag['source_documents'])} documentos")
except Exception as e:
    print(f"❌ Erro: {e}")

print("\n" + "=" * 60)
print("💡 Diferença: RAG fornece respostas mais precisas e baseadas em dados específicos!")

### **Sistema de Suporte Técnico com RAG**

Vamos criar um **sistema de suporte técnico inteligente** que usa RAG:

In [None]:
# Criando sistema de suporte técnico com RAG
# Como criar um suporte que sempre consulta a documentação

from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain

# Template para suporte técnico
template_suporte = PromptTemplate(
    input_variables=["context", "question"],
    template="""
    Você é um especialista em suporte técnico muito atencioso.
    
    Use as seguintes informações da base de conhecimento para responder:
    {context}
    
    PERGUNTA DO CLIENTE: {question}
    
    INSTRUÇÕES:
    - Responda de forma clara e didática
    - Use as informações da base de conhecimento
    - Seja prestativo e atencioso
    - Use linguagem informal como o Pedro Guth
    - Se não encontrar informação específica, seja honesto
    """
)

# Chain de suporte
chain_suporte = LLMChain(
    llm=llm,
    prompt=template_suporte
)

print("🛠️  Sistema de suporte técnico criado!")
print("📚 Sempre consulta a base de conhecimento")

In [None]:
# Função para buscar contexto relevante
def buscar_contexto(pergunta, k=2):
    """Busca documentos relevantes para a pergunta"""
    try:
        docs = vectorstore.similarity_search(pergunta, k=k)
        contexto = "\n\n".join([doc.page_content for doc in docs])
        return contexto
    except Exception as e:
        return f"Erro na busca: {e}"

# Testando sistema de suporte
print("🛠️  TESTE: SISTEMA DE SUPORTE TÉCNICO")
print("=" * 60)

perguntas_suporte = [
    "Preciso aprender Python para trabalhar com IA. Por onde começar?",
    "Qual a diferença entre JavaScript e Python?",
    "Como posso usar LangChain no meu projeto?",
    "O que é machine learning e como se relaciona com IA?"
]

for i, pergunta in enumerate(perguntas_suporte, 1):
    print(f"\n👤 Cliente {i}: {pergunta}")
    
    try:
        # Buscando contexto relevante
        contexto = buscar_contexto(pergunta)
        
        # Gerando resposta com contexto
        resposta = chain_suporte.run({
            "context": contexto,
            "question": pergunta
        })
        
        print(f"🛠️  Suporte: {resposta[:400]}...")
        
    except Exception as e:
        print(f"❌ Erro: {e}")
    
    print("-" * 40)

### **Chatbot com RAG - Sistema Completo**

Agora vamos criar um **chatbot completo** que combina RAG com memory:

In [None]:
# Criando chatbot com RAG e memory
# Como criar um assistente que lembra e consulta documentos

from langchain.memory import ConversationBufferMemory
from langchain.chains import ConversationalRetrievalChain

# Memory para o chatbot
memory = ConversationBufferMemory(
    memory_key="chat_history",
    return_messages=True
)

# Chatbot com RAG
chatbot_rag = ConversationalRetrievalChain.from_llm(
    llm=llm,
    retriever=vectorstore.as_retriever(search_kwargs={"k": 3}),
    memory=memory,
    return_source_documents=True,
    verbose=True
)

print("🤖 Chatbot com RAG criado!")
print("🧠 Combina busca de documentos com memory de conversa")

In [None]:
# Testando chatbot com RAG
# Vamos ver o assistente em ação!

print("�� TESTE: CHATBOT COM RAG")
print("=" * 50)

conversa = [
    "Olá! Sou desenvolvedor e quero aprender sobre IA.",
    "O que você pode me contar sobre Python?",
    "E como Python se relaciona com IA?",
    "Você lembra o que eu disse sobre mim?",
    "Pode me explicar o que é LangChain?"
]

for i, mensagem in enumerate(conversa, 1):
    print(f"\n�� Usuário {i}: {mensagem}")
    
    try:
        # Executando chatbot
        resultado = chatbot_rag({"question": mensagem})
        
        print(f"🤖 Chatbot: {resultado['answer'][:300]}...")
        
        if resultado['source_documents']:
            print(f"📄 Consultou {len(resultado['source_documents'])} documentos")
        
    except Exception as e:
        print(f"❌ Erro: {e}")
    
    print("-" * 30)

### **Na Prática, Meu Consagrado!** 💪

**O que aprendemos sobre RAG:**

1. ✅ **RAG Básico** - IA que consulta documentos antes de responder
2. ✅ **Comparação** - Com vs sem RAG (diferença brutal!)
3. ✅ **Sistema de Suporte** - Suporte técnico que sempre consulta documentação
4. ✅ **Chatbot Completo** - Combina RAG com memory

### **Vantagens do RAG**

- **Precisão**: Respostas baseadas em dados específicos
- **Atualização**: Pode usar informações recentes
- **Transparência**: Mostra as fontes consultadas
- **Flexibilidade**: Funciona com qualquer base de conhecimento

### **Comparação: Com vs Sem LangChain**

**Sem LangChain**: Você teria que implementar RAG do zero
**Com LangChain**: Tudo pronto, só configurar!

**🖼️ Sugestão de imagem**: Um diagrama mostrando o fluxo RAG (pergunta → busca → contexto → resposta)

**🎯 Próximo módulo**: Vamos aprender sobre **Projetos Práticos** - como aplicar tudo que aprendemos!

**�� Resumo do Módulo 7**:
- ✅ RAG básico e avançado
- ✅ Sistemas de suporte inteligente
- ✅ Chatbots com base de conhecimento
- ✅ Otimização de respostas

**🔍 Agora você sabe fazer IA que consulta documentos antes de responder!**