# üîç **M√≥dulo 7: RAG - Retrieval Augmented Generation**

## **Aula 7.1: RAG B√°sico - IA que Sabe o que N√£o Sabe**

---

### **T√°, mas o que √© RAG?**

Imagina que voc√™ √© um **estudante muito inteligente** que est√° fazendo uma prova:

**Sem RAG**: Voc√™ s√≥ pode usar o que j√° sabe de cabe√ßa. Se n√£o souber, chuta ou inventa.
**Com RAG**: Voc√™ pode **consultar livros** antes de responder, garantindo que sua resposta seja precisa!

**RAG** = **Retrieval Augmented Generation**
- **Retrieval**: Busca informa√ß√µes relevantes
- **Augmented**: Aumenta o conhecimento da IA
- **Generation**: Gera respostas baseadas nas informa√ß√µes encontradas

### **Por que RAG √© Revolucion√°rio?**

**Problema tradicional**: IA s√≥ sabe o que foi treinada, n√£o pode acessar informa√ß√µes atualizadas
**Solu√ß√£o RAG**: IA busca informa√ß√µes relevantes e gera respostas precisas

√â como a diferen√ßa entre **um professor que s√≥ sabe o que estudou h√° 10 anos** vs **um professor que sempre consulta os livros mais recentes**! üìö

---

**üñºÔ∏è Sugest√£o de imagem**: Um diagrama mostrando IA consultando documentos antes de responder

### **Setup Inicial - Preparando o Terreno**

In [None]:
# Importando bibliotecas para RAG
import os
from dotenv import load_dotenv
from langchain_openai import ChatOpenAI
from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import Chroma
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.chains import RetrievalQA
from langchain.document_loaders import TextLoader

# Carregando vari√°veis
load_dotenv()

# Modelo
llm = ChatOpenAI(
    model="gpt-3.5-turbo",
    temperature=0.7,
    api_key=os.getenv('OPENAI_API_KEY')  # Configure sua API key no Colab
)

print("üîç Setup completo para RAG!")
print(f"ÔøΩÔøΩ Modelo: {llm.model_name}")

### **Criando Base de Conhecimento**

Vamos criar uma base de conhecimento sobre tecnologia para testar o RAG:

In [None]:
# Criando base de conhecimento sobre tecnologia
# Como criar uma biblioteca especializada

conhecimento_tech = """
PYTHON - LINGUAGEM DE PROGRAMA√á√ÉO

Python √© uma linguagem de programa√ß√£o de alto n√≠vel, interpretada e orientada a objetos.
Foi criada por Guido van Rossum e lan√ßada em 1991. Python √© conhecida por sua sintaxe
simples e leg√≠vel, sendo ideal para iniciantes em programa√ß√£o.

CARACTER√çSTICAS PRINCIPAIS:
- Sintaxe clara e leg√≠vel
- Grande biblioteca padr√£o
- Suporte a m√∫ltiplos paradigmas
- Comunidade ativa e extensa
- Ideal para IA e ci√™ncia de dados

APLICA√á√ïES:
- Desenvolvimento web (Django, Flask)
- Intelig√™ncia artificial (TensorFlow, PyTorch)
- Ci√™ncia de dados (Pandas, NumPy)
- Automa√ß√£o e scripts
- Jogos (Pygame)

JAVASCRIPT - LINGUAGEM WEB

JavaScript √© uma linguagem de programa√ß√£o interpretada, criada por Brendan Eich em 1995.
√â a linguagem principal para desenvolvimento web frontend, permitindo criar p√°ginas
interativas e din√¢micas.

CARACTER√çSTICAS:
- Linguagem de tipagem din√¢mica
- Executada no navegador
- Suporte a programa√ß√£o funcional
- Ecossistema rico (Node.js, React, Vue)

APLICA√á√ïES:
- Desenvolvimento frontend
- Aplica√ß√µes web (React, Angular, Vue)
- Backend (Node.js)
- Aplica√ß√µes m√≥veis (React Native)
- Jogos web

INTELIG√äNCIA ARTIFICIAL - CONCEITOS

Intelig√™ncia Artificial (IA) √© um campo da computa√ß√£o que busca criar sistemas
capazes de realizar tarefas que normalmente requerem intelig√™ncia humana.

TIPOS DE IA:
- IA Fraca (Narrow AI): Especializada em uma tarefa
- IA Forte (AGI): Intelig√™ncia geral como humanos
- Machine Learning: Aprendizado autom√°tico
- Deep Learning: Redes neurais profundas

APLICA√á√ïES PR√ÅTICAS:
- Assistentes virtuais (Siri, Alexa)
- Reconhecimento de imagem
- Processamento de linguagem natural
- Carros aut√¥nomos
- Recomenda√ß√£o de produtos

LANGCHAIN - FRAMEWORK DE IA

LangChain √© um framework para desenvolvimento de aplica√ß√µes de IA que permite
conectar diferentes modelos de linguagem e ferramentas de forma modular.

COMPONENTES PRINCIPAIS:
- Prompts: Templates para comunica√ß√£o com IA
- Chains: Sequ√™ncias de opera√ß√µes
- Memory: Armazenamento de contexto
- Agents: IA que pode usar ferramentas
- Document Loaders: Carregamento de documentos

CASOS DE USO:
- Chatbots inteligentes
- An√°lise de documentos
- Automa√ß√£o de tarefas
- Sistemas de recomenda√ß√£o
- Assistentes pessoais
"""

# Salvando a base de conhecimento
with open('base_conhecimento_tech.txt', 'w', encoding='utf-8') as file:
    file.write(conhecimento_tech)

print("üìö Base de conhecimento criada!")
print("ÔøΩÔøΩ Cont√©m informa√ß√µes sobre Python, JavaScript, IA e LangChain")

### **Criando Sistema RAG B√°sico**

Vamos criar um sistema RAG que pode consultar nossa base de conhecimento:

In [None]:
# Criando sistema RAG b√°sico
# Como criar um estudante que consulta livros

# Carregando e dividindo documentos
loader = TextLoader('base_conhecimento_tech.txt', encoding='utf-8')
documentos = loader.load()

# Dividindo em peda√ßos menores
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000,
    chunk_overlap=200
)
textos_divididos = text_splitter.split_documents(documentos)

print(f"üìÑ Documentos divididos em {len(textos_divididos)} peda√ßos")

# Criando embeddings e vector store
embeddings = OpenAIEmbeddings(
    openai_api_key=os.getenv('OPENAI_API_KEY')  # Configure sua API key no Colab
)

vectorstore = Chroma.from_documents(
    documents=textos_divididos,
    embedding=embeddings,
    collection_name="base_tech"
)

print("üß† Vector store criado com sucesso!")
print("üîç Base de conhecimento pronta para consulta")

In [None]:
# Criando chain RAG
# Como conectar busca com gera√ß√£o de respostas

rag_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",  # Tipo de chain para RAG
    retriever=vectorstore.as_retriever(
        search_kwargs={"k": 3}  # Busca os 3 documentos mais relevantes
    ),
    return_source_documents=True,  # Retorna os documentos usados
    verbose=True
)

print("üîó Chain RAG criada!")
print("ü§ñ IA pronta para consultar a base de conhecimento")

In [None]:
# Testando sistema RAG b√°sico
# Vamos ver a IA consultando a base de conhecimento!

print("ÔøΩÔøΩ TESTE: SISTEMA RAG B√ÅSICO")
print("=" * 50)

perguntas_teste = [
    "O que √© Python e para que serve?",
    "Quais s√£o as caracter√≠sticas do JavaScript?",
    "Como funciona a Intelig√™ncia Artificial?",
    "O que √© LangChain e quais s√£o seus componentes?",
    "Qual a diferen√ßa entre Python e JavaScript?"
]

for i, pergunta in enumerate(perguntas_teste, 1):
    print(f"\n‚ùì Pergunta {i}: {pergunta}")
    
    try:
        # Executando RAG
        resultado = rag_chain({"query": pergunta})
        
        print(f"ü§ñ Resposta: {resultado['result']}")
        print(f"ÔøΩÔøΩ Documentos consultados: {len(resultado['source_documents'])}")
        
        # Mostrando um dos documentos consultados
        if resultado['source_documents']:
            doc = resultado['source_documents'][0]
            print(f"üìñ Fonte: {doc.page_content[:100]}...")
        
    except Exception as e:
        print(f"‚ùå Erro: {e}")
    
    print("-" * 40)

## **Aula 7.2: RAG Avan√ßado - Otimizando as Respostas**

### **Compara√ß√£o: Com vs Sem RAG**

Vamos ver a diferen√ßa entre uma IA normal e uma IA com RAG:

In [None]:
# Teste: IA sem RAG vs IA com RAG
# Comparando respostas com e sem consulta √† base de conhecimento

print("ÔøΩÔøΩ COMPARA√á√ÉO: COM vs SEM RAG")
print("=" * 60)

pergunta_teste = "Quais s√£o as principais caracter√≠sticas do LangChain?"

print(f"‚ùì Pergunta: {pergunta_teste}")
print("=" * 60)

# Teste 1: IA sem RAG (s√≥ conhecimento interno)
print("\n‚ùå SEM RAG (IA sem consulta):")
try:
    resposta_sem_rag = llm.invoke([
        HumanMessage(content=pergunta_teste)
    ])
    print(f"ü§ñ Resposta: {resposta_sem_rag.content[:300]}...")
except Exception as e:
    print(f"‚ùå Erro: {e}")

print("\n" + "-" * 50)

# Teste 2: IA com RAG (consultando base de conhecimento)
print("\n‚úÖ COM RAG (IA consultando base):")
try:
    resultado_rag = rag_chain({"query": pergunta_teste})
    print(f"ü§ñ Resposta: {resultado_rag['result'][:300]}...")
    print(f"üìÑ Baseada em {len(resultado_rag['source_documents'])} documentos")
except Exception as e:
    print(f"‚ùå Erro: {e}")

print("\n" + "=" * 60)
print("üí° Diferen√ßa: RAG fornece respostas mais precisas e baseadas em dados espec√≠ficos!")

### **Sistema de Suporte T√©cnico com RAG**

Vamos criar um **sistema de suporte t√©cnico inteligente** que usa RAG:

In [None]:
# Criando sistema de suporte t√©cnico com RAG
# Como criar um suporte que sempre consulta a documenta√ß√£o

from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain

# Template para suporte t√©cnico
template_suporte = PromptTemplate(
    input_variables=["context", "question"],
    template="""
    Voc√™ √© um especialista em suporte t√©cnico muito atencioso.
    
    Use as seguintes informa√ß√µes da base de conhecimento para responder:
    {context}
    
    PERGUNTA DO CLIENTE: {question}
    
    INSTRU√á√ïES:
    - Responda de forma clara e did√°tica
    - Use as informa√ß√µes da base de conhecimento
    - Seja prestativo e atencioso
    - Use linguagem informal como o Pedro Guth
    - Se n√£o encontrar informa√ß√£o espec√≠fica, seja honesto
    """
)

# Chain de suporte
chain_suporte = LLMChain(
    llm=llm,
    prompt=template_suporte
)

print("üõ†Ô∏è  Sistema de suporte t√©cnico criado!")
print("üìö Sempre consulta a base de conhecimento")

In [None]:
# Fun√ß√£o para buscar contexto relevante
def buscar_contexto(pergunta, k=2):
    """Busca documentos relevantes para a pergunta"""
    try:
        docs = vectorstore.similarity_search(pergunta, k=k)
        contexto = "\n\n".join([doc.page_content for doc in docs])
        return contexto
    except Exception as e:
        return f"Erro na busca: {e}"

# Testando sistema de suporte
print("üõ†Ô∏è  TESTE: SISTEMA DE SUPORTE T√âCNICO")
print("=" * 60)

perguntas_suporte = [
    "Preciso aprender Python para trabalhar com IA. Por onde come√ßar?",
    "Qual a diferen√ßa entre JavaScript e Python?",
    "Como posso usar LangChain no meu projeto?",
    "O que √© machine learning e como se relaciona com IA?"
]

for i, pergunta in enumerate(perguntas_suporte, 1):
    print(f"\nüë§ Cliente {i}: {pergunta}")
    
    try:
        # Buscando contexto relevante
        contexto = buscar_contexto(pergunta)
        
        # Gerando resposta com contexto
        resposta = chain_suporte.run({
            "context": contexto,
            "question": pergunta
        })
        
        print(f"üõ†Ô∏è  Suporte: {resposta[:400]}...")
        
    except Exception as e:
        print(f"‚ùå Erro: {e}")
    
    print("-" * 40)

### **Chatbot com RAG - Sistema Completo**

Agora vamos criar um **chatbot completo** que combina RAG com memory:

In [None]:
# Criando chatbot com RAG e memory
# Como criar um assistente que lembra e consulta documentos

from langchain.memory import ConversationBufferMemory
from langchain.chains import ConversationalRetrievalChain

# Memory para o chatbot
memory = ConversationBufferMemory(
    memory_key="chat_history",
    return_messages=True
)

# Chatbot com RAG
chatbot_rag = ConversationalRetrievalChain.from_llm(
    llm=llm,
    retriever=vectorstore.as_retriever(search_kwargs={"k": 3}),
    memory=memory,
    return_source_documents=True,
    verbose=True
)

print("ü§ñ Chatbot com RAG criado!")
print("üß† Combina busca de documentos com memory de conversa")

In [None]:
# Testando chatbot com RAG
# Vamos ver o assistente em a√ß√£o!

print("ÔøΩÔøΩ TESTE: CHATBOT COM RAG")
print("=" * 50)

conversa = [
    "Ol√°! Sou desenvolvedor e quero aprender sobre IA.",
    "O que voc√™ pode me contar sobre Python?",
    "E como Python se relaciona com IA?",
    "Voc√™ lembra o que eu disse sobre mim?",
    "Pode me explicar o que √© LangChain?"
]

for i, mensagem in enumerate(conversa, 1):
    print(f"\nÔøΩÔøΩ Usu√°rio {i}: {mensagem}")
    
    try:
        # Executando chatbot
        resultado = chatbot_rag({"question": mensagem})
        
        print(f"ü§ñ Chatbot: {resultado['answer'][:300]}...")
        
        if resultado['source_documents']:
            print(f"üìÑ Consultou {len(resultado['source_documents'])} documentos")
        
    except Exception as e:
        print(f"‚ùå Erro: {e}")
    
    print("-" * 30)

### **Na Pr√°tica, Meu Consagrado!** üí™

**O que aprendemos sobre RAG:**

1. ‚úÖ **RAG B√°sico** - IA que consulta documentos antes de responder
2. ‚úÖ **Compara√ß√£o** - Com vs sem RAG (diferen√ßa brutal!)
3. ‚úÖ **Sistema de Suporte** - Suporte t√©cnico que sempre consulta documenta√ß√£o
4. ‚úÖ **Chatbot Completo** - Combina RAG com memory

### **Vantagens do RAG**

- **Precis√£o**: Respostas baseadas em dados espec√≠ficos
- **Atualiza√ß√£o**: Pode usar informa√ß√µes recentes
- **Transpar√™ncia**: Mostra as fontes consultadas
- **Flexibilidade**: Funciona com qualquer base de conhecimento

### **Compara√ß√£o: Com vs Sem LangChain**

**Sem LangChain**: Voc√™ teria que implementar RAG do zero
**Com LangChain**: Tudo pronto, s√≥ configurar!

**üñºÔ∏è Sugest√£o de imagem**: Um diagrama mostrando o fluxo RAG (pergunta ‚Üí busca ‚Üí contexto ‚Üí resposta)

**üéØ Pr√≥ximo m√≥dulo**: Vamos aprender sobre **Projetos Pr√°ticos** - como aplicar tudo que aprendemos!

**ÔøΩÔøΩ Resumo do M√≥dulo 7**:
- ‚úÖ RAG b√°sico e avan√ßado
- ‚úÖ Sistemas de suporte inteligente
- ‚úÖ Chatbots com base de conhecimento
- ‚úÖ Otimiza√ß√£o de respostas

**üîç Agora voc√™ sabe fazer IA que consulta documentos antes de responder!**