# üöÄ **Setup Gratuito para RAG no Google Colab**

> *Porque RAG n√£o precisa ser caro para ser poderoso*

---

## **üéØ O que vamos fazer aqui?**

Vamos configurar um ambiente **100% gratuito** para aprender RAG. Sem OpenAI pago, sem servidores caros - s√≥ o que funciona de gra√ßa!

**üñºÔ∏è Sugest√£o de imagem**: Um setup de laborat√≥rio com ferramentas gratuitas

### **T√°, mas por que RAG precisa de setup especial?**

RAG √© tipo montar uma **biblioteca digital inteligente**. Voc√™ precisa de:
- üìö **Ferramentas para ler documentos** (PDFs, websites, etc.)
- üß† **Modelos para entender texto** (embeddings)
- üóÑÔ∏è **Local para guardar informa√ß√µes** (vector stores)
- ü§ñ **IA para gerar respostas** (LLMs)

**Por que RAG √© importante?**

Imagine ter um assistente que **nunca mente** e sempre responde baseado em documentos reais. √â isso que o RAG faz!

---

## **üÜì Nossa Estrat√©gia Gratuita**

### **Op√ß√µes de LLM (em ordem de prefer√™ncia):**
1. **Hugging Face** (30.000 requisi√ß√µes/m√™s gr√°tis)
2. **OpenAI** (se voc√™ tiver API key)

### **Vector Stores Gratuitos:**
1. **Chroma** (local, super r√°pido)
2. **FAISS** (local, para datasets grandes)

### **Embeddings Gratuitos:**
1. **Sentence Transformers** (local, qualidade excelente)
2. **Hugging Face Embeddings** (online, 30k/m√™s gr√°tis)

---

## **üîß Passo 1: Instalando as Depend√™ncias**

Primeiro, vamos instalar todas as bibliotecas que precisamos. √â como montar uma caixa de ferramentas!

In [None]:
# üõ†Ô∏è INSTALANDO AS FERRAMENTAS DO RAG
# Execute esta c√©lula primeiro!

!pip install langchain>=0.1.0
!pip install langchain-community>=0.0.10
!pip install langchain-core>=0.1.0
!pip install langchain-openai>=0.0.5
!pip install python-dotenv>=1.0.0

# Embeddings e Vector Stores
!pip install sentence-transformers>=2.2.0
!pip install chromadb>=0.4.0
!pip install faiss-cpu>=1.7.0

# Document Loaders
!pip install pypdf>=3.15.0
!pip install python-docx>=0.8.11
!pip install beautifulsoup4>=4.12.0
!pip install requests>=2.31.0
!pip install youtube-transcript-api>=0.6.0
!pip install pandas>=2.0.0

# LLMs
!pip install huggingface_hub>=0.19.0
!pip install openai>=1.0.0
!pip install transformers>=4.30.0
!pip install torch>=2.0.0

# Deploy e Interface
!pip install streamlit>=1.28.0
!pip install gradio>=4.0.0
!pip install fastapi>=0.100.0
!pip install uvicorn>=0.23.0

# Utilit√°rios
!pip install numpy>=1.24.0
!pip install scikit-learn>=1.3.0
!pip install tiktoken>=0.5.0

print("‚úÖ Todas as depend√™ncias instaladas com sucesso!")

## **üîë Passo 2: Configurando as Chaves de API**

Agora vamos configurar as chaves de API. **N√£o se preocupe** - vamos usar op√ß√µes gratuitas!

In [None]:
# üîë CONFIGURANDO AS CHAVES DE API
import os
from dotenv import load_dotenv

# Carregando vari√°veis de ambiente (se existirem)
load_dotenv()

print("üîß Configurando ambiente RAG...")
print("üìã Verificando chaves de API dispon√≠veis...")

# Verificando OpenAI (opcional)
openai_key = os.getenv("OPENAI_API_KEY")
if openai_key:
    print("‚úÖ OpenAI API Key encontrada!")
else:
    print("‚ÑπÔ∏è OpenAI API Key n√£o encontrada (vamos usar Hugging Face)")

# Verificando Hugging Face (recomendado)
huggingface_token = os.getenv("HUGGINGFACEHUB_API_TOKEN")
if huggingface_token:
    print("‚úÖ Hugging Face Token encontrado!")
else:
    print("‚ÑπÔ∏è Hugging Face Token n√£o encontrado (vamos usar modelos locais)")

print("\nüéØ Estrat√©gia: Vamos usar modelos locais gratuitos!")
print("üí° Dica: Se quiser melhor qualidade, configure as chaves de API acima")

## **ü§ñ Passo 3: Configurando o LLM Gratuito**

Agora vamos configurar o LLM que vai gerar as respostas. Vamos usar o **melhor dispon√≠vel**!

In [None]:
# ü§ñ CONFIGURANDO O LLM GRATUITO
def get_llm_colab():
    """Retorna o melhor LLM dispon√≠vel no Colab"""
    
    # Tentativa 1: OpenAI (se tiver chave)
    try:
        from langchain_openai import ChatOpenAI
        api_key = os.getenv("OPENAI_API_KEY")
        if api_key:
            print("üöÄ Usando OpenAI GPT-3.5-turbo")
            return ChatOpenAI(
                model="gpt-3.5-turbo",
                temperature=0.7,
                api_key=api_key
            )
    except Exception as e:
        print(f"‚ÑπÔ∏è OpenAI n√£o dispon√≠vel: {e}")
    
    # Tentativa 2: Hugging Face (gratuito)
    try:
        from langchain_community.llms import HuggingFaceHub
        token = os.getenv("HUGGINGFACEHUB_API_TOKEN")
        if token:
            print("üöÄ Usando Hugging Face Hub (gratuito)")
            return HuggingFaceHub(
                repo_id="google/flan-t5-base",
                model_kwargs={"temperature": 0.7, "max_length": 512}
            )
    except Exception as e:
        print(f"‚ÑπÔ∏è Hugging Face Hub n√£o dispon√≠vel: {e}")
    
    # Tentativa 3: Modelo local (sempre funciona)
    try:
        from langchain_community.llms import HuggingFacePipeline
        from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM
        
        print("üöÄ Usando modelo local (gratuito e r√°pido)")
        
        # Modelo pequeno e r√°pido para demonstra√ß√£o
        model_name = "microsoft/DialoGPT-small"
        tokenizer = AutoTokenizer.from_pretrained(model_name)
        model = AutoModelForCausalLM.from_pretrained(model_name)
        
        # Criando o pipeline
        pipe = pipeline(
            "text-generation",
            model=model,
            tokenizer=tokenizer,
            max_length=100,
            temperature=0.7,
            do_sample=True
        )
        
        return HuggingFacePipeline(pipeline=pipe)
        
    except Exception as e:
        print(f"‚ùå Erro ao carregar modelo local: {e}")
        return None

# Configurando o LLM
print("üîß Configurando LLM...")
llm = get_llm_colab()

if llm:
    print("‚úÖ LLM configurado com sucesso!")
    
    # Teste r√°pido
    try:
        print("\nüß™ Teste r√°pido do LLM:")
        response = llm.invoke("Diga 'Ol√°, RAG est√° funcionando!'")
        print(f"Resposta: {response}")
    except Exception as e:
        print(f"‚ö†Ô∏è Teste falhou (normal para alguns modelos): {e}")
else:
    print("‚ùå N√£o foi poss√≠vel configurar o LLM")
    print("üí° Configure uma chave de API ou use o modelo local")

## **üß† Passo 4: Configurando Embeddings Gratuitos**

Agora vamos configurar os embeddings - que s√£o como "tradutores" que transformam texto em n√∫meros que o computador entende.

In [None]:
# üß† CONFIGURANDO EMBEDDINGS GRATUITOS
def get_embeddings_colab():
    """Retorna o melhor modelo de embeddings dispon√≠vel"""
    
    # Op√ß√£o 1: Sentence Transformers (local, excelente qualidade)
    try:
        from langchain_community.embeddings import HuggingFaceEmbeddings
        
        print("üöÄ Usando Sentence Transformers (local e gratuito)")
        
        # Modelo pequeno e r√°pido para demonstra√ß√£o
        embeddings = HuggingFaceEmbeddings(
            model_name="sentence-transformers/all-MiniLM-L6-v2",
            model_kwargs={'device': 'cpu'}
        )
        
        return embeddings
        
    except Exception as e:
        print(f"‚ùå Erro ao carregar Sentence Transformers: {e}")
        return None

# Configurando embeddings
print("üîß Configurando embeddings...")
embeddings = get_embeddings_colab()

if embeddings:
    print("‚úÖ Embeddings configurados com sucesso!")
    
    # Teste r√°pido
    try:
        print("\nüß™ Teste r√°pido dos embeddings:")
        texts = ["Ol√° mundo", "Hello world", "Gato preto"]
        vectors = embeddings.embed_documents(texts)
        print(f"‚úÖ Gerados {len(vectors)} embeddings de {len(texts)} textos")
        print(f"üìè Dimens√£o de cada embedding: {len(vectors[0])}")
    except Exception as e:
        print(f"‚ö†Ô∏è Teste falhou: {e}")
else:
    print("‚ùå N√£o foi poss√≠vel configurar embeddings")
    print("üí° Verifique se as depend√™ncias foram instaladas corretamente")

## **üóÑÔ∏è Passo 5: Configurando Vector Store Gratuito**

Agora vamos configurar onde vamos guardar as informa√ß√µes. Vamos usar o **Chroma** - que √© local e super r√°pido!

In [None]:
# üóÑÔ∏è CONFIGURANDO VECTOR STORE GRATUITO
def setup_vector_store():
    """Configura o vector store para armazenar embeddings"""
    
    try:
        from langchain_community.vectorstores import Chroma
        
        print("üöÄ Configurando Chroma (vector store local e gratuito)")
        
        # Criando um vector store tempor√°rio para teste
        texts = [
            "RAG √© uma t√©cnica de IA que combina busca e gera√ß√£o",
            "Embeddings s√£o representa√ß√µes num√©ricas de texto",
            "Vector stores armazenam embeddings para busca r√°pida",
            "LangChain √© um framework para construir aplica√ß√µes de IA"
        ]
        
        # Criando o vector store
        vectorstore = Chroma.from_texts(
            texts=texts,
            embedding=embeddings,
            collection_name="test_collection"
        )
        
        print("‚úÖ Vector store configurado com sucesso!")
        
        # Teste de busca
        print("\nüß™ Teste de busca no vector store:")
        query = "O que √© RAG?"
        results = vectorstore.similarity_search(query, k=2)
        
        print(f"üîç Busca por: '{query}'")
        for i, doc in enumerate(results, 1):
            print(f"  {i}. {doc.page_content}")
        
        return vectorstore
        
    except Exception as e:
        print(f"‚ùå Erro ao configurar vector store: {e}")
        return None

# Configurando vector store
print("üîß Configurando vector store...")
vectorstore = setup_vector_store()

if vectorstore:
    print("\nüéâ Vector store funcionando perfeitamente!")
else:
    print("‚ùå N√£o foi poss√≠vel configurar vector store")

## **üéØ Passo 6: Teste Completo do Sistema**

Agora vamos fazer um teste completo para ver se tudo est√° funcionando!

In [None]:
# üéØ TESTE COMPLETO DO SISTEMA RAG
def test_rag_system():
    """Testa se o sistema RAG est√° funcionando"""
    
    print("üß™ Iniciando teste completo do sistema RAG...")
    
    # Verificando componentes
    checks = {
        "LLM": llm is not None,
        "Embeddings": embeddings is not None,
        "Vector Store": vectorstore is not None
    }
    
    print("\nüìã Status dos componentes:")
    for component, status in checks.items():
        status_icon = "‚úÖ" if status else "‚ùå"
        print(f"  {status_icon} {component}")
    
    # Se tudo estiver OK, fazer teste de RAG simples
    if all(checks.values()):
        print("\nüöÄ Todos os componentes OK! Fazendo teste de RAG...")
        
        try:
            # Buscando documentos relevantes
            query = "Explique o que √© RAG"
            docs = vectorstore.similarity_search(query, k=2)
            
            # Criando contexto
            context = "\n".join([doc.page_content for doc in docs])
            
            # Gerando resposta
            prompt = f"""
            Com base no contexto abaixo, responda √† pergunta:
            
            Contexto:
            {context}
            
            Pergunta: {query}
            
            Resposta:
            """
            
            response = llm.invoke(prompt)
            
            print(f"\nüîç Pergunta: {query}")
            print(f"üìö Contexto encontrado: {len(docs)} documentos")
            print(f"ü§ñ Resposta: {response}")
            
            print("\nüéâ SISTEMA RAG FUNCIONANDO PERFEITAMENTE!")
            
        except Exception as e:
            print(f"‚ö†Ô∏è Teste de RAG falhou: {e}")
            print("üí° Isso √© normal se o LLM n√£o estiver configurado perfeitamente")
    else:
        print("\n‚ùå Alguns componentes n√£o est√£o funcionando")
        print("üí° Verifique as configura√ß√µes acima")

# Executando teste
test_rag_system()

## **üéâ Setup Conclu√≠do!**

### **‚úÖ O que conseguimos configurar:**

1. **üì¶ Depend√™ncias**: Todas as bibliotecas necess√°rias
2. **üîë APIs**: Configura√ß√£o para op√ß√µes gratuitas
3. **ü§ñ LLM**: Modelo de linguagem para gerar respostas
4. **üß† Embeddings**: Transforma√ß√£o de texto em n√∫meros
5. **üóÑÔ∏è Vector Store**: Armazenamento inteligente de informa√ß√µes
6. **üß™ Teste**: Sistema RAG funcionando

### **üöÄ Pr√≥ximos Passos:**

Agora voc√™ pode:
1. **Ir para o M√≥dulo 1**: Introdu√ß√£o ao RAG
2. **Aprender embeddings**: Como transformar texto em n√∫meros
3. **Explorar vector stores**: Onde guardar informa√ß√µes
4. **Construir projetos**: Sistemas RAG completos

### **üí° Dicas Importantes:**

- **Este setup √© 100% gratuito** - n√£o precisa de dinheiro!
- **Funciona offline** - n√£o depende de APIs externas
- **√â escal√°vel** - pode crescer conforme necess√°rio
- **√â profissional** - usado em empresas reais

---

**üéØ Desafio do Setup**: Tente fazer uma pergunta diferente no teste de RAG acima!

**üí° Dica do Pedro**: Se algo n√£o funcionar, n√£o se preocupe! RAG √© como cozinhar - √†s vezes precisa ajustar o tempero.

**üöÄ Pr√≥ximo m√≥dulo**: Introdu√ß√£o ao RAG - O que √© e por que √© revolucion√°rio!