# üìì 03 - Pipeline RAG b√°sico com FAISS + LLM (OpenAI API)

Neste notebook, vamos:
‚úÖ Recuperar contexto relevante usando busca vetorial (FAISS).  
‚úÖ Usar um LLM (via OpenAI API) para gerar uma resposta final.  
‚úÖ Simular um pipeline RAG simples e funcional!

---

## ‚öôÔ∏è Setup inicial

In [2]:
import os
from dotenv import load_dotenv
from sentence_transformers import SentenceTransformer
import faiss
from openai import OpenAI

load_dotenv()

# Inicializar cliente OpenAI
client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

  from .autonotebook import tqdm as notebook_tqdm


## üìù 1Ô∏è‚É£ Indexar alguns textos

In [3]:
texts = [
    "Retrieval-Augmented Generation (RAG) combina recupera√ß√£o de informa√ß√µes e gera√ß√£o de linguagem natural.",
    "O sol nasce no leste e se p√µe no oeste.",
    "Python √© uma linguagem de programa√ß√£o muito popular.",
    "Modelos de linguagem podem gerar respostas criativas.",
    "A IA est√° revolucionando diversos setores, como sa√∫de e finan√ßas."
]

model = SentenceTransformer("sentence-transformers/all-MiniLM-L6-v2")
embeddings = model.encode(texts, convert_to_numpy=True)
faiss.normalize_L2(embeddings)

dimension = embeddings.shape[1]
index = faiss.IndexFlatIP(dimension)
index.add(embeddings)

### üîé 2Ô∏è‚É£ Fun√ß√£o de recupera√ß√£o de contexto

In [4]:
def search_top_k(query, k=3):
    query_embedding = model.encode([query], convert_to_numpy=True)
    faiss.normalize_L2(query_embedding)
    distances, indices = index.search(query_embedding, k)
    
    retrieved_texts = [texts[idx] for idx in indices[0]]
    return retrieved_texts

### üîß 3Ô∏è‚É£ Fun√ß√£o para gerar resposta final usando OpenAI (RAG-like)

In [5]:
def generate_rag_response(query, retrieved_texts):
    contexto = "\n".join(retrieved_texts)
    prompt = f"""
Voc√™ √© um assistente que responde perguntas com base no contexto abaixo.
Contexto:
{contexto}

Pergunta: {query}
Resposta:
"""
    response = client.chat.completions.create(
        model="gpt-4o",
        messages=[
            {"role": "system", "content": "Voc√™ √© um assistente √∫til."},
            {"role": "user", "content": prompt}
        ]
    )
    return response.choices[0].message.content.strip()

### üöÄ 4Ô∏è‚É£ Teste do pipeline RAG

In [6]:
query = "Como a IA est√° mudando as ind√∫strias?"

# Recuperar contexto relevante
contexto = search_top_k(query, k=3)
print("üîπ Contexto recuperado:", contexto)

# Gerar resposta final
resposta = generate_rag_response(query, contexto)
print("\nüîπ Resposta final:")
print(resposta)

üîπ Contexto recuperado: ['A IA est√° revolucionando diversos setores, como sa√∫de e finan√ßas.', 'Python √© uma linguagem de programa√ß√£o muito popular.', 'Modelos de linguagem podem gerar respostas criativas.']

üîπ Resposta final:
A IA est√° transformando as ind√∫strias ao automatizar processos, aumentar a efici√™ncia e proporcionar insights avan√ßados a partir de grandes volumes de dados. No setor de sa√∫de, a IA est√° sendo utilizada para melhorar diagn√≥sticos, personalizar tratamentos e otimizar a gest√£o hospitalar. No campo das finan√ßas, est√° sendo usada para detectar fraudes, melhorar a an√°lise de risco e automatizar transa√ß√µes financeiras. Essa tecnologia est√° permitindo inova√ß√µes que antes eram consideradas imposs√≠veis, impulsionando mudan√ßas significativas na forma como essas ind√∫strias operam.
